化石燃料塑料的替代品:生物基聚合物

bio-based-polymers-hero-image

随着全球近 10% 的化石燃料用于塑料生产,找到一种替代化石燃料塑料的可行方案一直是过去 20 年来的关键目标。 从可再生生物质资源中获得生物基聚合物作为理想的替代品受到了广泛关注。 这些聚合物已被用于制造生物塑料,是一种前途无量的可持续油基塑料替代品,甚至可能会使严重依赖外国石油的国家受益。

ChemRxiv 的这篇期刊手稿详细介绍了三种生物基聚合物、它们的优缺点、最新研究进展以及该研究领域的发展趋势。 由于生物塑料经常受到公众质疑,可能是因为错误信息,本文旨在澄清这些困惑,并提高人们对生物基聚合物对可持续发展重要性的认识。

预测新化学:高质量训练数据对提高预测反应精准度的影响

Predicting New Chemistry White Paper thumbnail

尽管许多机器学习计划的投资不断增加,但却因数据集多样性有限而失败。特别是在某些很少有人涉足的化学领域,其预测的准确性和多样性通常会降低。 通过比较不同的数据集对训练模型的影响,我们可以对合成路线模型的预期覆盖范围和新颖性做出更有力的判断,并设计数据集以探索先前很难进行研究的科学领域。

在这项研究中,拜耳公司的科学家利用美国化学文摘社 (CAS) 人工标引的数据集来提高他们对合成路线模型的预测能力。 对罕见反应类型的预测准确率显著提高了 32%。这一能力的提升将带来对化学全新的认识。

《预测新化学》白皮书封面

获取 CAS 洞察报告或联系我们的客户服务团队,设计数据集,以帮助开拓难以攻克的科学领域。

这份 CAS 洞察报告由美国化学文摘社 (CAS) 与拜耳公司的科学家共同推出。

作者:

  • Miriam Wollenhaupt 博士, 拜耳公司计算化学家
  • Martín Villalba 博士, 拜耳公司应用数学专家
  • Orr Ravitz 博士, CAS 合成路线设计解决方案

生物正交化学:科学和医学应用综述

CAS Science Team

Hero image bioorthogonal chemistry white paper

本 CAS 白皮书提供了对这个新兴科学领域的独到见解,介绍了 CAS 内容合集™ 中不同类型的生物正交反应、应用以及趋势。 通过生物正交化学,我们能够更深入地了解生物系统的结构和功能,以及未来如何优化药物开发、递送和成像应用。

《生物正交化学》白皮书封面

生物基聚合物:传统塑料的环保替代品

CAS Science Team

bio-based polymers white paper thumbnail

全世界超过 90% 的塑料生产需要化石燃料参与。与传统塑料相比,由可再生能源生产的生物基聚合物具有极大优势 —— 减少二氧化碳排放、提高生物降解能力和降低对化石燃料的依赖性。 从我们对这一新兴研究领域的概览中了解更多信息

《生物基聚合物》白皮书封面图

解决全球专利制度的可持续性问题:人工智能在提高生产力中的作用

CAS Science Team

Global Patent System Sustainability white paper thumbnail image

专利申请数量的迅速增长和复杂性的急速上升,使全球专利体系的可持续性面临压力。 在专利申请量增长最快的国家,由此产生的能力差距会导致专利审查延迟,在某些情况下甚至会延迟数年,这就使得专利质量面临风险,并有可能会减缓创新和投资的步伐。

本白皮书探讨了专利局在努力确保可持续性和未来发展时面临的挑战和机遇,重点介绍应用人工智能工作流程解决方案以提高生产力。 本文包括从 CAS 与巴西国家工业产权局 (INPI) 的合作中得到的见解和经验,此次合作旨在解决其申请积压问题并提高审查工作流程效率,从而显著改善运营:

  • 可消减多达 50% 的专利审查时间;
  • 77% 的全国受理申请所需审查员检索时间减少;
  • 29% 的全国受理申请需要极少或不需要审查员的额外检索;
  • 无需增加人员即可有效管理工作量
  • 审查员可以腾出时间专注于其他优先事项
  • 生产力的提高使办公室的积压工作减少了 80%

《专利系统的可持续性》白皮书封面

重新应对平衡:探索二氧化碳封存的研究趋势

CAS Science Team

smokestacks with emissions and importance of carbon capture

随着到 2050 年实现二氧化碳“净零排放”目标的广泛宣传 —— 科学界对气候变化中的碳捕捉、碳储存和碳还原产生了浓厚的兴趣,这对子孙后辈具有十分重大的意义。 从我们对这一新兴研究领域的概览中了解更多信息,其中包含独特见解以及对未来机遇的展望。

《碳捕获》白皮书封面图

分子胶如何将靶向蛋白质降解与临床联系起来

molecular-glues-hero-image

靶向蛋白质降解是一种快速扩展的新型药物发现策略。 这是一种利用致病蛋白攻击严重疾病的新方法,有可能用于更严重的疾病,如癌症或神经退行性疾病。

美国化学会的该项研究利用了 CAS 内容合集和关于蛋白质降解剂的最新研究,为分子胶这一新药发现工具提供了更细致的见解。 分析了分子胶的优缺点,为进一步研究提供参考。

探索化学领域机器学习:趋势和机遇

Zach Baum , Information Scientist, CAS

machine learning hero image

在过去的 20 年里,人工智能 (AI) 的进步(特别是机器学习)已经改变了我们进行科学研究的方式。 从绘制基因组序列图谱和发现新抗生素,到模拟气候变化对地球的影响,甚至在寻找其他类地行星的过程中绘制银河系地图,人工智能正在改变众多学科的研究方式。

化学是在人工智能应用方面取得巨大飞跃的科学领域之一。 CAS(美国化学文摘社)最近发布了白皮书《化学中的人工智能:现状和未来机遇》在该白皮书中,我们利用 CAS 的独有技术提供文献和专利全景,探索了人工智能和化学之间的关联。 在该白皮书中,我们利用 CAS 的独有技术提供文献和专利全景,探索了人工智能和化学之间的关联。

人工智能促进了哪些化学领域的发展?

涉及人工智能的化学出版物和专利数量呈爆炸式增长,从 2015 年到 2020 年期间增长了 6 倍。 我们已经确定了对人工智能相关出版物和专利做出贡献的主要学科,并对它们进行了比较,以了解哪些领域正在利用这一新兴技术。 应用人工智能的领先学科包括分析化学、生物化学、工业化学和化学工程,而有机会应用人工智能的领域则包括天然产物和有机化学(图 1)。

显示应用了机器学习的化学分支学科的图片(有多张图表)
图 1:各学科中人工智能相关出版物所占最高比例

我们研究了 2000 年至 2020 年之间的出版物和专利之间的关联,来了解人工智能是如何帮助研究人员解决问题的(图 2)。 例如,从 21 世纪初到 2014 年,人工智能出版物和专利的重点从研究人类疾病的诊断转向了遗传算法以及将这些算法应用于药物发现和 microRNA。

最近,随着需要解决的问题类型发生了变化,出版物和专利更多地转向了 DNA 甲基化和癌症。 最新的重点则转向了与 COVID-19 相关的药物发现。

显示 2000 年到 2020 年 AI 相关化学期刊出版物中同期概念演变的时间线
图 2:2000-2020 年人工智能相关化学期刊出版物中共现概念的演变

不出所料的是,我们的研究还发现小分子是人工智能出版物和专利分析的最大焦点。 这些焦点主题包括药物发现、逆合成和反应优化,反映出了制药公司通常投资较多的领域。

在化学领域中应用机器学习技术的机遇在哪里?

在我们对 7 万多份出版物的分析中,我们研究了跨学科的贡献,标注了主要和次要学科(图 3)。 这让我们能够将每个学科的贡献绘制到一张热图上,在热图上,颜色的强度反映了每个学科的贡献强度。 我们可以一目了然地看到应用人工智能的领先化学研究领域以及具有潜力但尚未应用人工智能的领域。

显示一级学科和二级学科研究中 AI 应用程度的热度图
图 3:期刊文章中发表的跨学科研究的相关性(列代表主要研究领域,行代表次要研究领域,每个正方形代表主要和次要研究领域的跨学科交叉领域)

例如,多学科出版物在分析化学和生物化学中更为常见,机器学习算法被用于改进对蛋白质、多肽、脂类和核酸的分析,以及预测化学反应甚至发现新分子。 人工智能也被广泛应用于材料科学和物理化学,来预测功能材料、结构-性能关系和化学工艺优化。

在化学领域中应用人工智能的障碍

在我们的网络研讨会“化学中的人工智能:当前趋势和未来机遇”上,专家们讨论了应用人工智能的潜在障碍。 他们指出了在化学领域采用人工智能的三个主要障碍:

数据质量:最优的预测,依赖于为训练预测模型提供正例和反例的稳定的、高质量的数据集。 对众多机构而言,如何获得数据、标准化数据和准备数据是重大挑战。

技术:虽然算力(基于量子和云的方法)正在改进,但从用户的角度来看,仍然存在局限性。 然而,当今软件和用户界面的进步消除了编程的要求,使更多的科学家在他们的研究中能够利用机器学习。

人才短缺:数据科学的人才短缺是有目共睹的,化学家们可能不明白今天的人工智能是多么容易利用。 加强化学和其他科学学科之间的合作可能有助于加速人工智能与其他领域的整合。

机器学习在化学领域的发展机会

人工智能和训练数据集正被世界各地的科学机构用于解决问题和创新,为数据分析和药物发现提供了重要机会。

我们最近的白皮书揭示了可从 AI 技术投资中受益的几个化学领域。 如今,克服 AI 应用所面临的阻碍已变得前所未有的简单,CAS 等合作伙伴可以帮助获取大型优质数据集以进行分析。 通过在科学研究中应用 AI,可以帮助解决一些极其紧迫的问题,并在传统数据分析方面取得巨大进展。

如果您对 AI 技术如何为研究提供支持有任何疑问,请阅读我们的白皮书以详细了解我们的分析和见解,或者联系 CAS。

 

AI 已成为提升专利局效率、加速处理专利申请的有效手段

Kathy Van der Herten , Director Product Management/CAS

artificial intelligence in patent workflow solutions

专利申请数量的迅速增长和复杂性的急速上升,使全球专利体系的可持续性面临压力。 在那些专利申请数量增长最快的国家中,审查能力缺口会导致专利申请处理延迟、专利质量面临风险、客户满意度降低,以及创新和投资步伐减缓。

近年专利申请量趋势图
图 1:过去十年的专利申请数量及趋势


提高专利申请处理的及时性和专利审查质量

减少专利申请处理延迟,是各专利局在寻求提高客户满意度和促进创新的过程中的共同优先目标。 专利申请处理延迟给发明人带来法律上的不确定性,使他们对投资心存顾虑。 巴西最著名的专利律师之一、Gusmao & Labrunie 的合作人 Juliano Ryota Murakami 强调了知识产权利益相关者所面临的风险:

“专利审查的过度延迟会损害一个国家的创新和经济发展。 使对其发明寻求法律保护的公司丧失信心,因为当专利最终被授权时,受保护的技术可能已完全过时。 专利审查的过度延迟还会使专利再生产的排他性和发明的潜在商业化产生不确定性。”

确保专利申请处理的及时性和专利审查质量的重担主要落在专利审查员肩上——依赖于审查员快速找到现有技术以加快审查的能力。 然而,先有技术的检索非常耗时,需要复杂的检索策略和深厚的主题专业知识。然而,现有技术检索非常耗时,需要复杂的检索策略和精深的专业知识。

根据欧洲专利局 (EPO) 对其工作人员检索活动的分析显示,一个全面的专利申请检索利用了 179 个数据库中的 13 亿项技术记录,这导致每月出现在检索结果中的文件量约为 6 亿份。 不出所料,日本专利局的一项研究估计,审查员们花费了大约 40% 的时间进行现有技术检索和审阅检索结果。 如果审查员缺乏时间、专业知识或轻松获取现有技术的技术资源,那么专利质量就会受到影响。

AI 赋能的检索解决方案,在提高整个专利生态系统的效率和专利审查质量方面能够发挥重要作用。 AI 赋能的检索解决方案可以帮助专利局更快地进行专利审查,并使创新者能够尽早地发现现有技术,避免在不良专利的申请或有效性质疑上浪费时间和金钱。 这是我们将 AI 现有技术算法添加至 CAS SciFinder Discovery PlatformSTNext® 解决方案中的原因,用以改进科学和知识产权信息检索。

新方法支持专利局业务可持续性

各专利局正在通过采取能够确保长期业务可持续性的措施,来解决专利申请处理延迟和效率低下的问题。 欧洲专利局 (EPO) 就员工敬业、数字化转型、有效的专利授权流程和高影响力的国际合作制定了可持续发展目标。 其他专利局也在为提高其效率制定类似的优先目标。

为了提供更快、更高质量的专利审查,各专利局正雇佣更多的专利审查员,部署 AI 等节省时间的技术,并革新工作流程:

  • 美国专利商标局 (USPTO) 依据其优化专利质量和审查及时性的战略计划,于 2021 年聘请了数百名审查员来应对不断增长的工作量。 USPTO 同时也在扩大AI在专利分类和检索方面的应用,使审查员们能够更容易地获取现有技术。
  • 英国知识产权局 (UK Intellectual Property Office) 基于早先对 2021 年专利申请数量呈两位数增长的预期,在前一年将审查人员人数增加了一倍。 其制定的实现精简和现代化流程的5年计划旨在提升至少 3.5% 的核心业务成本的效率。 在加大对服务交付投入的同时,其还在评估如何充分利用 AI 技术。
  • EPO 在一项名为“Master the Prior Art”的重要举措中,正在改进专利分类程序,以提高检索的准确性,并在审查中更早地获取相关文件。 EPO 正在系统地应用人工智能、机器学习和其他技术,以创建一个更高效的端到端的数字化专利授予程序。

AI 赋能的解决方案可以被专利局用于现有技术检索之外的诸多职能,包括: 专利分类的和转换、用于更高效传递文档的 API 中、用于审阅和分析的在线工具等。 通过提高效率、专利质量和客户服务,这些解决方案会产生乘数效应,帮助专利局实现业务可持续性和全球创新的战略目标。

AI 技术和工作流程革新有望减少专利申请延迟

CAS 最近与巴西国家工业产权局 (INPI) 合作完成了一个项目,该项目通过整合人工标引的数据、人工智能技术、定制化工作流程和外包的 IP 检索服务,简化了巴西 INPI 现有技术检索流程。 该项目带来了显著的效益:

  • 可消减多达 50% 的专利审查时间;
  • 77% 的全国受理申请所需审查员检索时间减少;
  • 29% 的全国受理申请需要极少或不需要审查员的额外检索;
  • 生产力的提高使专利局积压的工作减少了 80% 之多。

在现有技术检索中优化 AI 的经验

AI 因其可快速分析数百万个数据集并提供相关结果的能力,而越来越受到各专利局的关注。 世界知识产权组织 (WIPO) 称,目前有 27 家专利局正在进行 70 多个 AI 相关的项目,其中 19 家专利局专注于现有技术检索和审查流程。

CAS 与巴西 INPI 的合作强化了优化 AI 在现有技术检索中应用的几个基本原则:

  • 干净、结构化的数据显著提高了预测的准确性;
  • 需要多种算法来返回相关性最高的相似检索结果;
  • 利用人类专业知识增强的AI技术能够改善结果。

数据质量:大多数公开可得的未经人工标引的科学和专利数据给各专利局带来了固有挑战。 这些挑战通常包括:转录错误、单位标记错误和过于复杂的专利语言。 非本国语言也带来了特殊的挑战。

以结构化格式规范化、预处理并建立关联的人工标引的数据能够改进 AI 算法的训练,并提升现有技术检索能力。 人工标引的数据能够揭示出更多相似专利,并识别可能会引起显著关注的相近专利。

多种算法:使用针对特定检索方法定制的多种算法能够提高AI的表现能力。 在巴西 INPI,我们开发了 10 种算法来提供第一轮检索结果。 再利用另一种集成学习算法对第一轮检索结果进行分析,产生一组高度相关且按相关性排序的最终结果集。

工作流程优化:CAS 为巴西 INPI 提供的定制化工作流程解决方案将现有技术检索步骤减少了一半。 CAS 解决方案还可通过一站式云界面提供专利和非专利的检索结果及用于排序、过滤和可视化的工具,来节省时间。 定制化工作流程可以是完全自动化的,也可以利用专利局外部的检索专家来验证算法模型和筛选检索,以增强审查员的审查能力。

有兴趣详细了解专利局中的 AI 工作流程方法以及预测技术如何帮助确保整个知识产权生态系统的可持续性吗? 阅读我们的 CAS 洞察报告“解决全球专利制度的可持续性问题:人工智能在提高生产力中的作用

新冠病毒如何利用我们的蛋白质入侵人体细胞?

Roger Granet , Information Scientist, CAS

Viral spike-protein structure depiction

在研究新冠病毒肺炎 (COVID-19) 疗法的过程中,关键是要清楚地了解这种病毒究竟如何入侵细胞, 这将促进以阻断该通路为治疗重点的靶向抗病毒疗法的开发。

2002 年,非典型性肺炎病毒 (SARS-CoV) 引发流行性传染病,而与该病毒相关的 SARS-CoV-2 病毒引发了如今的 COVID-19。对 SARS-CoV 和 SARS-CoV-2 病毒的研究显示:在这两个案例中,病毒膜上会伸出一种棘突 (S) 蛋白,与人体细胞表面的至少一种蛋白质——血管紧张素转换酶 2 (ACE2) 相结合。 继而,蛋白酶(一种将其他蛋白质夹闭成碎片的人体酶)会切断或“修剪”棘突蛋白,以移除其外层节 S1,并露出内层 S2。 然后,棘突蛋白 S2 使病毒膜与人类细胞膜融合,让病毒遗传物质进入细胞并开始复制。 我们近期的文章总结了这个过程,并重点介绍了 ACE2 的作用。 在本篇文章中,我将更详细地介绍人体蛋白酶如何帮助病毒入侵人体细胞,并重点介绍针对这种相互作用的抗病毒治疗方法。

 

 

SARS-CoV-2 棘突蛋白:认识两个区域

SARS-CoV-2 棘突蛋白的形状与螺钉有几分相似,其头部更大,柄部更长也更细(图 1)。 三个棘突蛋白相结合,形成一个三聚体,形状就像一个更大的螺钉。 柄部嵌入病毒膜,使头部朝外,远离病毒。 较大的头部区域和部分柄部被称为棘突蛋白的 S1 区。 柄部靠近病毒膜的其余部分被称为 S2 区。

病毒棘突蛋白结构
图 1:病毒棘突蛋白结构

 

一旦它进入人体并与呼吸系统、胃肠道、血管或其他在细胞表面表达 ACE2 的细胞接触,棘突蛋白 S1 区就会与细胞表面的 ACE2 结合,并将病毒拴在人体细胞的外部。 这是病毒复制过程中的第一步。

SARS-CoV-2 入侵细胞的两种途径

一旦病毒与细胞结合,就会有两种不同的入侵途径(图 2)。 通过哪种途径入侵取决于人体蛋白酶是否会“修剪”棘突蛋白。 蛋白酶的存在取决于病毒入侵的人类细胞类型以及该细胞的特定条件。 跨膜丝氨酸蛋白酶 2 (TMPRSS2)、弗林蛋白酶、弹性蛋白酶和胰蛋白酶等几种人体蛋白酶可以裂解棘突蛋白。 TMPRSS2 由人类肺细胞表达。 因此,人们认为它在病毒入侵呼吸系统细胞的过程中发挥着重要作用。

如果这些蛋白酶恰巧出现在棘突蛋白与 ACE2 结合接触面附近,它们就会裂解棘突蛋白,暴露棘突蛋白 S2 区,特别是棘突蛋白的融合肽区。 棘突蛋白的这个融合肽区由更具疏水性或类脂的氨基酸构成,它会嵌入含脂细胞膜,诱导病毒膜与细胞膜融合,随后病毒基因组就会入侵细胞(图 2a)。 这个裂解过程必然发生在棘突蛋白与 ACE2 结合之后。 如果在结合之前发生,那么病毒感染细胞的能力就会减弱。

SARS CoV-2 的入侵途径之一
图 2. SARS CoV-2 的入侵途径之一

 

如果蛋白酶恰巧没有出现在棘突蛋白与 ACE2 结合接触面附近,那么病毒将会通过另一种途径入侵细胞,这一途径被称为内吞途径(图 2b)。 在这个过程中,与细胞外部 ACE2 蛋白结合的冠状病毒会被细胞膜小范围内的凹陷区吞没,然后夹断,形成一个内吞膜泡,将外部物质带入细胞。 这个过程发生后,内吞膜泡与细胞内膜壁小泡融合,称为核内体。 核内体中存在蛋白酶,包括一种名为组织蛋白酶L的酶,它可以裂解棘突蛋白并暴露棘突蛋白的融合肽区。 然后,融合肽会介导病毒膜与核内体膜融合,从而诱导病毒基因组随后入侵细胞。

近期的文献表明,SARS-CoV-2 入侵细胞可能有第三种途径。 病毒在细胞内复制和制造新病毒颗粒时,一些棘突蛋白可能会在新病毒组装过程中被一种名为弗林蛋白酶的人体蛋白酶预先裂解或预先激发。 这意味着一旦病毒从细胞中分解出来,即使对于上述两种“正常”棘突蛋白裂解途径之一而言,其他细胞中存在的蛋白酶水平较低,带有预先激发棘突蛋白的病毒仍然可以与这些细胞融合并感染它们。

反击计划

研究人员正在竭力研制新药物,希望能够靶向感染生命周期中的棘突-ACE2-膜融合-内吞作用部分,以期抗击 COVID-19。 我们在之前的文章中重点介绍了重组可溶性 ACE2 这种潜在疗法。 该疗法主张在 SARS-CoV-2 与细胞表面的 ACE2 结合之前灭活棘突蛋白。 然而,许多其他候选药物也值得考虑。

NafomastatMI-1851 分别抑制参与棘突蛋白裂解、TMPRSS2 和弗林蛋白酶的蛋白酶,在试管中显示出减弱 SARS-CoV-2 感染力的潜力。 肽是一种类似于小范围棘突蛋白的蛋白质,肽链非常短,经证明,通过“阻塞”病毒上激发的棘突蛋白,可以抑制病毒和人类细胞膜的融合,因为它在膜融合过程中改变了形状。 这可以防止病毒入侵。 最后,PIKfyve 抑制剂是治疗 SARS-CoV-2 感染的已知阻断剂。 PIKfyve 是一种人体脂类激酶,可以将磷酸基添加至特定脂质中。 由于 PIKfyve 在病毒通过内吞途径入侵的过程中参与内体代谢,所以 PIKfyve 抑制剂具有抗病毒活性。

这些只是目前正在研究的许多候选药物中的一小部分,均作为抑制 SARS-CoV-2 病毒入侵的抑制剂 。 不过,对于寻求 COVID-19 疗法的研究人员而言,有许多目标物可供选择。 棘突蛋白、ACE2、裂解棘突蛋白和内吞途径成分的蛋白酶都是目前正在研究的可能靶点,许多物质都具有与这些靶点相关的抗病毒活性。 为帮助科学家更快鉴定这些潜在的候选药物,CAS 发布了一个由 CAS REGISTRY® 收录的开源数据集,其中包括已知的抗病毒药物与结构类似于已知抗病毒药物的相关化合物。 单击此处下载本文和其他 CAS COVID-19 公开资源,以了解更多信息。

 

订阅