RNA 医学的进展与前景 ─ 靶向治疗的武器库

rna-medicine-hero-image

过去十年间,研究、临床开发和商业活动都发生了极大转变,RNA 逐渐应用于医学领域。 随着用于 COVID-19 mRNA 疫苗的脂质 RNA 纳米颗粒的开发迅速成功,以及数种相关药物获批,RNA 已一跃成为药物研究的前沿。 这篇经同行评审的文章(刊载于《化学信息与建模杂志》 (Journal of Chemical Information and Modeling))借助 CAS 内容合集来研究 RNA 在药物开发中的多方面益处。 这包括研究其作为新疗法(药物或靶标)的潜力。 其中还研究了医学领域中 RNA 的当前研究布局和趋势。

碳捕获是对抗碳排放的答案吗?

Xiang Yu , Information Scientist/CAS

trees are an important source of carbon capture and storage

碳捕获和零排放之路

二氧化碳 (CO2) 对地球及地球生物的影响是非常矛盾的。虽然二氧化碳对动物和人类赖以生存的所有地球植物都至关重要,但是,大气中过多的二氧化碳正导致全球变暖,威胁到某些生物的生存。  

由化石燃料燃烧增加导致的 CO2 排放问题,可追溯至某些国家开启工业革命的18世纪。 目前科学家们预计:到 2030-2052 年,全球平均气温预计将上升 1.5oC(图 1)。 工业化、城市化和急剧增加的世界人口加剧了 CO2 排放量的增加(图 2)。

显示全球人口变化和二氧化碳排放趋势的图表
图 1. 随时间而变化的人口数量、与之伴随的二氧化碳排放及预计的全球气温上升趋势

 

2015年《联合国气候变化框架公约》第21次缔约方会议(COP21)确定了一项雄心勃勃的目标,即到2050年实现“零排放”。 要实现在30年内完全消除净碳排放这一重大目标,需要对全球工业加工方法和各国使用的常规能源进行变革。 实现这一目标的更广为人知的方法包括各种可持续发电方式,如风能和太阳能;然而,还有一种宣传较少但同样重要的方法是在源头或直接从大气中捕获 CO2(碳捕获)。 碳捕获相关技术受到高成本和有限的储碳能力的限制,因此目前全球 CO2 排放量中目前只有 0.1% 被封存;预计到 2050 年这一比例将升至19%。 近年来,碳捕获技术的研究有所增加,但迄今为止,只有少数技术得到了商业应用。 随着公众预防或减少气候变化的意识和紧迫性的提高,开发更有效的碳捕获技术势在必行。

1750-2020年间,使用化石燃料和工业生产带来的CO2排放量和世界人口增长趋势(2021年全球碳预算)
图 2. 1750-2020年间,使用化石燃料和工业生产带来的CO2排放量和世界人口增长趋势(2021年全球碳预算)。

 

CAS 内容合集™ 中的碳捕获内容

CAS 内容合集™ 是全球最大的利用科学家人工标引的已发表科学信息内容合集,适用于对全球科学出版物进行定量分析,如:发表时间、研究领域、配方、应用以及化学成分等。 为了评估最近和正在进行的碳捕获研究,在 CAS 新出版的一份重要的洞察报告中,提供了碳捕获研究的最新趋势概述。 在该洞察报告中,对最近的碳捕获研究进行了全面的趋势分析(2000 年至 2021 年间出版的约 18,500 份出版物),详细列举了碳捕获相关的术语,包括所采用的方法、碳储存或碳转化,这些术语通常与大气 CO2 或其环境影响相关的术语结合使用。

主要研究趋势及碳捕获方法

文献分析表明,2008 年之后,所有碳捕获和存储相关出版物的数量都迅速增加,在 2010 年代中期之后有所放缓,但最近又开始增加。 这可能反映了当前的经济状况和碳捕获的紧迫感,但似乎也与油价有关。 当油价较低时,碳捕获显得过于昂贵,因此在二氧化碳封存和储存方面的努力有限。 该分析只检索到了少量(占相关文献总量 10%)碳捕获相关专利,表明该技术的商业利益较低;不过,近来的情况令人鼓舞,专利数量有了急剧增加。
捕捉碳的各种方法可归为四大类:材料科学、生物、化学和地质方法。

材料科学方法

图 3 和表 1 总结了材料科学相关流程,包括烟气碳捕获系统。 其中,燃烧后碳捕集 (Post-combustion Capture) 技术应用最为广泛,适用于现有发电厂烟道改造,但需要消耗大量能源,因此运行成本很高。 新兴方法“直接空气捕获”有望得到广泛应用,此方法直接从空气中捕获 CO2,但由于大气中 CO2 的浓度较低,因此难度更高并且成本高昂。

材料科学方法:CO2 捕获过程的简化示意图
图 3. 材料科学方法:二氧化碳捕获过程的简化示意图

 

表 1. 材料科学方法:CO2 捕获过程比较

工艺 优点 缺点 改造难度
燃烧后 技术较为成熟,成本最低 采用低压气流且 CO2 浓度较低,使得分离效率降低,因此 CO2/N2 分离困难 较低
燃烧前 采用高压气流且 CO2 浓度较高,因此 CO2/H2 分离较为容易 仅适用于气化厂或重整工厂;尚无工业应用,纯氧成本较高 中等
富氧燃烧 CO2/H2O 可轻松分离 纯氧生产成本高昂 较高
化学链燃烧 CO2/H2O 可轻松分离 技术尚不成熟;工艺和设备较为复杂 较高

表 2 总结了烟气碳捕获的主要方法, 包括使用碱性溶液的化学吸收法和使用甲醇或 Selexol 等非腐蚀性溶剂的物理吸收法。 其他方法包括已被较充分地研究了的利用多孔固体吸附剂的吸附法,还包括作为新兴技术的膜过滤法,但是膜过滤法由于CO2 分离效率低,尚未得到广泛应用。

表 2. 材料科学方法:CO2 捕获方法比较

方法 最适合的过程 优点 缺点 成熟度
吸收 燃烧后 技术较为成熟,成本较低,操作简单 使用腐蚀性溶剂,溶剂损耗大,溶剂再生的能源需求较高 中等
吸附 燃烧前 持续运行,环保 CO2 选择性较小,难以通过控制固体/气体接触来最大限度的提高吸附容量,潜在候选吸附剂过多,吸附剂的实际性能难以预测 较低
燃烧后和燃烧前 系统简单灵活,环保,无需再生 CO2 渗透率低,能源消耗量大,膜材料容易受损 极低

生物方法

碳捕获的生物学方法主要是利用光合作用,光合作用贡献了地球上最大的 CO2 吸收。 木材或藻类等各种植物材料被转化为生物燃料(生物质)进行燃烧,创造了碳中和及可持续的方法。 基于酶的技术具有替代生物系统的潜力。 其中一个重要的例子是 1,5-二磷酸羧化酶/加氧酶 (RubisCO) ,——一种含量丰富并被广泛研究的酶。 然而,RubisCO的CO2 捕获速度较慢,但提升 RubisCO 的活性以创建工业可行工艺的研究工作正在进行。

化学方法

也包括多种化学方法,如涉及氢还原的催化过程,其已在数吨级的规模上有了广泛的应用。 其他广泛使用的方法包括电化学工艺法,这种方法利用质子和催化剂来减少 CO2。 使用清洁能源的光化学、光热和光电化学方法也前景光明,但到目前为止,这些方法受到光电转换效率的限制。 基于等离子体的方法也很有潜力,但能源需求量大,且仍需进一步开发才能用于碳捕获。

地质方法

碳捕获的地质方法是在远离大气层的位置长期储存 CO2 的重要解决方案。 可将捕获的 CO2 进行压缩和运输,然后注入深层多孔地质层或盐碱含水层。 此方法可储存数十亿吨 CO2,但选择合适的地点至关重要。

CAS 碳捕获文献分析

CAS 文献分析显示,2007 年之前有关 CO2 捕获的出版物数量较少,随后在 2010 年代初增速达到峰值,然后趋于稳定(图 4)。 关于燃烧前和富氧燃烧的出版物较少,这很可能是由于在适应当前设施方面存在经济困难,但最近这些出版物的数量有所增加。 相关专利申请在 2012 年有所增加,然后趋于稳定,这表明其商业利益持续存在。

材料科学方法:2001-2021 年期间与 CO2 捕获和分离有关的出版物数量
图 4. 材料科学方法:2001-2021 年期间与二氧化碳捕获和分离有关的出版物数量

 

CAS 分析还表明,在过去六年中,关于各种 CO2 化学转化方法的出版物相较之前迅速增加(图 5)。 其中,甲烷化、等离子体介导工艺和逆水煤气变换方法的相关研究最多。

显示碳捕获化学方法的图表
图 5. 化学方法:2001-2021 年期间 CAS 内容合集中讨论二氧化碳捕获、封存或使用,以及标题、摘要或关键词中包含“光还原”、“电还原”、“甲烷化”、“RWGS”、“光热”和“等离子体”的出版物数量

 

出版物数量表明对 CO2 固定的生物学方法的研究迅速增加,但专利申请数量保持稳定,这表明少数技术已做好商业化准备(图 6)。 然而,关于生物质能结合碳捕获与封存 (BECCS) 的出版物数量表明存在大量相关研究。

与生物 CO2 封存方法相关的出版物数量
图 6. 生物方法:2001-2021 年期间与生物二氧化碳封存方法有关的出版物数量

 

与 CO2 地质封存相关的出版物数量稳步增加,并在 2013 年达到顶峰,但此后有所下降(图 7)。 近年来,通过“含水层”、“盐碱”、“卤水”、“页岩”和“包合物”等术语检索出的出版物要多于其他术语,这表明关于这些类型封存的研究更多。

2001-2021 年期间与 CO2 地质封存有关的出版物数量
图 7. 地质方法:2001-2021 年期间与 CO2 地质封存有关的出版物数量

 

梦想照进现实

CAS 对 18,500 篇出版物进行的文献分析结果表明,有关各种 CO2 封存方法的研究正在迅速增加。 目前还没有一种方法成为主流;得到广泛应用的技术还很少,但分析表明,已针对现有技术的利用和新技术的开发开展了大量研究。 专利申请数量虽然少于文献数量,但仍可看出某些技术具有商业价值。 最近的分析结果可能反映了公众越发认识到全球变暖问题,展开应对行动势在必行。 随着形势越发紧迫,相关研究活动与经济状况和石油价格之间的明显相关性可能会减弱。 根据 CAS 分析得到的出版物发表趋势,在日益严峻的全球变暖问题的推动下,研究和技术部署可能会以惊人的速度展开,这在 2000 年看来像做梦一般。

“不可成药”的RAS蛋白靶向疗法用于癌症治疗的新趋势

Zach Baum , Information Scientist, CAS

cover image for blog about RAS oncoprotein inhibitors in treating cancers

RAS 蛋白:难以攻克的靶点?

大约五分之一的人类癌症都具有至少一种 RAS 突变形式(K-RAS、H-RAS 和 N-RAS),使得 RAS 成为人类癌症中最常发生突变的基因家族。 RAS 蛋白位于细胞质膜上,充当分子开关,负责发送细胞生长信号。 然而,RAS 蛋白的突变可能会使其持续处于活化状态并不受控制地发送生长信号,从而导致细胞异常增殖,形成癌症。  

尽管 RAS 蛋白的繁殖能力较高,但明显缺乏针对这些蛋白的疗法。 关于将 RAS 抑制剂用于癌症治疗的研究已有 30 余年,而在此之前,RAS 蛋白一直因其难以释放的抑制潜力而被认为“不可成药”。 今年早些时候,FDA 批准 sotorasib(由 Amgen 开发,商用名为 Lumakras™)可用于治疗肺癌,这是第一个被批准用于治疗的 RAS 抑制剂。  

sotorasib 的获批是 RAS 抑制领域发展的重要一步,目前人们已加强研发工作以发现更多的 RAS 抑制剂。 本文将探索 RAS 蛋白的研发是如何一步步取得突破,这一曾经被认为难以攻破、不可成药的靶点,如今正在发展为一种前景光明的癌症疗法。

K-RAS:RAS 基因中最常见的突变

四种蛋白质异构体的 RAS 基因编码如下:K-RAS4A、K-RAS4B、N-RAS 和 H-RAS。 突变的 RAS 异构体、密码子和氨基酸取代因组织和癌症类型而异,但最常见的是 K-RAS 异构体突变,约 22% 的 RAS 突变癌症中都有这种突变。 从甘氨酸到其他氨基酸(包括半胱氨酸 (G12C, 14%)、天冬氨酸 (G12D, 36%) 和缬氨酸 (G12V, 23%)),80% 的 K-RAS 突变发生在第 12 位氨基酸(图 1)。1

显示结直肠癌、胰腺癌和肺癌中的 K-RAS 突变类型的图表
图 1:结直肠癌、胰腺癌和肺癌中的 K-RAS 突变类型(密码子 12) 


RAS 蛋白可作为癌症治疗候选药物的发现

RAS 抑制剂可利用 X 射线结晶学进行鉴定。 借助这种方法,可以检查 RAS 蛋白结构,以确定小分子在人类癌细胞中占据的潜在结合口袋。 使用此类基于结构的药物设计方法可发现数百种可能结合在特定口袋中的化学物质。 潜在 RAS 抑制剂通常由支架结构组成,该支架结构经过多种官能团的轻微改性,以增强活性、选择性并降低毒性。 如此产生了可以进一步分析、增强和测试的先导化合物,有望在人类癌症临床试验中对其进行评估。

为了更深入地了解 RAS 抑制剂的当前形势,我们在 CAS 内容合集™ 中查看了 RAS 抑制剂相关专利和出版物。 据分析,有 26,958 种化学物质在直接 RAS 抑制领域中具有治疗或药理作用。 这一领域的化学物质和专利数量逐年增加,促进了关于 RAS 抑制剂发现的研究兴趣和研究工作(图 2)。

显示 RAS 抑制剂相关专利逐年趋势的图表
图 2:A:每年与直接 RAS 抑制剂相关的专利数量 - 及 - B:每年添加到 CAS 内容合集中与直接 RAS 抑制相关的化学物质数量。


最近,Amgen 的 sotorasib 获得 FDA 批准,导致 RAS 抑制剂发现的研究工作显著增加。 Sotorasib 是一种通过 Switch-II 口袋的 KRAS G12C 共价抑制剂。 它是第一款获批可用于治疗人类癌症和治疗 KRAS G12C 突变的非小细胞肺癌 (NSCLC) 的 KRAS 抑制剂(图 3)。2

另外四种 KRAS-G12C 抑制剂目前仍处于临床试验阶段,包括 MRTX849,其核心结构与 sotorasib 相似(图 4)2。 官能团不同,与 Switch II 口袋关键元件的结合机制也不同。 FDA 已于 2021 年 6 月授予 MRTX849 突破性疗法认定,用于治疗 KRAS G12C 阳性 NSCLC。

RAS 抑制剂 sotorasib 的结构
图 3:sotorasib 的化学结构


 

RAS 抑制剂 MRTX-849 的化学结构
图 4:MRTX 849 的化学结构


研究之旅仍在继续:扩展直接 RAS 抑制剂靶点的广度

随着越来越多分子结合 RAS 的发现,越来越多的 RAS 异构体和 RAS 蛋白表面被确定为潜在的小分子靶点。

由于突变的 RAS 异构体、密码子和氨基酸取代因组织和癌症类型而异,因此需要采用与当前 G12C 抑制剂不同的方法以增加癌症疗法范围。 未来研究可专注于扩展可作为抑制剂靶点的氨基酸类型,例如 G12D 和 G12V,以扩大我们能够治疗的癌症类型。

现在,RAS 抑制通道的大门已经打开,通过增进对 RAS 癌蛋白结构和小分子靶点的结合口袋配置的了解,可以开发和增强新型 RAS 抑制剂,以在治疗 RAS 突变癌症时实现最佳活性。


阅读我们的白皮书,了解更多关于发现 RAS 靶点持续研究之旅的信息,以及对当前 RAS 抑制剂化学结构和未来机遇的更详细概述。


参考文献

1.    H. Chen et al., Small-molecule inhibitors directly targeting KRAS as anticancer therapeutics. J. Med. Chem. 63 (2020) 11404–14424. doi: 10.1021/acs.jmedchem.0c01312.

2.    L. Goebel et al., KRASG12C inhibitors in clinical trials: a short historical perspective. RSC. Med. Chem. 11 (2020) 760. doi: 10.1039/d0md00096e.

加速研发过程:COVID-19 疫苗的突破性研究及其未来影响

Accelerating Discovery Covid Vaccine Breakthroughs thumbnail image

有些疫苗可能需要花费近 15 年时间才能获得批准,相比之下,COVID-19 疫苗的开发速度确实惊人(仅用时 1 年)。 为开发 COVID-19 疫苗,各学科、各大洲和各公司之间开展了前所未有的广泛合作,几种新兴技术在其中发挥了重要作用。 从 mRNA 到脂质纳米粒再到疫苗的交叉保护作用——这股疫苗研究热潮重塑了未来格局。

《加速 COVID-19 疫苗的突破研究》白皮书封面图

 

使用计算方法寻找治疗COVID-19的候选药物

Julian Ivanov , Senior Data Analyst, CAS

自世界卫生组织宣布COVID-19成为全球大流行以来,研究人员对SARS-CoV-2(引起COVID-19的新型冠状病毒)进行了大量研究。 然而,尽管人们付出了巨大努力和巨额资金,但仍未发现治疗 COVID-19患者的有效疗法。 虽然全球已经有多款候选疫苗进入临床试验阶段,但即使证明它们安全有效,也需要数月甚至数年时间才能生产和分发足够的疫苗供全球接种。 因此,目前迫切需要找到有效的抗病毒疗法,在疫情受控之前减轻病毒的影响,以免更多人被感染。

为满足这一迫切需求,科学家们一直在探索各种方法来加快药物开发进程,包括使用计算方法来找到已经批准用于其他适应症且可能对治疗COVID-19有效的药物。 美国化学文摘社(CAS)的科学家和技术专家团队借助定量构效关系(QSAR)方法、针对SARS-CoV-2的重要蛋白靶点的机器学习模型,希望找到可能用于治疗COVID-19 的候选药物。 CAS的科学家和技术专家通过这项工作成功找到了一些开始显现临床功效的候选药物,包括洛比那韦和替米沙坦,该成果最近发表在《ACS Omega》上。

旧药新用

由于新药上市需要的时间长、成本高,所以当需求十分迫切时,小分子药物重定位是一种值得考虑的选择。 与传统药物开发过程相比,药物重定位除上市速度更快之外,还具有诸多优势,例如降低因不良副作用而导致后期失败的风险。

药物重定位并非什么新概念。 但迄今为止,其应用主要还是投机性的,而非系统性的。 目前在药物重定位最成功的一些实例中(例如万艾可和米诺地尔),在患者报告始料未及的副作用中,出现了新的适应症。 最近,科学家们引入了更系统的药物重定位方法,包括特征匹配、分子对接、基因关联、路径图和临床回顾性分析等计算方法。 研究人员希望有一种计算方法能将现有小分子疗法与新找到的药物靶标可靠地联系起来,从而将现有投资组合的治疗价值最大化。

不断接近靶标

冠状病毒是一个大型病毒家族,可在人类和许多动物物种当中诱发轻微至中度的上呼吸道疾病,这早已众所周知。 尽管很少有动物特异性冠状病毒感染人类并在人类中传播,但迄今已证明三种冠状病毒能够实现这种跨越:SARS-CoV-1、MERS-CoV和当前的SARS-CoV-2。 这三种都是 β 属冠状病毒,人们认为他们均源自蝙蝠。 考虑到这些病毒的相似性以及它们在人类中传染的进展情况,之前的SARS和MERS研究是寻找SARS-CoV-2药物靶标的一个绝佳入手点。 SARS-CoV-2的所有蛋白质中,3CLpro和RdRp是QSAR建模的两种理想靶蛋白,部分原因是它们与SARS-CoV和MERS-CoV以及其他已知的冠状病毒中已被确定的蛋白质非常相似。

3CLpro是冠状病毒将多聚蛋白肽裂解成单个功能性非结构蛋白(NSP)必不可少的蛋白酶比较氨基酸序列和蛋白质结构时发现,3CLpro在SARS-CoV-2与其他人类冠状病毒之间高度同源。 结果表明:它有 96%序列与SARS-CoV-1同源,87%与MERS-CoV同源,90%与Human-CoV同源。 因此,之前在冠状病毒相关研究中发现的3CLpro 抑制剂有望作为SARS-CoV-2 3CLpro的抑制剂,相关的构效关系(SAR)数据对训练机器学习模型寻找SARS-CoV-2 3CLpro的新抑制剂极具价值。

RdRp是RNA病毒在宿主细胞中复制病毒基因组时主要使用的酶。 对 SARS-CoV-2 RdRp 的结构研究和序列分析表明,这种酶与 SARS-CoV-1 RdRp 的结构非常相似,且包含大多数病毒 RdRp(包括 HCV)中存在的几个重要氨基酸残基。 好在目前已经将各种病毒RdRp作为RNA病毒的抑制剂进行了广泛研究,特别是在HCV相关研究中。 因此,现有的RNA病毒RdRp抑制剂(例如 HCV)或许可以为SARS-CoV-2 RdRp抑制的药物开发提供有价值的见解。

利用机器学习对现有疗法进行优先排序

近年来,机器学习模型越来越多地用于加速药物发现。 具体而言,QSAR通常是现代药物发现过程中的第一步。 简而言之,QSAR是一些数学模型,以对分子结构的定量测量为基础,近似表示相当复杂的化学或生物化学性质。 这些预测性数学模型被用于筛选大型化学结构数据库,对最有可能有效抗击既定靶标的潜在候选药物进行优先排序。 该方法假设化学物质的活性与自身化学结构直接相关,因此,具有相似结构特征的分子将表现出相似的物理性质和/或生物效应。

在这项研究中,我和同事密切合作,为3CLpro和RdRp蛋白靶标构建了多个具有高度预测性的QSAR模型。 我们的团队(包括计算科学家和化学家)选择了1000多种已经具有结构生物活性数据的抑制剂作为这些模型的训练分子。 我们从最新的SARS-CoV-2生物测定研究以及 CAS内容合集中有关SARS-CoV-1、MERS-CoV和其他相关病毒的现有研究中收集了数据。 利用这些数据,我们运用多种机器学习算法构建了数十个QSAR模型,从中选择性能最强的模型——一个针对3CLpro,另一个针对RdRp。


阅读期刊文章 QSAR machine learning models and their applications for identifying viral 3CLpro- and RdRp-targeting compounds as potential therapeutics for COVID-19 and related viral infections(《QSAR 机器学习模型及其在识别 3CLpro 和 RdRp 靶标化合物作为治疗 COVID-19 和相关病毒感染的潜在候选药物的应用》)全文,了解检测的所有模型,看看哪些潜在候选药物排名靠前。


我们使用了由此得出的两个QSAR模型来筛选大量潜在候选药物,包括1087款 FDA 批准的药物CAS COVID-19 抗病毒候选化合物数据集中的近 50,000 种物质,以及自2003年以来发表的有关SARS、MERS和COVID-19的文献中已被确认具有药理活性或由CAS标引为治疗角色的约113,000 个物质。 通过在建模时将蛋白酶抑制剂活性作为物质结构的函数,我们从预计可作为冠状病毒 3CLpro和RdRp的有效抑制剂的物质中找到了一些最有希望的候选药物。 此外,在我们的模型预测的许多可以抑制SARS-CoV-2中的3CLpro或RdRp的物质中,之前也已经发现了治疗活性,可以治疗其他可能引发COVID-19严重感染的疾病。 例如,在某些情况下,一种已知对治疗心脏病也具有活性的COVID-19抗病毒候选药物(例如盐酸地尔硫卓[恬尔心])可能具有双重治疗活性。

经验证,该模型具有较高的受试者操作特性曲线 (ROC-AUC) 、灵敏度高、特异性强且准确性高(图1)。 这些模型预测具有高活性的某些分子,现已发表的实验生物测定研究和临床试验验证了这些分子的活性,进一步证明了这些模型具有预测能力。

**
图 1 3CLpro和RdRp训练过的二元分类器的受试者特征(ROC)曲线。

防范未来疫情

尽管这项研究的重点是找到用于应对当前COVID-19疫情危机的潜在治疗化合物,但未来可能还会出现其他病毒引发的疫情。 因此,我们现在必须持续投资,专注于抗病毒药物研究,为未来疫情做好准备。 由于各类不同的病毒均可能引发流行病(例如冠状病毒、流感病毒、埃博拉病毒、逆转录病毒),而且每种新药或适应症的人体安全性和功效测试仍需花费大量时间,因此,研究用途广泛的抗病毒药物和疫苗将最具价值。

持续开发基于计算机的药物发现方法(例如本文所述的机器学习程序、分子对接和虚拟筛选)将至关重要。 计算机处理能力的不断提高,对接和结构预测算法的持续开发以及蛋白质晶体结构确定技术将推动这项事业的进程。 此外,高通量筛选、组学技术和已开发药物重定位将继续发挥更加重要的作用。 但是,这些新技术驱动的方法并不会取代人类的实验室研究,而是作为后者的补充,提高研究效率。 这项工作将人类数据标引和机器学习模型结合在一起,我们希望能够借此成功找到治疗COVID-19的潜在小分子候选药物,凸显人与机器协同合作在药物发现中的价值,同时为正在开展的COVID-19抗病毒研究及未

作为全球科学界的一员,CAS致力于充分利用我们的所有资源和能力来帮助抗击新冠疫情。 探索其他公开的 CAS COVID-19 资源,包括科学见解、公开的数据集和特别报告。

脂质纳米颗粒:过去、现在和未来的机遇

Lipid Nanoparticles white paper thumbnail

脂质纳米颗粒因在两种获批的 COVID mRNA 疫苗中所起的作用而受到全球关注。 然而,脂质纳米颗粒的应用并不新鲜,事实上,早在几十年前,人们就将它作为脂质体和关键的药物递送载体进行研究。 只是现在有了越来越多改进和应用它的机会。

《脂质纳米颗粒》白皮书封面

RNA 衍生药物:研究趋势和发展综述

CAS Science Team

RNA Medicines white paper thumbnail

虽然最近对 mRNA 的重点关注主要集中在 COVID-19 疫苗上,但在治疗中使用 RNA 有可能为未来几代人带来医学的革命性变化。对于 RNA 治疗这一新兴领域的总体介绍着重于靶点、化学改性以及提高 RNA 稳定性的新传递系统方面的新兴趋势。

化学中的人工智能:当前布局和未来机遇

hero image for artificial intelligence white paper

人工智能 (AI) 和机器学习的领域在过去十年中呈指数级增长,而化学领域是如何随着这一新兴趋势而发展的? 在本最新的 CAS 白皮书《化学中的人工智能:当前布局和未来机遇》中,CAS 利用自身技术为您呈现相关科学文献出版和专利趋势,探索人工智能在化学研究中的前景。

我们揭示了 AI 应用处于领先地位的化学领域,以及那些通过 AI 技术的具有巨大潜力并有待挖掘化学领域。

《化学中的人工智能》白皮书封面

知识图谱加速 COVID-19 治疗研究

CAS Science Team

Knowledge Graphs in Covid-19 therapy white paper thumbnail

当新冠疫情来袭时,药物再利用对于加速疗法开发变得至关重要。 然而,围绕新蛋白质、新病毒、靶点、途径和临床信息收集所有关键信息和联系可能较为困难。 CAS 利用其在世界科学领域的独特联系来创建新的知识图谱,以确定顶级临床候选药物,从而将其重新用于 COVID-19 疗法。

《生物医学知识图谱》白皮书封面

本免费 CAS 洞察报告详细介绍了 CAS 生物医学知识图谱,并展示了我们如何使利用它为 COVID-19 药物研发这个切实存在的问题提供解决方案。

探索知识图谱,助力COVID-19药物发现

Jacob Al-Saleem , Senior Data Scientist

CAS Biomedical Knowledge Graph thumbnail image

加速COVID-19 新药发现

目前,只有少数药物被批准用于治疗COVID-19,但是开发新药可能需要数十年和数十亿美元;那么,是否有可能重新利用现有药物来开发其新用途? CAS(美国化学文摘社)最近发布的白皮书展示了“CAS 知识图谱”如何揭示数据间新的关联和见解,期望帮助科学家找到潜在可重新利用的现有药物。

药物重定位是加快新疗法开发的关键。 然而,整合所有重要信息以及新蛋白质、病毒、靶点、通路和临床信息间的数据关联面临挑战。 该白皮书展示了CAS知识图谱是如何在现有药物中找到可用于治疗COVID-19的最佳临床候选药物。

什么是知识图谱?

知识图谱结合不同来源的数据来对特定领域进行建模。 知识图谱用节点和线来描述数据。 节点代表每个数据点,线代表它们之间的关联。 下图提供了一个用知识图谱来预测哪些药物可能会抑制血管炎症的简化示例。

显示数据连接节点和边的 CAS 知识图谱

图 1. 使用节点和线来展示数据之间关联的知识图谱示例


传统数据库可能只展示数据间的直接关联(转录因子STAT3直接抑制剂),但知识图谱可以展示更深层的数据关联。 在这个例子中,知识图谱展示了在该通路上间接起作用的抑制剂。

深入研究COVID-19:小分子药物发现

CAS生物医学知识图谱整合了由CAS科学家人工标引的CAS内容合集(CAS Content CollectionTM )与公开可用的生物医学数据。

CAS生物医学知识图谱包含600多万个小分子、24,000多种疾病以及26,000多个人类和病毒基因的高质量数据。 知识图谱揭示了使用传统研究方法无法发现的见解。

我们用于发现COVID-19潜在候选药物的方法包括两个核心组成部分:

  • CAS科学家找到了20个与COVID-19相关的生物过程。 这些过程包括血液凝固、病毒侵入和内吞作用。 图谱中有一个代表“细胞因子风暴”的疾病节点 ,“细胞因子风暴”是危重型COVID-19病理学的重要特征之一。
  • 用文献中报道的基因表达的变化,特别是因SARS-CoV-2感染而显著升高的基因表达, 来识别相关的生物过程以及与这些基因中≥4个基因相关的生物过程。 这些生物过程包括炎症反应、血管生成和RNA转录的负调控。
用于构建 CAS 知识图谱的数据组成部分

图 2. 使用双核心组成方法寻找COVID-19药物的潜在小分子候选药物的示意图

利用知识图谱,我们找到了:

  • 所有与这些生物过程有抑制或激活关系的小分子;
  • 任何抑制上调基因的小分子。

该分析找到了有潜力被再利用为COVID-19药物的1,350个小分子。

评估新的潜在COVID-19药物

我们找到了这些潜在分子之后,就会评估它们之间的关联能力,并相应地提高分数。 为此,我们使用了一种新算法对每个分子进行排序。 该算法评估了小分子之间的关系以及与我们双组分方法中找到的基因和生物过程的相互作用。

例如,细胞因子风暴被认为是一个重要的关联节点。 之后,我们评估了小分子之间的关系以及与我们双组分方法中找到的的基因和生物过程的相互作用。 重要关联的评分会被提高,如与细胞因子风暴和基因激活相关的小分子之间的关联,因为这些关联很罕见。

据此,我们能够制定出所有小分子的排名表,并在白皮书中列出前50名。 如下图所示,您可以看到排名前10的候选药物名。 节点的大小对应于该节点与其它节点连接数量的多少。

展示 COVID-19 的前十种候选治疗药物的知识图谱网络图表
Click to enlarge" data-entity-type="file" data-entity-uuid="8b0840af-ea59-4d98-b438-1c0a04ae9f44" src="/sites/default/files/inline-images/knowledge-graph-network-diagram.png" />

图 3. 网络图展示了排名前十的候选药物的关联网络,其中节点的大小对应于该节点与其他节点的关联数量的多少

在排名前50的药物中,有11款目前正被用于治疗COVID-19患者的临床试验。 这也验证了我们结果的可借鉴性。

我们的生物医学知识图谱揭示了之前与SARS-CoV-2或一般病毒感染机制关联的四类药物。 这四类药物包括:

激酶抑制剂

激酶抑制剂是排名结果中发现的最大的一类药物。 激酶参与几乎所有的生物过程,并且在许多疾病中活性失调。 受体酪氨酸激酶(RTK)参与许多病毒的细胞侵入过程。 已发现的激酶抑制剂包括影响RTK的激酶,如EGF、FGF、PDGF和ALK受体,以及非受体酪氨酸激酶,如Bruton酪氨酸激酶。 我们的知识图谱还找到了丝氨酸-苏氨酸激酶抑制剂的靶向受体B-RAF、PKC、PIM和GSK-2beta。

组蛋白去乙酰化酶抑制剂 (HDI)

HDIs通过减少组蛋白去乙酰化来调控基因表达。 HDIs能够降低血管紧张素转换酶2(ACE2, SARS-CoV-2的主要细胞表面受体)和ABO糖基转移酶(一种有助于调节血型的酶)的表达。 ABO糖基转移酶是已知的COVID-19风险因子。HDIs还能调控参与COVID-19免疫应答的几种趋化因子和细胞因子。因此,HDIs被包含于排名结果中是合乎逻辑的。

微管调节剂

微管是由微管蛋白亚基组成的细丝。 研究表明,SARS-CoV-2蛋白与微管或微管相关蛋白相互作用。 我们的研究结果表明,多西紫杉醇、秋水仙碱和甲苯咪唑等微管调节剂可能有助于破坏 SARS-CoV-2感染。 秋水仙碱已被用于治疗COVID-19患者的临床试验。

蛋白酶抑制剂

已鉴定的蛋白酶抑制剂大多数为蛋白酶体抑制剂。 研究表明,泛素-蛋白酶体系统参与了病毒复制和细胞因子风暴,包括与冠状病毒相关的疾病。 蛋白酶抑制剂是COVID-19相关探索合乎逻辑的选择。 事实上,几种此类抑制剂已经在被研究用于COVID-19药物。 其中的一些也在我们的排名结果中,如硼替佐米、卡非佐米和沙格列汀。


数据关联的力量

CAS知识图谱所用的方法提升了发现COVID-19潜在药物的能力,并将对COVID-19以外其它疾病的药物发现具有重要参考价值,如阿尔茨海默症、帕金森症、自身免疫性疾病、癌症,甚至一些罕见病症。 我们的知识图谱在进一步扩展或模块化后,可为其他科学领域提供巨大价值,其中包括化学、营养和可再生能源领域等等,应用机会非常大。 机遇几乎无处不在。

订阅