制药业的数字化转型:通过数字化解决方案改善研发流程

Jennifer Sexton , Director/CAS Custom Services

Futuristic Technology Background. Outer Space, Alien Technology And Spaceship Concept

最大化数字化投资回报率:制药行业面临的挑战

制药公司开发、确证和上市一款新产品,平均需要花费10到 5年的时间。 然而,受近期的新冠疫情影响,相应mRNA疫苗的开发进程既迅速又成功,这无疑显示了数字工具在加速研发流程方面的潜力。 这一重大事件提高了制药行业对数字化转型和在研发流程中嵌入认知工具的兴趣。 但是,数字化可能很复杂,也很难实现。

有约55%的制药公司表示在一定程度上使用了数字技术。 然而,由于缺乏知识管理方面的专业知识和使用数字工具的经验,这一明智的举措往往会转变为一项有争议的投资。 鉴于约70%的数字化项目都以失败告终,制药公司需要重新评估其用于数字化技术的资金投资方向,并优化其部署策略,以解锁竞争优势,生产高疗效的药品。

凭借对健全的知识管理、认知工具及其相互关系的深刻理解,制药公司可以在各个层面革新其流程,孕育更优秀的全球医疗保健体系。

数字化和知识管理:公司范围的数据访问更便捷,加速创新

制药公司每天都在产生海量的信息,包括成分信息、配方和临床试验数据,以及处理时间、生产信息和质控报告等。 如果使用现有的传统信息源和互相孤立的数据库,这些新文件很快就会堆积如山,增加检索和查询难度。 由于缺乏结构性和协调性,过去的实验结果丢失在“暗数据”领域之中,这些内容大约占所有企业知识的55%。

如果无法方便地跨部门访问历史数据,制药公司很可能会重蹈覆辙,或是重复研究已经被解决的问题。 因此,想要加快创新进程并大幅缩短产品上市时间,数字化是关键。

制药公司正在将实验室日志、数据集和报告等历史文档转化为相关联的知识管理平台中的可搜索资产。 这样一来,组织中的每个成员就都可以访问成分层面的信息、供应商详细信息、监管指南以及其他科学和商业信息。 这些公司还进一步引入了在线用户界面,将不同部门和地区的团队联系起来。

通过深思熟虑的数字化转型,制药公司可以进一步便捷、加速和拓展研发、制造和商业化进程,同时促进跨学科工作和国际合作。

加速药物开发流程:通过认知工具促进疗法创新

在当今这个时代,数字化正在变革制药行业。这为研究人员提供了革命性的工具,进而缩短了产品的上市时间并提高了产品的安全性。

辉瑞在不到一年的时间里就研制出了新冠疫苗,使其一举成为了制药业的焦点。 虽然辉瑞的员工效率是毋庸置疑的,但该公司前所未有的响应时间和竞争优势植根于早在疫情之前就已实施的完善管线。 作为数字化战略的先驱,辉瑞认识到知识管理、数据分析和人工智能计划在制药行业的变革潜力,并将其融入到了日常运营之中。

凭借数十年的专业知识和研究数据,制药头部企业可以将候选先导药物缩小到最佳、最安全的选择范围。 例如,通过将人工智能驱动的算法与以往临床数据相结合,使研究人员能够利用COVID-19罹患率的实时预测模型来设计和监督广泛的临床试验。 知识管理策略和人工智能模型超越了实验室的界限,实现了库存预测和供应链监控,简化了疫苗开发、配送和获取流程。

通过在整个价值链中部署的稳健的数据基础和认知工具,辉瑞在新冠疫苗竞赛中遥遥领先。 从最初的候选药物选择到治疗监测,认知工具在加速药物开发中的作用已经得到证实。 然而,人工智能预测只有在使用经过预处理、标引和受保护的数据集进行适当训练的情况下,才能发挥其全部能力。 要在制药研发工作流程中启动或优化人工智能,首先必须评估数据质量和知识管理基础设施。

数字化和数据安全:保护专有信息、患者隐私和研究完整性

通过密集的药物研发和临床试验,制药业可以获得关键的生产流程和患者健康信息。 对于竞争对手和不法之徒来说,这些都是令他们垂涎的宝贵数据。 随着网络攻击(几乎每39秒一次)和医疗身份盗窃(2019 年为 35%)数量的增加,在制药行业实施稳健的安全策略刻不容缓。

有报告称,制药公司是网络攻击者的主要目标53% 的隐私泄露是由恶意活动所致。 机密信息分散在不同的部门、平台和软件中,这使得公司很难确保数据和环境安全。 落实整个企业范围的知识管理界面可以执行严格的用户访问控制,同时消除数据泄露的可能。 基于云的协作平台设有安全通道,可供研究人员和临床医生安全共享敏感信息,避免设备损坏的风险,现在这种平台在制药行业越来越普遍。 但是,从孤岛式的本地传统解决方案过渡到云平台或定制化混合版本,这一进程复杂且缓慢。 为了加速向最新知识管理生态系统的过渡,同时保护数据安全,制药公司应当寻求具备相关领域知识的数字化转型合作伙伴的帮助。

制药行业的数字化转型

数字化转型具有彻底改变制药业的潜力,能够实现更好的知识管理、加速创新和提高数据安全性,同时缩短药物的上市时间。 但是,计划不周的数字化转型战略可能会导致资源的浪费和风险的增加。

随着制药行业的数字化转型不断发展,数字技术和认知工具正在融入行业的方方面面,从而加快了药物开发速度,并为多种疾病提供更多的治疗法选择。 数字化转型将致力于以可持续、负责任且易于使用的方式,带来创新的医疗保健解决方案。

如需了解有关数字化转型和数据管理的更多信息,请查看我们与 CAS 定制服务SM 合作的案例研究

Colorful background with laboratory utensils, samples of cosmetics and glass vials on pink background.

化妆台摆满化妆品、化妆步骤过于冗长的日子已经一去不复返了。 在当今快节奏的社会中,消费者期待一种通用型产品。

踏入多功能化妆品时代。

无论是保湿、抗衰老、遮瑕功能的护肤产品,还是防卷曲和毛躁、发丝修复、沐浴用护发膜,消费者对化妆品的需求比以往任何时候都高。 多功能需求给化妆品行业带来了压力,企业需要不断研制出能同时解决多种问题的产品。

通过了解壳聚糖和木质素等多功能成分以及新型递送系统 (例如应用纳米技术的新型递送系统) 的最新研发进展,配方设计师可以持续为这一快速发展、需求不断增长的市场提供创新产品。

明星成分

有机生物化妆品的健康概念、培养皿、天然植物和美容产品

在化妆品行业里,用于配制多功能化妆品的得力工具之一是所谓的“明星成分”。这些成分同时具有多种功效,配方中只需使用少量成分即可解决多种问题。

常规的明星成分包括:

成分 特性
乳木果油 抗炎 
抗氧化
抗衰老
椰子油 修复肌肤屏障
抗菌 
抗炎 
抗氧化
抗衰老
愈合伤口
烟酰胺 抗炎
抗菌
抗氧化
止痒
咖啡因 刺激头发生长
改善微循环
防紫外线
抗氧化 
蜂胶 防腐
抗炎
抗氧化
抗菌
愈合伤口

随着消费者对精简成分表和‘清洁化妆品’的兴趣越来越大,明星成分很适合希望用一种成分满足所有化妆品需求的消费者。 这些成分不仅有助于配方配制,而且许多被视为“天然”或“清洁”成分,具有明显的营销优势。

超强的保湿剂

含有滋养保湿成分的面霜涂抹、透明面部精华液

保湿剂是最通用的化妆品成分之一。 这些成分通常为皮肤、头发和指甲提供保湿功效,可用于开发所有相应的多用途产品。 保湿精华液和保湿精油目前作为包括护手霜、面部保湿霜、身体润肤乳和护发膜在内的一系列产品的单一替代品在售。

保湿成分不仅可以作用于多个身体部位,还可用于多功能化妆品, 具有抗衰老、抗氧化和抗菌等功效。 乳木果油和椰子油等植物油是化妆品行业中常见的备选成分。 然而,最新研究确定壳聚糖是一种新型竞争成分。

壳聚糖可用于皮肤和头发的保湿和保护。 研究发现壳聚糖的功效包括:

  • 保湿性
  • 润肤性
  • 抗菌性
  • 皮肤护理
  • 紫外线防护
  • 抗氧化性

神奇的抗氧化剂

有机生物化妆品的健康概念、培养皿和天然植物

壳聚糖神奇的抗氧化剂,可以与乳木果油、椰子油烟酰胺蜂胶等其他化妆品明星成分配伍使用。 每种成分都具有其自身的多功能性,为配制具有抗氧化活性的化妆品提供了一系列备选方案。

木质素是抗氧化化妆品的另一种新近明星候选成分。 从甘蔗等天然原料中提取的木质素具有明显的抗氧化活性,可用于化妆品。 2023 年的一项研究表明,木质素具有与化妆品标准相同或略高的自由基清除能力。 这项研究还表明,木质素可以用作天然化妆品颜料并能提供紫外线防护,突显了木质素未来成为明星成分的潜力。

惊人的防晒作用

夏天沙滩上的防晒霜

木质素在紫外线防护方面的潜力无疑超过了其抗氧化性能。 研究证明,无论在体外还是在志愿者身上,木质素都是一种强效的紫外线阻断剂,木质素为未来的紫外线防护多功能化妆品提供了一个令人兴奋的机会。 随着专家给出的防晒建议越来越多,消费者们也期待有同时针对其他皮肤问题的防晒产品。

增强防晒作用的另一种在研方法是在防晒霜配方中加入迷迭香酸,经研究证明可以提高41% SPF (防晒系数) 并增加抗氧化性。 具有防晒功能的多功能化妆品配方的关键障碍在于,任何新成分的添加都不能牺牲产品的防晒效果。对于配方设计师来说,可以提高SPF且增添其他功效的迷迭香酸等成分是一个令人兴奋的新发现。

巨大的瑕疵治疗潜力

装有面部精华液和油的吸管组

 

瑕疵治疗产品通常需要具有不止一种功能,包括皮肤保湿、伤口愈合和抗氧化性。 抗炎和抗菌成分可以帮助消除粉刺瑕疵的成因,具有伤口愈合和皮肤屏障修复功效的成分可以减少疤痕。 如此,瑕疵治疗成分即使在其主要功能范围内也需要具备多功能性。

抗菌和抗炎成分在化妆品行业中广泛应用,配方设计师选择它们作为有效成分。 芦荟、金缕梅、水杨酸、过氧化苯甲酰和视黄醇都是瑕疵治疗的常见选择,它们为保湿霜等产品提供抗菌和抗炎特性。

瑕疵治疗不仅仅靠明星成分自身, 创新的成分递送方式可以提高其疗效和使用寿命。 最近研发出一种化妆品祛痘成分纳米递送系统,一旦与皮肤接触,就会缓慢释放活性成分,并展示出更高的抗菌和抗氧化特性。

终极配方

阳光下的一瓶精华液和美丽的光点

随着消费者不断简化化妆程序,化妆品行业面临着前所未有的挑战,即如何开发比以往更高级、更通用的配方。 充分利用明星成分并将更多功能融入化妆品配方中,可以帮助研发人员实现这一目标,并使其产品保持在多功能化妆品浪潮的最前沿。

投资具有前景的明星成分 (如壳聚糖和木质素等) 可以助力配方设计师推进产品开发,采用新型纳米技术递送系统可以从现有成分中获得比以往更多的功能。 了解多功能化妆品的最新研究成果,将持续支持创新研发,超越消费者对化妆品的预期。

了解我们如何与 Citrine 合作,利用人工智能来预测配方变形,进一步探索 CAS 如何助您打造终极配方。

通过植物肉的可持续性实现环保

CAS Science Team

Close-up of burgers on table

随着消费者出于个人和健康原因而改变其饮食,以及社会对更具可持续性饮食习惯的推动,植物肉在过去几年里大受欢迎。 该行业的创新之风不断提高肉类替代品的质量,提供了比以往更多的选择,从而催生出竞争激烈的多样化市场。

由于植物肉的可持续性是公众对此类产品兴趣增加的最大驱动因素之一,消费者正在寻找既能减少肉类摄入量,又能降低对环境影响,同时亦不影响其最喜欢的美食体验的替代品。 生产商如何才能提供可持续的优质产品,满足消费者对口味和口感的高要求?

植物基替代品的可持续性如何?

以可持续方式散养的公鸡在黎明时鸣叫

肉类养殖业对环境的负面影响早有记载并为人所知。 畜牧业和肉类养殖业本身所排放的温室气体约占全球温室气体总量的 15%。 预计到 2031 年,此类排放量将增加 9%,因此减少肉类需求的解决方案比以往任何时候都更为关键。

植物肉创新便是其中一项解决方案。 仅就碳排放而言,植物肉类的碳效率是肉类产品的 120 倍。 2021 年的一项最新研究发现,植物肉饼对气候变化造成的负担比牛肉饼小 77%,同时还可减少土地和水资源使用、富营养化和酸化。

对植物肉可持续性的主要批评在于,肉类替代产品的可持续性可能比不上全食物植物性饮食。 尽管争论不无道理,但肉类替代品为肉食者提供了一种比转向全食物植物性饮食更易于实现的行为改变,更容易过渡到可持续解决方案。

做出转变

女性、素食主义者、替代肉类与料理包

尽管人们普遍关注气候危机,也了解畜牧业对环境的影响,但许多消费者仍然很难从饮食中减少肉类。 提高可持续发展的愿望往往不足以推动少吃或不吃肉类的行为改变。 植物肉替代品为避开这一难题提供了完美的解决途径。

通过开发口味和口感体验与动物产品相似的植物产品,创新人员可以为消费者带来两全其美的享用机会。 对于生产商而言,瞄准这部分“弹性素食主义者”非常关键,因为那些无意完全过渡到素食的消费者往往会非常追捧肉类替代品。 巴斯大学的一份综述报告指出,90% 的植物肉和乳制品消费者仍将肉类纳入其饮食之中。

消费者正在接受这样一种观念,即他们可以用植物肉替代品取代部分肉类摄入量,以此提高可持续性,但此类产品真的能够实现可持续发展吗? 研究表明,它们能。 尽管可以实现的变化很小,但却能对环境产生巨大影响。 一项研究发现,只要用豌豆蛋白代替德国 5% 的肉类消费,每年就能减少 800 万吨温室气体排放。

通过这种方式,制造商们正在开辟一条通往更环保未来的康庄大道,也更容易被大多数人采纳。 通过不断创新和提高产品的可持续性,制造商可以吸引消费者关注环保目标,并继续鼓励对植物肉可持续性加大投资力度。

选择植物蛋白

微型菜苗

植物蛋白的选择是开发任何新型肉类替代品的核心。 蛋白质来源会影响产品的口感和质地、营养价值以及可持续性,这些都是制造商需要吸引消费者的地方。 消费者需求的大幅增长使得植物蛋白市场的预期价值到 2030 年将达到 1620 亿美元。 这一庞大的产业目前包括可供创新者选择的一系列来源,其中有些来源比其他来源更为成熟,目前和未来的可用来源包括:

现有来源 大豆
小麦
豌豆
新兴来源(预计 1-3 年内拥有固定消费群) 玉米
大米
鹰嘴豆
开发中(预计 3-5 年内拥有固定消费群) 真菌
油菜籽
未来发展路径(预计 5 年以上时间拥有固定消费群) 海藻
细胞替代物

大豆、小麦和豌豆蛋白质来源具有成本低、供应量大、营养价值高等优点,因此在行业内率先得到认可。 建立在上述优势的基础上,包括玉米、大米、鹰嘴豆、真菌和油菜籽在内的新一波来源则侧重于增加产品开发的功能性。 这将赋予开发人员更大的控制权,以创造出符合消费者口味和口感的产品。

在此基础上更进一步,藻类和细胞替代品等未来发展路径努力成为最具可持续性的蛋白质来源。 虽然消费者对这些蛋白质的态度仍需改变,但它们具有高度可再生性,对环境的影响极小,从而提高了植物肉的可持续性。

植物肉可持续性的未来

木桌上各种零食和美味素食的俯视图

在未来的食品可持续发展领域,植物肉替代品有望发挥重要作用。 肉类替代品是肉食者在不改变饮食习惯的前提下减少动物产品摄入量的简便方法,可以鼓励更多的人减少肉类摄入量,同时对环境产生巨大影响。

这种环境变化取决于企业能否开发出在口味、口感和外观上尽可能接近肉类的诱人产品。随着更多可持续植物蛋白来源的研究取得进展,植物肉可能会越来越受欢迎。 如需了解有关可持续农业和肥料新方法助力减少碳排放的更多信息,请阅读我们有关可持续农业的近期文章。

研发洞察: 未来的可持续催化剂

CAS Science Team

INSGENENGBRO101249-CAS-Insights-Executive-Summary-Sustainable-Catalysts-1920x1080-Hero

绿色化学始于绿色催化剂,但这一新兴领域有何最新进展? 在各个行业、学科和研发实验室中,催化剂都是不可或缺的一环,我们的最新摘要中确定了新的机遇、挑战和创新。 从能源到农业、制药等行业,这可能是提高可持续性指标的关键组成部分。

INSGENENGBRO101249-CAS-Insights-Executive-Summary-Sustainable-Catalysts-Fanned image

大语言模型是否适合科学研究?

Philippe Ayala , Data Science Technical Manager

Senior chemistry professor writing on the board

为什么人工智能工具和专业应用程序并不总是越大越好?

自2022年发布以来,ChatGPT重新定义了人工智能的对话方式。 从积极的角度看,ChatGPT是一个奇迹,有望彻底改变工作方式、提升城市活力;但从消极的角度看,ChatGPT又会取代人类工作岗位。据称,该大语言模型 (LLM) 几乎无所不能。

ChatGPT与GPT-3/GPT-4有什么区别?

ChatGPT和LLMs (命名为GPT+数字,例如GPT-3,GPT-4) 之间存在显著不同。 二者经常被混淆或互换使用,但ChatGPT是在更复杂的LLMs (例如,GPT-3或GPT-4) 上运行的聊天机器人应用程序,特点是界面“易于使用”。

PT-3和GPT-4是一系列生成式预训练Transformer模型的不同版本。 Transformer是一种神经网络,被称为语言模型。 这些模型可以学习识别松散结构数据的模式和上下文,如句子中的单词, 且Transformer尤其擅长这一点。 给定上下文时,生成模型可以根据提示生成任意长度的输出信息, 而GPT模型则结合了这两种模型。

另一方面,ChatGPT是在GPT-3或GPT-4等LLMs基础上建立的应用程序。 ChatGPT配有一个存储模块,可以继续先前的会话,还有过滤器、分类器以及更多的内置功能,可以最大程度地避免有害或不恰当的回答。

chat-gpt-LLM

构建大语言模型需要什么?

LLM 令人惊叹。 GPT-3有1,750亿个参数,该模型可以随着学习而自行更改这些数值。 GPT-4是2023年推出的GPT系列最新版本,拥有1万亿个参数。 使用过这些模型的人都可以证明,它们拥有令人难以置信的广博知识和惊人的连贯对话的能力。

然而,这些令人惊叹的能力代价也同样不菲。 训练规模更大的GPT模型和配置应用程序 (如ChatGPT) 是一项巨大的工程。 据估计,GPT-3的构建成本为460万美元,云端运行成本每年至少87,000美元。 GPT-4的研发成本甚至可能超过令人瞠目的1亿美元。

在这些数字之上是硬件和资源的高昂成本,主要用于保持GPT-4运行,同时确保其数据中心低温运行。 数据中心用水量达数十亿加仑,空调系统要消耗能源并排放温室气体,因此企业需要对这些强大工具的成本和收益进行评估。 鉴于这些前期和后续的成本,对于大多数私营公司、学术界和公共部门组织来说,LLMs已经昂贵到了令人望而却步的地步,而随着模型的扩容和功能的增强,这种情况还将持续下去。

大语言模型的局限性

得益于特定的结构组件,Transformer模型可采集不同输入内容之间的关系,并且由于有大量示例文本,现代LLMs已经非常擅长提取一段文本的广泛语义并跟踪文本元素之间的关系。 像GPT-3这样的生成模型则更进一步,学会了在问题和答案之间追踪这些关系, 结果往往令人信服。 我们可以向ChatGPT询问0到100之间的数字,或者询问胆固醇是否是类固醇,基本上都会得到正确的答案。

然而,对于科学研究等专业应用,大语言模型可能很难跳出宽泛的语义来理解细微差别的特定信息。 为什么会这样呢? 首先,LLMs无法避免“垃圾输入/垃圾输出”问题的影响。 其次,即使有高质量的训练数据,相关训练信息也可能缺乏代表性。

LLMs能够很好地处理宽泛和常见的话题,但小范围和专业性话题几乎总是缺乏代表性,注定无法很好地予以处理。 例如,大语言模型可以正确处理抽象层面问题,确定某些物质是否是类固醇分子。 它甚至可以识别同一家族的两种类固醇分子,但无法始终识别哪种有剧毒哪种没有。 大语言模型这种区分能力取决于训练所用的数据,以及是否识别并“记住”了正确的信息。 如果这些信息隐藏在海量错误或相互矛盾的信息中,模型就不可能给出正确答案。

有些人可能会反驳说,更多、更干净的数据以及更大的模型可以解决这个问题。 也许他们是对的,但如果我们要求生成式大语言模型在0到100之间选择一个随机数呢? 我们能确定给出的数字确实是随机的吗? 为了回答这个问题,我们需要超越词汇语义和存储事实、超越LLMs并转向人工智能代理。 在这种情况下,人工智能代理将利用经过验证的程序构造成一段可执行代码,然后将代码传递给另一个进程运行并处理结果,将答案呈现给用户。

科学数据的特定挑战

科学数据可能比文本复杂得多,而且大多数问题不能用一两句话说清楚。

当使用人工智能驱动的工具进行科学研究时,我们必须扪心自问:我们试图解决什么问题? 许多问题涉及语言或结构松散的序列,所以语言模型是一个非常恰当的选择。 那么表格数据、分类数据、知识图谱和时间序列呢? 尽管这些形式的数据是科学研究所必需的,但 LLM 无法始终对其加以利用。 这就意味着,单靠 LLM 无法提供分子研究等应用所需的特定程度。 相反,就像管弦乐队需要众多乐器才能发出协调一致的声音,科学也需要人工智能工具箱中的多种工具才能产生一致的结果。

兼顾深度和广度的系统方法

如果单靠LLMs不适合科学研究,那什么才适合呢? 答案就是采用系统方法,即利用多种模型来生成专业输出信息。 通过将语言模型和神经网络与传统的机器学习工具、知识图谱、化学信息学和生物信息学以及 TF-IDF 等统计方法分层,研究人员可以在其人工智能驱动的程序中包含深层次的细微信息。

这些工具可以为开发新药物分子或发明新化合物等任务提供所需的特定结果。 这些工具可以为开发新药物分子或发明新化合物等任务提供所需的特定结果。知识图谱的价值尤为突出,因为它是将分子、反应、发表的文章、概念词等标引信息进行关联的可靠依据。理想的用例是利用一个深度神经网络,它可以指出“这是某种物质”,同时提供知识图谱以验证准确性。 这就是我们获取科学研究所需可靠事实的方法。

这种系统方法本质上是一种事实核查或验证功能,用于提高数据可靠性。 例如,Nvidia 最近发布了一款视觉语言模型 Prismer,旨在回答有关图像的问题或为图像提供说明。 该模型采用“专家混合”方法,可训练多个较小的子模型。 该模型的知识深度无需大量训练即可提供高质量的结果,其性能可媲美用 10 到 20 倍数据训练出来的模型。

谷歌也在研究类似的方法,从通用的“教师”语言模型中提取知识到较小的“学生”模型中。 由于学生模型具有更深层次的知识,因此能够比大模型提供更好的信息。在一项专门的推理任务中,一个经过 7.7 亿个参数训练的学生模型的表现要优于使用 5400 亿个参数的教师模型。 虽然较小的模型需要更长的训练时间,但由于其运行成本更低、速度更快,因此持续效率的提升很有价值。

改善科学研究

另一个成功的系统方法是 PaSE,即专利相似性引擎,该引擎由我和我的 CAS 同事们开发而成,为 CAS STNextCAS SciFinder 的独特功能提供支持。 作为与巴西国家工业产权局 (INPI) 合作的一部分,我们建立了该模型。 其设计目的是在短短几分钟内处理海量信息,以便研究人员解决长期积压的专利问题。

该解决方案包括一个语言模型,该模型使用了与 GPT 系列相同的关键机器学习技术,但还增加了其他学习类型,包括知识图谱、化学信息学和传统的信息检索统计方法。 通过对全球科学(如 CAS 内容合集TM 中的专利和期刊全文)进行模型训练,PaSE 达到了查找“现有技术”所需的深度和广度,比人工检索快 50%。

对于专利局而言,证明不存在的事物极具挑战性。 想想这句谚语:“缺乏证据并不表明证据不存在”。我们的数据科学家与专利检索专业人员、巴西 INPI 团队以及人工智能工具的独特组合一起合作,对模型进行了训练和优化,结果发现现有技术的人工检索减少了 40%。 由于这一表现和专利积压的减少,该模型于 2021 年被专利信息用户组授予 Stu Kaback 商业影响力奖

科学领域大语言模型的前景

这一经验表明,LLMs将继续在未来的科学研究中发挥重要作用,但与普遍看法相反,这个工具并不是解决所有问题的灵丹妙药。

我喜欢把这些模型想象成整理家中凌乱的房间,比如壁橱或阁楼。 不同的人可能会以不同的方式整理这些房间里的物品。 有的人可能会按照颜色来整理所有物品,而有的人则可能会把所有贵重物品放在一起,还有人可能会按照功能来整理。 这些方法都没有错,但它们可能并不是你想要或需要的整理方式。 这是LLMs的根本问题,大语言模型可能会以某种方式整理信息,但这不是科学家或研究人员需要的方式。

对于用户需要特定结果 (如蛋白质序列、专利信息或化学结构) 的专业应用,人工智能驱动的模型必须经过训练,以特定的方式组织和处理信息。 它们需要以用户希望的方式整理数据、结果和变量,从而实现最佳的训练和预测效果。

要进一步了解这些数据的影响、其表现形式以及正在改善科学预测的模型,请查看我们与 CAS 定制服务合作的案例研究。 想了解有关人工智能和化学新兴领域的更多信息? 欢迎阅读我们的最新白皮书,了解人工智能为化学带来的种种机遇,或探索我们的相关资源,认识人工智能如何提高全球各地专利局的工作效率

从对抗病毒到治疗肿瘤:利用 mRNA 疫苗治疗癌症

CAS Science Team

INSGENENGSOC101307-mRNA-Social-Graphics-1920x1080-Hero

不断上升的全球癌症负担

受人口老龄化以及癌症主要风险因素的流行和分布变化所推动,全球癌症负担和相关死亡率正在迅速增加。 据预测,2040 年将诊断出 2,840 万癌症病例,较 2020 年增长 47%。

女性乳腺癌已经超过肺癌成为确诊最多的癌症类型,预计到 2020 年将新增 230 万病例 (11.7%),其次是肺癌 (11.4%)、结直肠癌 (10.0%)、前列腺癌 (7.3%) 和胃癌(5.6%)。 免疫疗法(如检查点抑制剂等)在癌症治疗方面取得了重大进展。 尽管实现了这一突破,但免疫疗法并不是治疗所有癌症的万灵药。 并非所有类型的肿瘤对免疫治疗剂都有反应,耐药机制可能会导致肿瘤的免疫逃逸和生长。

虽然目前美国食品和药物管理局尚未批准任何 mRNA 癌症疫苗,但研究性疫苗 mRNA-4157-P201 (Moderna) 与检查点抑制剂 pembrolizumab(默克公司)联合用于高风险黑色素瘤完全切除术后的辅助治疗已获得突破性疗法认定。 随着 mRNA COVID-19 疫苗取得成功,研究人员相信 mRNA 疫苗技术可用于治疗癌细胞。 那么,我们是否能够将 mRNA 疗法整合到癌症治疗领域呢?

回到原点 — mRNA 疫苗和癌症

对许多人而言,COVID-19 mRNA 疫苗似乎是在一夜之间开发而成。 然而,如果没有多年来针对流感、巨细胞病毒和寨卡病毒疫苗的研究奠定基础,此类疫苗的快速设计、生产和测试工作也就无法付诸实践。

1995 年,一项关键性研究表明,肌肉注射编码癌胚抗原的裸露 RNA 可在小鼠体内引起抗原特异性抗体反应。 次年,另一项研究表明,将经 mRNA 转染的树突状细胞注射到肿瘤小鼠体内可诱导 T 细胞免疫反应,并抑制肿瘤生长。 这项工作为探索基于 mRNA 技术的可行性、有效性和安全性的大量研究铺平了道路。 然而,直到最近,不稳定性、先天免疫原性和体内递送效率低下等问题仍在限制 mRNA 疫苗和治疗应用。 研究人员面临的一项关键挑战是如何将 mRNA 递送至所需前往的位置;如果没有某种形式的保护,注入体内的 mRNA 序列将被识别为外来物质并遭到破坏。

用于治疗新型冠状病毒 SARS-CoV-2 的 mRNA 疫苗迎来快速发展,帮助加快了 mRNA 疫苗从实验室到临床的应用。 例如,辉瑞 BioNTech 和 Moderna 疫苗证明了利用脂质纳米颗粒 (LNP) 将 mRNA 递送到靶细胞的有效性。 2019 年底,在 SARS-CoV-2 疫情的刺激下,与 mRNA 疗法相关的已发表文献和专利申请在全球范围内迅速增加。 2020 年后,论文发表数量呈快速增长趋势,2021 年增至 3,361 篇,2022 年增至近 5,000 篇。 2020 年之后,专利申请数量继续呈上升趋势,2021 年达到 382 件,2022 年预计将增加到 510 件(图 1)

MRNA 治疗博客期刊和专利图 1
图 1. 关于 mRNA 疗法和疫苗的期刊(左)和专利族(右)出版物的全球出版趋势。

COVID-19 mRNA 疫苗的成功揭示了 mRNA 平台的潜力,不仅可以扩展到其他传染病,还可适用于癌症。 从病毒研究中获得的见解可能会为癌症疫苗的研究提供信息,我们似乎又回到了原点。

招募免疫系统 — mRNA 癌症疫苗的工作原理

mRNA 在癌症疫苗中的应用非常广泛,研究人员正在探索癌症免疫治疗的多种策略

  • 抗原呈递:mRNA 疫苗将癌症抗原递送至抗原呈递细胞 (APC),以呈递主要组织相容性复合物 I 类和 II 类。
  • 辅助功能:mRNA 通过与 APC 表达的模式识别受体结合来刺激免疫激活。
  • 抗原受体:mRNA 将嵌合抗原受体 (CAR) 和 T 细胞受体等抗原受体引入淋巴细胞。
  • 蛋白质生产:mRNA 允许免疫调节蛋白的表达,包括 Toll 样受体、趋化因子受体、共刺激配体、细胞因子、趋化因子和不同的单克隆抗体格式进入不同的细胞亚群。

mRNA 癌症治疗是否可行?

Genentech、CureVac 和 Moderna 等公司正在开发编码新表位的 mRNA 疫苗,从而引发针对目标肿瘤的免疫反应。 数十项临床试验正在测试将 mRNA 疫苗作为单一疗法或作为包括胰腺癌、结直肠癌和黑素瘤在内的各种癌症患者联合治疗的组成部分。 数种候选药物已进入 2 期试验,在黑素瘤、非小细胞肺癌和前列腺癌中显示出良好的疗效(表 1)。

表 1 . 用于癌症临床试验的 mRNA 疫苗(2 期及以后)

疫苗
名称
CAS
登记号®
疾病
适应症
抗原 公司
Autogene cevumeran  2365453-34-3 黑素瘤;
结直肠癌
患者特异性
新抗原
BioNTech
mRNA 4157 2741858-84-2 黑素瘤 多达 34 种新抗原 Moderna
BNT 113 2882951-85-9 PV16+ 头颈部鳞癌 HPV16 衍生肿瘤抗原(肿瘤蛋白 E6 和 E7) BioNTech
CV 9202 1665299-76-2 非小细胞肺癌 NY-ESO-1、MAGE C1、MAGE C2、TPBG (5T4)、生存素、MUC1 CureVac
CV 9103 2882951-83-7 前列腺癌 含 4 种前列腺癌相关抗原的混合物 CureVac
SW 1115C3 2882951-82-6  非小细胞肺癌;食道癌 患者特异性新抗原 Stemirna Therapeutics
BNT 111  2755828-88-5  黑素瘤 含 4 种黑素瘤相关抗原的混合物 BioNTech

虽然 mRNA 癌症疫苗正在引起研究界的兴趣,但大多数肿瘤学研究历来都集中在 mRNA 治疗上,进入临床开发的候选药物种类繁多(表 2),其中包括:

  • TriMix-MEL(eTheRNA Immunotherapies 公司)是三种 mRNA 组成的混合物,可以激活关键的免疫细胞对抗癌症。
  • mRNA 疗法(BioNTech 公司),可编码一种针对 claudin 18(即某种在多种癌症中表达的蛋白质)的单克隆抗体。 
  • LNP 封装的 mRNA(MedImmune LLC 公司),通过肿瘤内注射,旨在驱动局部白细胞介素-12 (IL-12) 的产生,并诱导抗肿瘤免疫。

表 2. mRNA 治疗产品在癌症临床试验中的应用

mRNA 药物名称 CAS 登记号 疾病适应症  公司
TriMix-MEL; ECL-006; E011-MEL 2877674-59-2 黑素瘤 eTheRNA Immunotherapies
BioNTech-1; BNT 141; BNT-141; BNT141 2877707-22-5 实体瘤 BioNTech 
BNT-142; BNT142  2877707-34-9 实体瘤 BioNTech 
BNT-151; BNT151 2877709-82-3  实体瘤 BioNTech 
BNT 152; BNT152 2877709-92-5 实体瘤 BioNTech 
BNT 153; BNT153 2877709-93-6 实体瘤 BioNTech 
MEDI1191; MEDI-1191 2877712-03-1 实体瘤 Moderna
mRNA-2752 2878461-50-6 实体瘤 Moderna
SAR-441000 2879301-17-2 实体瘤 Sanofi, 
BioNTech 
SQZ-eAPC-HPV 2879306-51-9 HPV 和实体瘤 SQZ Biotechnologies

使 mRNA 癌症疫苗成为现实

近年来,我们在 mRNA 癌症技术方面取得了长足进步,但仍然存在一些根本性挑战。 首先,mRNA 癌症疫苗需要采用对目标组织/器官具有适当亲和力的特定包装和递送系统。 研究人员目前正在评估促进实现这一目标的方法,包括将器官靶向分子与寡核苷酸偶联。 尽管 LNP 是研究最多的 mRNA 递送载体,但由于存在细胞毒性且循环时间较短,其临床应用一直受到阻碍。 因此,目前人们正在评估各种替代的智能递送系统(如外泌体),以提高 mRNA 载体的生物利用度、装载和释放。

成功递送 mRNA 载体还不够。 为了确保疗效最大化,研究人员一直在研究提高蛋白质体内表达的方法。 mRNA 的所有部分(帽状结构、5' 端和 3' 端、开放阅读框以及多聚腺苷酸尾等)均可优化以增加蛋白表达。 化学修饰的核苷现已在这一领域显示出前景。

除了蛋白表达量外,mRNA 疫苗的一大关键阻碍是蛋白质生产周期相对较短,为此需要反复给药。 人们正在探索自扩增和环状 mRNA,以此作为延长 RNA 寿命和提高总蛋白质产量的策略。

虽然仍有很多工作要做,但无论是单独使用还是与现有治疗方案(如检查点抑制剂)联合使用,mRNA 疫苗都已经成为治疗多种癌症类型的通用临床选择。 在我们期待首批 mRNA 治疗药物上市的同时,探索多种创新战略成果以解决全球癌症负担同样令人兴奋。

如需了解有关 mRNA 疫苗和治疗方法的更多信息,请阅读我们在 ACS Pharmacology & Translational Science 上发布的同行评审期刊出版物。

下载由中国科学院文献情报中心和CAS 联合发布的《全球mRNA疫苗和治疗药物研究分析报告》完整电子版.

制药业能否战胜肥?

Terra Williams , CAS Content Scientist

male hands holding insulin pen

**更新于 2023 年 11 月 11 日**

最近,FDA 批准了礼来公司用于减肥的药物替泽帕肽(商品名 Zepbound™),目前已批准用于治疗 2 型糖尿病(商品名 Mounjaro™)。 Zepbound 是第一个也是唯一一个获得批准的激活两种肠促胰岛素激素受体(GIP 和 GLP-1)的治疗方法,用于解决体重过重的根本原因。有关此类新兴 GLP-1 受体激动剂背后科学的更多信息,请继续阅读我们之前于今年 7 月发表的文章。

最初发布于 2023 年 7 月 28 日。


减肥药Wegovy (司美格鲁肽注射液) 的宣传广告席卷了纽约地铁,这种减肥药一周只需使用一次。 Ozempic (司美格鲁肽) 也因名人们举办Ozempic聚会的传闻而登上头条。 趁着FDA近期批准的药物在全球越来越受欢迎的热潮,最新上市的药物Mounjaro (替尔泊肽) 也吸引了社交媒体的关注

GLP-1 受体激动剂 OzempicWegovy(均由诺和诺德公司生产)和复合药物 Mounjaro(由礼来公司生产)最初是为治疗 2 型糖尿病而设计,但由于客户追求其作为减肥药物的潜在功效,使得此类药物因这一需求的不断增长而出现短缺。 肥胖已经成为全世界关注的健康问题,影响着全球约三分之一的人口,到2035年这个比例预计将超过50%。 肥胖会增加人们罹患各种疾病的风险,如冠心病、高血压和II型糖尿病等。

为了应对这一日益严峻的危机,GLP-1受体激动剂及其与GIP类似物和相关疗法的潜在组合疗法,已经为治疗肥胖及其相关疾病提供了颇具前景的新可能。 随着这一领域的创新又向前迈进了一步,了解这些科学方法与减肥前景之间的差异将至关重要。

人体如何处理糖分并调节血糖水平?

人体有自己保持血糖平衡的方式。 当人体的血糖水平较低时,胰腺中的α细胞会分泌胰高血糖素,通知肝脏制造更多的糖,并将其释放到循环的血液中。 当血糖水平较高时,胰腺中的β细胞则产生胰岛素,帮助人体利用或储存脂肪、肌肉、肝脏以及其他人体组织中的糖。

抑胃肽 (GIP) 和胰高血糖素样肽-1 (GLP-1) 是肠道分泌的两种激素,它们在调节胰岛素的产生中起着至关重要的作用,因此对肥胖症和糖尿病也很重要。 胰岛素可调节血糖平衡,是人体的必需物质。 当人体的血糖水平较低时,胰腺中的α细胞产生胰高血糖素,向肝脏发出信号,从而产生更多糖。 当血糖水平较高时,胰腺中的β细胞会产生胰岛素,帮助人体使用或储存能量。

GIP 能够刺激产生胰岛素和胰高血糖素,保护产生胰岛素的细胞免于死亡,同时促进它们的增殖。 GLP-1能够刺激胰腺释放胰岛素,同时抑制胰高血糖素的释放。

如何通过药物控制肥胖?

到目前为止,有几种类型的药物可以控制糖尿病和肥胖。 司美格鲁肽 (以商标名Ozempic和Wegovy销售) 等GLP-1 受体激动剂通过模仿GLP-1的作用来刺激胰岛素的产生。 替尔泊肽 (商品名Mounjaro) 是GLP-1受体激动剂和GIP类似物的结合。 GLP-1受体激动剂与细胞中的胰高血糖素样肽-1受体结合,而GIP类似物则模拟GIP的功能。这两个过程都会刺激胰岛素的产生。 最近,出现了一种新药Retatrutide (瑞他肽) 这是一种GIP、GLP-1和胰高血糖素三受体激动剂,其在早期临床试验中取得了令人满意的结果,颇具前景。

以下是可被考虑用于减肥的药物和GLP-1受体激动剂的总结:

1. GLP-1受体激动剂,如司美格鲁肽 (Wegovy,Ozempic)。

2. 联合疗法

           a.GLP-1和GIP受体激动剂,如替尔泊肽 (Mounjaro)。

           b.GLP-1、GIP和胰高血糖素受体激动剂,如瑞他肽 (Retatrutide)。

减肥药背后的科学原理

激活GLP-1和GIP受体可以促进机体的糖脂代谢。 这会降低食欲和消化速度,同时促进减脂和降低罹患肥胖相关疾病的风险。 其主要作用包括:

  • 胰岛素分泌:当血糖较高时,GLP-1和GIP可刺激胰腺β细胞释放胰岛素。 这有助于降低血糖水平。
  •  
  • 胃排空:GLP-1和GIP可减缓食物从胃部进入小肠的过程。 这使得人们能有更长时间的饱腹感,从而降低食欲,减少卡路里的摄入。  
  • 食欲调节:GLP-1 和 GIP 可以影响控制饥饿和饱腹感信号的大脑区域。 这有助于降低食欲和食物摄入量,减少人们的饥饿感,更有满足感。   

组合疗法的重要性

采用组合疗法需要考虑的一个重要因素是协同作用。 协同作用是指多种药物组合使用的效果大于每种药物单独使用效果的总和。 GLP-1受体激动剂和GIP类似物组合用药的重要性在于,比起只调控两种主要激素中的一种,两种分子通路都会受到影响。 对于单一治疗药物 (如司美格鲁肽药物),人体和小鼠试验已经发现了对某些药物作用耐药性的产生。 而组合疗法是靶向多个信号通路的,因此有助于防止人体对药物作用产生耐受性。 组合疗法中需要考虑的另一个因素是用药剂量。 为避免某些副作用的产生,组合药物中可能会减少每种药物的用量。

临床试验和实际结果如何?

若干临床试验表明,与安慰剂或其他治疗方法相比,GLP-1受体激动剂药物和GIP/GLP-1受体激动剂组合药物可使糖尿病和/或肥胖症患者的体重显著减轻。  

发表于《新英格兰医学杂志》的多项著名研究强调了 司美格鲁肽替尔泊肽 的疗效。 在一项纳入1961名参与者的双盲研究中,持续68周使用2.4mg司美格鲁肽配合合理饮食和适度运动后,一半的参与者体重减轻了15%,三分之一的参与者体重减轻了20%。 相比之下,只改变了生活方式的对照组体重仅减轻少了2.4%。 在另一项涉及2539名参与者的研究中,使用5mg、10mg和15mg剂量替尔泊肽结合生活方式干预后,体重减轻25%及以上的参与者分别占15%、32%和36%。 生活方式干预组中仅有1.5%的参与者体重有所减轻。

比较替尔泊肽和司美格鲁肽治疗II型糖尿病患者的研究表明,替尔泊肽优于司美格鲁肽。使用替尔泊肽后,82-86%的患者糖化血红蛋白水平下降到了7%以下,而使用司美格鲁肽的患者这一比例为79%。

此外,靶向GLP-1、GIP和胰高血糖素等靶点的组合药物研究,似乎还揭示了更加值得注意的影响。 礼来公司近期的二期临床试验结果表明,个体平均体重减轻达到了约24%。 如果更大规模的三期临床试验能够进一步证实这些结果,上述组合用药疗法极有可能这些结果,上述组合用药疗法极有可能系列的拓展。

GLP-1受体激动剂和基于GIP疗法的普及和影响

在美国,媒体大肆宣传报道的Ozempic (司美格鲁肽) 处方量激增。 去年,Ozempic的处方量增加了111%。自2017年获批以来,Ozempic已经成为II型糖尿病市场的主流药物 (图1)。 尽管Ozempic主要被用于治疗II型糖尿病,但在2023年前,由于Wegovy (司美格鲁肽注射液) 短缺,其也被用于长期体重管理。

fig1-number-of-rx-by-drug
图 1:各药物的处方数量

2022 年 5 月在美国获批的 Tirzepatide(品牌名 Mounjaro)于 2023 年第一季度为礼来公司贡献了 5.376 亿美元的收入。 随着替尔泊肽获得美国FDA快速通道认证用于肥胖症的治疗,该药有望与同类药物司美格鲁肽展开竞争。

期刊发表趋势和专利分析

fig2-weight-loss-chartJPG
图 2. CAS 内容合集™中司美格鲁肽相关期刊和专利出版物的年度趋势

在 CAS 内容合集中对 Semaglutide 中的司美格鲁肽相关出版物检索表明,2019年到2022年之间,其相关期刊的数量不止翻了一番。 司美格鲁肽相关的专利也从2011年的2项增加到2022年的109项。 随着司美格鲁肽的流行热潮,学术界将开展更多相关研究,尤其是在体重管理方面。因此,预计会有更多的相关论文涌现。

fig3-weight-loss-chart
图 3. CAS 内容合集™ 中 Tirzepatide 相关期刊和专利出版物的年度趋势

替尔泊肽作为一种更加新兴的药物,根据CAS内容合集,在过去十年里相关出版物较少。 然而,与其相关的期刊出版物仍有所增多 (从2021年的34篇增加到了2022年的72篇)。 在此期间,替尔泊肽的相关专利亦有所增加。 随着替尔泊肽完成更多临床试验并获得FDA批准用于体重管理,预计将有更多相关论文发表。

在研产品线分析

糖尿病和减肥新药开发是一个欣欣向荣的研究领域,诺和诺德公司有多个颇具前景的候选药物正处于不同的临床试验阶段。 OW 口服 Semaglutide 仍处于 1 期阶段,用于糖尿病治疗的 25 毫克和 50 毫克 Semaglutide 则处于 3 期阶段。 此外,用于糖尿病治疗的口服 GLP-1/GIP 联合疗法正在进行 2 期试验。 Tirzepatide 目前正在进行治疗非酒精性脂肪性肝炎 (NASH) 的 2 期试验,以及治疗射血分数保留型心力衰竭 (HFpEF)、阻塞性睡眠呼吸暂停、肥胖症发病率和死亡率以及心血管预后的 3 期试验。 随着获得慢性肥胖症治疗的快速通道认定,Tirzepatide 即将通过监管部门的批准。 此外,礼来公司还有一种用于糖尿病治疗的 GIP/GLP 辅佐肽正在进行 1 期试验。

未来展望

随着全球肥胖症和 2 型糖尿病发病率的持续上升,GLP-1 受体激动剂和 GIP 疗法显示出了广阔的前景,发表的论文和研发产品线也在不断增加。 其成功和影响在处方的与日俱增和临床试验报告的积极结果中可见一斑。 减肥管理的下一个前沿领域将是联合疗法,包括目前的药物(如 Mounjaro)和 Retatrutide 的早期试验。 通过利用人体的天然激素反应,这些药物不仅为减肥和新陈代谢控制提供了新的方法,还有望引领其他疾病的治疗。 如需了解有关新兴疗法和关键进展的更多信息,请浏览我们有关 RNA 疗法外泌体脂质纳米颗粒等方面的深入洞察报告。   

 

 

探索新趋势:最值得关注的十大生物健康材料

CAS Science Team

Colorful Checked Vector Pattern

CAS与西湖大学 (Westlake University) 合作发布了“最值得关注的十大生物健康材料”洞察报告。这份报告重点介绍了水凝胶、抗微生物材料、脂质纳米粒、外泌体等材料的最新进展,它们正在重新定义生物材料的未来。 本报告揭示了生物材料涉及的众多行业和学科所面临的新机遇、新趋势和主要挑战。 在以下详细报告中了解更多信息。

Biomaterials-Fanned-Image

 

订阅