新たに合成されて生み出される化合物は毎年増加傾向にある一方で、低分子発見におけるイノベーションの停滞が懸念されています。 しかし、CAS科学者が2019年10月に「Journal of Organic Chemistry」で公開した新しい調査では、構造的な観点から低分子のイノベーションは実際には加速していることがわかりました。また、同調査では広大でその多くが未探索である化学領域を化学者が踏み込むにしたがって、更に研究の対象となる有望な新分野が見つかっているという知見も提供しています。
CASの分析では、時間とともに多くの有機化合物群のフレームワークまたは骨格の多様性に変化がみられることが示されています。 調査結果は、将来の化学分野の探索に現実的な関連性があり、低分子発見への従来の手法と新たな手法に対する更なる投資を裏付けるものです。 組織が最も効果的で効率の高いイノベーションに向けて投資を進めている中で、これらの発見は様々な業界における低分子発見の今後に役立つ情報です。
収集されたデータの力を活用
合成できる可能性がある安定した有機分子の数は、1063(分子量500 Da未満)および10180(分子量1000 Da未満)と推定されます。 このように膨大な数の化合物が存在する中、化学者は化学領域の構造的多様性のごく一部のみを抽出して試すことしかできません。 このことは、化学者は、果たして効果的かつ生産的に研究できるのかという疑問を投げかけます。 これはイノベーションにおいて潜在的な人的影響が大きい一方で費用抑制も重要になりつつある創薬では特に懸念されます。研究者は、構造的に多様な化合物群を探索できるより効果的な手法を見つける必要に迫られています。
新しい化合物の探索において、探索済みの化学領域の範囲を判断する一つの方法は、既知の物質の広がりを分析し、長期的なトレンドを確認することです。 化学的フレームワークとは、概念的に分子の共通する特徴を簡単に理解する方法であるため、CASはフレームワークまたは骨格(すなわち、化合物の環系すべておよびそれらを連結するすべてのリンカー)を利用して既知の物質の多様性を評価しました。 各フレームワークは、膨大な化学領域で類似した分子を持つ部分であると考えることができ、特定のフレームワークを共有する既知の化合物の数はその領域が探索された程度を示します。
CAS REGISTRYSM は、CASのサイエンス専門アナリスト達がジャーナル記事、特許、その他の150年以上に遡る情報源から収集した150万以上の化学物質の包括的コレクションです。 この一貫して収集されてきた膨大な量の物質データは、他にはない長期に亘る詳細な比較分析に適しています。 この研究で、CASはフレームワークデータが利用可能な3,000万件の有機化合物群を分析しました。また、明確な公開日を検証することで過去10年間に生じた構造的多様性の変化を特定することができました。 このデータセットの詳細分析により、CASは最も使用頻度の高い骨格、種類、多様性、分布を特定することが可能となりました。
結果と考察
この研究は、CAS REGISTRYを概観したCASの公開済みのフレームワーク分析をベースとしています。 この最初の研究の公開から10年以上が経過してるため、10年間のデータを比較することが可能になりました。
主な発見は、CAS REGISTRYのグラフ/ノードレベルにおける新たな骨格の数が、2008年と2018年の10年間でほぼ2倍になったことです。 これはイノベーションが活発に行われていること、科学者が未探索の化学領域にますます手を広げていることを示しています。 図1は、初めて報告された年で分類した骨格の数を、1949年以前から2018年にかけて10年間隔で示したものです。 採用される新規の骨格のボリュームが10年ごとにほぼ倍増しており、イノベーションが一貫して加速していることを明解に示しています。
本研究ではまた、化学領域の探索が2つの方法で進んでいることにも焦点を当てています。以前使用された骨格の再利用(従来の分子と構造的類似性のある分子が発見される)および新しい骨格の作成(構造的に新しい分子の生成)の2つです。 これは創薬では一般的に使用されている理にかなった効果的な戦略です。
さらに、比較的少数の既存の骨格を過度に再利用する数よりも、新しい骨格が遥かに多く追加されていることから、骨格の多様性が向上していることも明白です。 大部分の新しい骨格は、従来の形状を持つ新しい骨格よりも、比較的新しいトポロジー的形状をベースにしていました。 これは、科学者が既知の化学領域の枠を超えようと努力していることを示唆しています。
全文は、Journal of Organic Chemistry誌、『Recent Changes in the Scaffold Diversity of Organic Chemistry As Seen in the CAS Registry(CASレジストリに見られる有機化学の骨格の多様性に関する最近の変化)』で一般公開されています。方法論をはじめ、データそして結果に関する考察をお読みください。
将来の探索のマッピング
これらの結果は、科学者にとって、低分子化学の現在までの進展とイノベーションの機会が今も大きく広がっている根拠となります。 また、さらに既存の枠を超えた研究の重要性も示しています。 しかしながら、効率よくイノベーションを進める上で、探索すべき化学領域の特定には依然として重要な判断が求められます。 どの領域が幅広く探索済みで、どの領域が探索が不十分かが分かれば、科学者は研究を取り巻く状勢を把握し、これまで研究が不十分だった有望な領域を特定することで成功の確率を高めることができます。 構造レベルでの現在のイノベーションの状勢をより明確に見ると、既知の化学領域を基に未知領域をチャート化することにより、空白分野を特定するといった高度なデータ分析と機械学習を用いた新たな取り組みがわかります。
化学領域の探索戦略に活かすための戦略として、このアプローチをどのようにカスタマイズできるかについて、ご興味がおありですか? CASにお問い合わせください。