ナレッジグラフを活用してCOVID-19の創薬に役立てる

Jacob Al-Saleem , Senior Scientific Content Engineer

CAS Biomedical Knowledge Graph thumbnail image

新しいCOVID-19治療薬の開発機会の加速

現在のところ、COVID-19の治療に承認された治療法はごくわずかです。新しい治療法の開発には何十年、そして数十億ドルかかることがあるわけですが、それなら既存の薬を新しい治療法に転用する機会はあるでしょうか? 最新のCAS Insights Reportでは、新しい関連性や洞察を明らかにすることで、CASナレッジグラフがいかにして転用の可能性のある医薬品を特定できるかを解説しています。

医薬品の転用は、素早く治療法を開発するための重要な手段です。 ただ、新しいタンパク質やウイルス、標的、経路および臨床情報など重要な情報と関連性をすべて集めることは困難な場合があります。 そんなときは、CASナレッジグラフによって、COVID-19治療に転用できる臨床候補の上位を特定することができます。

ナレッジグラフとは

ナレッジグラフでは、さまざまなソースのデータを組み合わせ、特定の領域をモデル化します。 データは、ノードとエッジとして記述されます。 ノードはデータの各ポイントを表し、そしてエッジはノード間の関係を表します。 以下の画像は、簡略化されたナレッジグラフの例です。どんな薬が血管の炎症を抑制する可能性があるかを予測しています。

データの関連性ノードとエッジを示すCASナレッジグラフ

図1 . ノードとエッジを使ってデータ間の関連性を示しているナレッジグラフの例


従来のデータベースだと表示されるのは直接関連性(転写因子STAT3の直接阻害剤)のみでしたが、ナレッジグラフだと、より深いデータの関連性まで表示できます。 この例では、ナレッジグラフでは経路のさらに下流で作用する阻害剤まで示されています。

COVID-19を掘り下げる - 小分子創薬

CAS生物医学ナレッジグラフは、人間のキュレーションによるCASコンテンツコレクションTMのデータと、一般公開されている生物医学データとを組み合わせます。

その結果、600万件を超える小分子をはじめ、24,000件の疾患および26,000件のヒトおよびウイルス遺伝子からなる高品質データが含まれています。 ナレッジグラフなら、従来の調査方法では不可能だった洞察が得られるようになります。

CASのアプローチには、COVID-19の潜在的な薬剤候補を明らかにするために、2つの中核的な要素が含まれています。

  • CASの科学者は、COVID-19に関連する20の生物学的プロセスを特定しました。 血液凝固、ウイルス侵入およびエンドサイトーシスなどのプロセスです。 そこで、例えばある疾患ノードは、重度のCOVID-19の病理の重要な側面である「サイトカインストーム」を表している、と言った具合になるわけです。
  • 文献での遺伝子発現における変化にも注目します。具体的には、SARS-CoV-2感染によって大幅に上方制御された遺伝子です。 関連する生物学的プロセスと、これらの遺伝子の4つ以上に関連する生物学的プロセスを特定するためにこれらが使用されました。 このプロセスには、炎症反応、血管新生およびRNA転写の負の調節が含まれます。
CASナレッジグラフの作成に使用されるデータ要素

図2 COVID-19治療薬の潜在的な小分子薬候補を特定するための2成分アプローチの概要図

ナレッジグラフで、以下が特定されました。

  • これらの生物学的プロセスとの関係を阻害または活性化する小分子
  • 上方制御された遺伝子を阻害する小分子

こういった分析により、COVID-19の治療薬への転用の可能性がある小分子が1,350個特定されました。

COVID-19の治療薬の新たな可能性の評価

可能性がある分子が特定されたら、その関連性の強さを評価し、それに応じてスコアに加算しました。 これを実行するために、各分子をランク付けするための新しいアルゴリズム手法を使用しました。 この式では、小分子間の関連性と、2成分アプローチで特定された遺伝子と生物学的プロセスとの相互作用とを評価しました。

たとえば、サイトカインストームは重要な関連性であると考えられていました。 そこで、まず小分子間の関連性と、2成分アプローチで特定された遺伝子と生物学的プロセスとの相互作用とを評価しました。 そしてその際、サイトカインストームなどの重要な関連性とその発生の希少性を考慮して、遺伝子と活性化関係にある小分子に対し、そのスコアの上方修正が行われました。

このようにして、すべての小分子を順位付けした表が作成されました。CASホワイトペーパーでは、上位50までを掲載しています。 以下の図2では、その結果よりスコア上位10の候補薬が表示されています。 ノードの大きさは、他のノードへの関連性の数に対応しています。

COVID-19治療の候補薬上位10を記載したナレッジグラフのネットワーク図
クリックして拡大" data-entity-type="file" data-entity-uuid="8b0840af-ea59-4d98-b438-1c0a04ae9f44" src="/sites/default/files/inline-images/knowledge-graph-network-diagram.png" />

図3 結果のスコア上位10の候補薬との関連性を示すネットワーク図。ノードの大きさは、他のノードへの関連性の数に対応している。

順位表にて特定されている上位50の候補薬のうち、11は現在COVID-19治療のために臨床試験中です。 これは今回の弊社結果の妥当性を表しています。

この生物医学ナレッジグラフでは、以前SARS-CoV-2または一般的なウイルス感染メカニズムに関連付けられていた4つの薬剤クラスが明らかになっています。 それら4つの薬剤クラスは以下のとおりです。

キナーゼ阻害剤

これは今回の結果で見つかった薬剤クラスでは、最大のものでした。 キナーゼはほとんどすべての生物学的プロセスに関与しており、その活性は多くの病気で調節不全になっています。 受容体型チロシンキナーゼ(RTK)は、多くのウイルスの細胞侵入に関与しています。 同定されたキナーゼ阻害剤は、EGF、FGF、PDGF、ALK受容体などのRTKに影響を与えるもの、およびBrutonチロシンキナーゼなどの非受容体型チロシンキナーゼなどでした。 受容体B-RAF、PKC、PIMおよびGSK-2betaを標的とするセリン-トレオニンキナーゼ阻害剤も、このナレッジグラフによって特定されました。

ヒストンデアセチラーゼ阻害剤(HDI)

HDIは、ヒストン脱アセチル化を減らすことで遺伝子発現を調節します。 HDIは、SARS-CoV-2の主要な細胞表面受容体であるアンジオテンシン変換酵素2(ACE2)と、既知のCOVID-19リスク因子であり、血液型の決定にも関与する酵素であるABOグリコシルトランスフェラーゼの両方の発現を低下させます。 HDIは、COVID-19の免疫反応に関与するケモカインとサイトカインのいくつかも調整します。よって、今回の結果にそれらが含まれていることは論理的です。

微小管調節剤

微小管は、チューブリンサブユニットで構成される微細線維です。 研究によると、SARS-CoV-2タンパク質は微小管または微小管関連タンパク質と相互作用することがわかっています。 弊社の結果では、ドセタキセル、コルヒチン、メベンダゾールなどの微小管調節剤が、SARS-CoV-2感染の阻害に役立つ可能性があることが明らかになりました。 コルヒチンはすでにCOVID-19感染患者の治療に向けた臨床試験中になっています。

プロテアーゼ阻害剤

同定されたプロテアーゼ阻害剤のうち、そのほとんどは、プロテアソーム阻害剤でした。 研究によると、ユビキチン-プロテアソーム系は、コロナウイルスに関連する疾患を含め、ウイルス複製とサイトカインストームに関与していることが示されています。 COVID-19との関連でプロテアーゼ阻害剤を探索するのは、論理的な選択です。 確かに、それら阻害剤のいくつかは、COVID-19治療薬としてすでに調査中になっています。 今回の結果にも、ボルテゾミブ、カルフィルゾミブ、サクサグリプチンなど、そのいくつかが含まれています。


関連性の力

CASのナレッジグラフを支える方法論は、COVID-19の治療法の候補薬同定に役立つほか、アルツハイマー病やパーキンソン病、自己免疫疾患、癌、さらには難病など、COVID-19以外の他の疾患での薬剤発見に大きな価値をもたらします。 弊社のナレッジグラフはスケーラブルそしてモジュラーでもあり、化学、栄養、再生可能エネルギーなど、科学のすべての分野に大きな価値を提供します。 そこには膨大な機会が広がっています。