Le rôle émergent de l'IA dans la recherche de médicaments à base de produits naturels

Krittika Ralhan , Scientist, ACS International India Pvt. Ltd.

genetic engineering and dna microarray

Les produits naturels sont des composés, des substances ou des mélanges produits par des végétaux, des animaux, des microbes et d'autres membres du monde naturel. Pendant des millénaires, on a utilisé des produits naturels pour soigner toutes sortes de maux et avant l'avènement de la médecine moderne, il s'agissait des seuls produits pharmaceutiques dont disposait l'humanité.

Selon l'Organisation mondiale de la santé (OMS), environ 80 % de la population mondiale actuelle feraient appel à la médecine traditionnelle. Au cours des 50 dernières années, les produits naturels et leurs dérivés ont continué d'être à l'origine de nouveaux médicaments, mais l'utilisation de ces produits à grande échelle présente des difficultés majeures, en raison de leur biodisponibilité insuffisante et de la complexité de leur synthèse chimique.

Avec l'avènement de l'informatique avancée, l'amélioration des installations de stockage des données, les techniques de pointe de traitement du langage naturel et les fonctionnalités basées sur l'apprentissage machine, les chercheurs disposent désormais de nouveaux outils puissants pour étudier les produits naturels. L'intelligence artificielle (IA) a ouvert la voie à de nouveaux progrès et la science médicale a la possibilité de continuer à exploiter le meilleur de ce que la nature peut offrir pour soigner les maladies humaines.

Les progrès récents de la recherche basée sur l'IA

Nous avons examiné les données de CAS Collection de contenusTM, la plus vaste collection d'informations scientifiques organisées par des humains, pour cartographier le paysage des publications récentes (depuis 2010) de l'IA dans le domaine des produits naturels. Grâce à notre point de vue global sur les publications scientifiques du monde entier, nous avons découvert que l'IA avait énormément progressé récemment dans des domaines tels que la prédiction des structures, l'intégration des données et plus encore, avec des produits naturels qui accélèrent la découverte de médicaments.

Notre analyse a mis en lumière l'existence de plus de 600 000 publications scientifiques (notamment des articles de revues et des publications de brevets) liés à la recherche sur les produits naturels depuis 2010. Les publications dans les revues dominent ce domaine et le ratio de brevets par rapport aux articles a diminué ces dernières années, ce qui semble indiquer un intérêt croissant pour la recherche universitaire par rapport à la commercialisation de produits. Quelle est la place de l'IA dans cette recherche ? Nous avons remarqué différents domaines de la recherche sur les produits naturels dans lesquels l'IA, les algorithmes d'apprentissage machine et les études basées sur des réseaux neuronaux ont un impact majeur :

Fig. 1 Tableau des publications d'articles et de brevets
Figure 1 : Nombre annuel de publications d'articles et de brevets dans la recherche sur les produits naturels (illustré sous forme de barres bleues et jaunes, respectivement) de 2010 à 2022.

 

  • Identification des composés/cibles : l'IA, épaulée par des algorithmes d'apprentissage machine, est en mesure d'analyser les données spectroscopiques pour identifier et caractériser les composés présents dans les produits naturels. Cela accélère le processus d'identification et d'isolation des molécules bioactives. Par exemple, un article fréquemment cité publié dans Nucleic Acids Research décrit un serveur Web, NRPSpredictor2, qui utilise la méthodologie de l'apprentissage machine pour améliorer les prédictions de spécificité des substrats des enzymes biosynthétiques de produits naturels dans les bactéries. Les végétaux et les microbes produisent des produits naturels en tant que métabolites secondaires en utilisant des gènes appelés groupes de gènes biosynthétiques (BGC). On utilise l'IA pour prédire les BGC qui peuvent encoder pour ces métabolites.
  • Recherche de médicaments : l'IA et ses sous-domaines tels que l'apprentissage machine sont utilisés à différents stades du parcours de recherche de médicaments. Par exemple, les modèles d'IA sont utilisés pour la sélection virtuelle de bases de données de produits naturels, la prédiction des candidats médicaments potentiels et l'évaluation de leurs propriétés pharmacologiques. Les réseaux de neurones profonds (DNN) sont essentiels à cette fin et des modèles génératifs basés sur l'IA permettent de prédire les candidats médicaments et d'accélérer le pipeline de la recherche de médicaments en affinant le nombre de composés destinés à une validation expérimentale.
  • Prédiction de la bioactivité : les modèles d'apprentissage machine sont en mesure de prédire et de classer les activités biologiques des produits naturels à partir de structures chimiques en utilisant des approches de correspondance de pharmacophores en 3D basées sur des réseaux de neurones profonds, appelés modèles de relation quantitative structure à activité/propriété (QSA/PR). Ces modèles peuvent faciliter l'identification de composés possédant un potentiel thérapeutique spécifique. Dans une étude récente, on a utilisé des méthodes basées sur l'apprentissage machine pour procéder à des prédictions in silico pour les antibiotiques contre Acinetobacter baumannii, ce qui a finalement abouti à la découverte de l'abaucine, qui possède une activité bactéricide contre A.baumanni. Dans une autre étude, une approche basée sur l'IA utilisant un jeu de données entraîné sur des produits bactériens naturels a permis de découvrir le rôle antibiotique de l'halicine.
  • Optimisation des procédés d'extraction : l'IA peut faciliter l'optimisation des paramètres d'extraction pour obtenir des rendements maximaux des composés bioactifs issus de sources naturelles. Cela réduit le temps et les ressources nécessaires pour tester les candidats médicaments.
  • Intégration et analyse des données : l'IA facilite l'intégration et l'analyse de vastes quantités de données à partir d'études de génomique, de protéomique et de métabolomique. Cette approche holistique permet de mieux comprendre les interactions complexes au sein des systèmes naturels.
  • Synergies de prédiction‎ : les outils d'IA permettent de prédire les interactions synergiques entre différents composés, ce qui aide les chercheurs à formuler des traitements combinés utilisant des produits naturels. C'est particulièrement utile pour traiter les maladies complexes.
  • Prédiction de la toxicité : les modèles d'IA peuvent prédire la toxicité potentielle des composés naturels et, ainsi, garantir la sécurité de ces produits avant qu'ils ne deviennent des médicaments ou des compléments alimentaires.
Fig. 2 Analyse d'intégration des données
Figure 2 : Illustration représentant les utilisations de l'IA et de l'apprentissage machine dans la recherche sur les produits naturels.

L'intérêt pour l'IA et la recherche sur les produits naturels s'est rapidement développé au cours des dernières années, avec 650 publications d'articles et de brevets et une hausse correspondante du ratio brevets-articles, ce qui témoigne d'un intérêt commercial croissant. Malgré ce nombre relativement limité de publications, celles-ci ont régulièrement augmenté de 2010 à 2022, pour atteindre des sommets depuis 2020 (figure 3). Nous avons constaté que la Chine domine le paysage des publications, suivie par les États-Unis et l'Inde, ce qui est lié à l'utilisation répandue de produits naturels dans la médecine traditionnelle chinoise et au lancement du Plan de développement d'une intelligence artificielle de nouvelle génération en Chine (2015-2030), qui a pour objectif de développer les capacités liées à l'IA en Chine.

Cet intérêt grandit également dans le monde entier : nous avons remarqué que des organisations avaient publié à ce sujet au Brésil, en Corée du Sud, en Allemagne, au Royaume-Uni, au Portugal, en Pologne et dans bien d'autres pays encore. Les efforts de recherche de médicaments à l'étude couvrent également un certain nombre de possibilités.

Opportunités pour l'IA dans la recherche de médicaments

L'IA peut jouer un rôle dans l'identification, la classification et la prédiction de l'activité des produits naturels. Les végétaux sont une source connue de différents métabolites secondaires bioactifs, tels que les alcaloïdes et les flavonoïdes, qui possèdent des propriétés antivirales, anticancéreuses, antibactériennes et antifongiques. Les programmes et technologies basés sur l'IA sont en mesure d'examiner et d'analyser les produits naturels à la recherche de ces propriétés à un rythme plus rapide et d'assimiler les données efficacement, ce qui leur permet de prédire l'activité biologique et d'accélérer le processus de recherche de médicaments.

Par exemple, différentes espèces de champignons ont été étudiées pour leurs vertus anticancéreuses, immunomodulatrices, anti-neurodégénératives, anti-inflammatoires et antioxydantes. Les algorithmes basés sur l'IA et le ML peuvent être utilisés pour classer les nouvelles espèces de champignons et identifier leurs produits naturels en utilisant la reconnaissance d'images, trouver des stratégies permettant d'optimiser l'extraction des produits naturels des champignons et cartographier de nouvelles utilisations et propriétés des différents champignons ou d'autres espèces fongiques (figure 5).

Fig. 3 - Nombre de publications dans les revues
Figure 3 : Nombre de publications d'articles de revues et de brevets par an dans le domaine de l'IA pour la recherche de produits naturels (illustrés sous forme de barres bleues et jaunes, respectivement) de 2010 à 2022. (L'encadré représente la croissance du ratio des brevets par rapport aux articles dans ce domaine au cours des cinq dernières années (2018-2022)).

Le paysage actuel de l'IA et des produits naturels

L'utilisation la plus courante de l'IA dans les produits naturels concerne aujourd'hui les agents antitumoraux (figure 4A), suivis des agents antiviraux et antibactériens. Le pourcentage des analgésiques (médicaments anti-douleur), qui était limité (2 %) par rapport à l'ensemble des principales applications, a été multiplié par cinq en termes de nombre de documents de 2021 à 2022 (figure 4B). Les autres catégories d'utilisation ayant connu une croissance rapide sont celles des agents anti-inflammatoires, antidiabétiques, anti-neurodégénératifs et antimalariques. Il est intéressant de noter que le pourcentage de documents associés aux agents antibactériens a diminué en 2021 et 2022, ce qui indique une baisse de l'intérêt de la communauté scientifique pour ce domaine.

Fig. 4A et Fig. 4B
Figure 4 : A. Graphique en anneau représentant les principales applications démontrant l'utilisation de l'IA dans la recherche sur les produits naturels. B Croissance de l'IA dans les utilisations les plus répandues au fil des années (2010-2022).
Fig. 5 - Principaux genres de végétaux
Figure 5 : Principaux genres de (A) végétaux et de (B) champignons utilisés par l'IA dans la recherche sur les produits naturels.

Nous avons procédé à une analyse des données sur les substances en utilisant CAS Collection de contenus et découvert environ 5 000 substances qui coexistent avec l'IA dans la recherche sur les produits naturels dans les articles et les brevets publiés de 2010 à 2022 (figure 6A). Des examens plus poussés sur les catégories de substances suggèrent que les plus importantes sont les petites molécules organiques et inorganiques, les séquences protéines-peptides, les polymères, les éléments et les sels. Le nombre de substances classées comme petites molécules organiques/inorganiques est presque 60 fois supérieur à celui de la catégorie de substances suivante, les séquences protéines-peptides et les éléments.

Parmi les petites molécules organiques/inorganiques, la quercétine est celle qui est la plus fréquemment citée en lien avec l'utilisation de l'IA. La quercétine est un flavonol végétal bioactif aux puissantes propriétés antioxydantes et anti-inflammatoires. Elle a déjà démontré son potentiel dans le traitement du cancer, du sida, de l'hypertension et du diabète. Récemment, la quercétine, ainsi que le kaempférol (une autre petite molécule souvent associée à l'utilisation de l'IA) a démontré un effet positif contre le virus de la COVID-19. L'IA est utilisée pour concevoir des modèles visant à optimiser l'extraction de la quercétine de sources végétales, concevoir de nouveaux analogues de la quercétine et créer des modèles permettant de tester ses effets antioxydants et anticancéreux.

Une inspection plus avancée des séquences protéines/peptides révèle que la vancomycine est celle qui est le plus souvent associée à l'IA, en particulier dans la conception d'études relatives aux ajustements de doses visant à identifier les posologies optimales. De même, on utilise des approches d'apprentissage machine pour modéliser la concentration de cyclosporine dans des modèles de transplantation rénale. Dans la catégorie des polymères, le chitosane est le plus souvent cité avec l'IA, dans le cadre d'études portant sur la synthèse basée sur l'IA et le test de nanoparticules de chitosane pour des applications antimicrobiennes.

Fig. 6 - Répartition des substances associées
Figure 6 : (A) Répartition des substances associées à l'IA dans la recherche sur les produits naturels de 2010 à 2022 selon CAS Collection de contenus. La table des fortes correspondances répertorie les 10 substances qui coexistent dans ces catégories. (B) Croissance des substances sélectionnées avec l'IA (marquées par un astérisque rouge dans le volet A) au fil des années (à partir de 2010)

Perspectives futures et opportunités

La décennie écoulée a été révolutionnaire dans le domaine de l'utilisation de l'IA pour la recherche de médicaments et le secteur des produits naturels ne fait pas exception à la règle. Autrefois utilisée essentiellement pour la numérisation des informations sur les produits naturels, l'IA produit désormais des algorithmes basés sur l'apprentissage machine qui fournissent des prédictions de bioactivité, jusqu'aux études récentes dans lesquelles les chercheurs ont utilisé des réseaux neuronaux pour l'exploration du génome et la conception de molécules inspirées de produits naturels. Les autres sous-branches de l'IA, telles que le BioNLP, ou traitement du langage naturel biomédical, basé sur des algorithmes qui contiennent un important volume syntaxique médical, peuvent même être utilisées pour extraire des informations des publications scientifiques afin d'identifier des végétaux bioactifs ou des sources de produits naturels plus récents.

L'IA a provoqué un changement de paradigme dans la recherche sur les produits naturels, mais certaines difficultés subsistent. L'une d'entre elles est la déréplication, dans laquelle les mêmes composés ou molécules sont découverts de façon répétitive. Ce problème pourrait être atténué par l'utilisation de bases de données et d'outils de pointe alimentés par l'IA. Autre défi lié aux produits naturels : ils sont souvent découverts sans protéines cibles connues. Dans ces situations, l'IA peut s'avérer utile en prédisant leurs cibles.

L'intégration de l'IA dans la recherche sur les produits naturels n'en est qu'à ses balbutiements, et il est important d'entraîner complètement les modèles prédictifs afin qu'ils soient en mesure d'identifier et de classer les nouveaux produits naturels. Tandis que ces recherches se poursuivent, les tendances dans les publications indiquent que l'IA occupera une place de plus en plus importante à différents stades de la recherche sur les produits naturels. Les opportunités de découverte de nouvelles molécules de médicaments issues de sources naturelles continueront à croître et le pipeline pharmaceutique - et finalement, les patients - en bénéficieront. Découvrez nos récents travaux sur l'extension de la base de données NuBBE au Brésil et l'impact de données de meilleure qualité pour améliorer les prédictions de l'IA.