El papel creciente de la IA en el descubrimiento de fármacos basados en productos naturales

Krittika Ralhan , Scientist, ACS International India Pvt. Ltd.

genetic engineering and dna microarray

Los productos naturales son compuestos, sustancias o mezclas producidos por plantas, animales, microbios y otros integrantes del mundo natural. Los productos naturales se usan desde hace milenios para curar todo tipo de dolencias y, antes de la llegada de la medicina moderna, eran las únicas sustancias farmacéuticas que la humanidad tenía a su alcance.

Según las estimaciones de Organización Mundial de la Salud (OMS), alrededor del 80 % de la población mundial sigue usando actualmente la medicina tradicional. En los últimos cincuenta años, los productos naturales y sus derivados han proporcionado fuentes de nuevos medicamentos, pero el uso a gran escala de estos productos presenta algunos desafíos debidos a su escasa biodisponibilidad y a la complejidad de su síntesis química.

Con la llegada de la computación avanzada, la mejora de las instalaciones de almacenamiento de datos, el desarrollo de técnicas sofisticadas de procesamiento de lenguaje natural y las funciones basadas en el aprendizaje automático, los investigadores disponen ahora de nuevas herramientas eficaces que se pueden incorporar al estudio de los productos naturales. La inteligencia artificial (IA) está haciendo posibles nuevos avances, y la ciencia médica tiene la oportunidad de seguir aprovechando lo mejor de la naturaleza para curar diversas dolencias humanas.

Avances recientes en la investigación basada en la IA

Hemos examinado los datos de CAS Content CollectionTM, la mayor recopilación de información científica publicada seleccionada por expertos, para conocer el panorama de publicación reciente (de 2010 en adelante) de la IA en el campo de los productos naturales. En esta perspectiva global de la ciencia publicada en el mundo, hemos descubierto que la IA ha avanzado considerablemente en los últimos tiempos en áreas como la predicción de estructuras, la integración de datos y otras relacionadas con los productos naturales que están acelerando el descubrimiento de fármacos.

Nuestro análisis encontró más de 600 000 publicaciones científicas (incluidos artículos de revistas y publicaciones de patentes) relacionadas con la investigación de productos naturales desde 2010. Las publicaciones de revistas dominan el campo, y la proporción entre patentes y artículos de revistas se ha reducido en los últimos años, lo que apunta a un aumento del interés por la investigación académica, en detrimento de los productos comerciales. ¿Qué papel desempeña la IA en esta investigación? Hemos identificado varias áreas de la investigación sobre productos naturales en las que la IA, los algoritmos de aprendizaje automático y los estudios basados en redes neuronales están teniendo cierto impacto:

Fig. 1 - Gráfico de patentes y artículos de revistas
Figura 1. Número anual de publicaciones de revistas y patentes relacionadas con la investigación de productos naturales (mostradas como barras azules y amarillas, respectivamente) de 2010 a 2022.

 

  • Identificación de compuestos y dianas: la IA, con la ayuda de los algoritmos de aprendizaje automático, puede analizar los datos espectroscópicos para identificar y clasificar los compuestos presentes en los productos naturales. Eso agiliza la identificación y el aislamiento de las moléculas bioactivas. Por ejemplo, un artículo publicado en Nucleic Acids Research con un alto número de citas describe un servidor web , NRPSpredictor2, que usa la metodología del aprendizaje automático para realizar predicciones mejoradas sobre la especificidad de los sustratos de enzimas biosintéticas de productos naturales en bacterias. Las plantas y los microbios generan productos naturales como metabolitos secundarios usando unos genes conocidos como grupos de genes biosintéticos (BGC). La IA se está usando para predecir los BGC que pueden codificar estos metabolitos.
  • Descubrimiento de fármacos: la IA y algunos de sus campos secundarios, como el aprendizaje automático, se están aplicando en diferentes fases del proceso de descubrimiento de fármacos. Por ejemplo, los modelos de IA se usan para el cribado virtual de bases de datos de productos naturales, la predicción de moléculas de interés y la evaluación de sus propiedades farmacológicas. Las redes neuronales profundas (DNN) son esenciales para estas iniciativas, y los modelos generativos basados en la IA pueden predecir candidatos farmacológicos y acelerar proceso de descubrimiento de fármacos limitando el número de compuestos que deben pasar a la fase de validación experimental.
  • Predicción de la bioactividad: los modelos de aprendizaje automático pueden predecir y clasificar las actividades biológicas de los productos naturales a partir de las estructuras químicas por medio de técnicas 3D de coincidencia con farmacóforos basadas en redes neuronales profundas, lo que se conoce como modelos de relación cuantitativa de estructura-actividad y estructura-propiedad (QSAR y QSPR). Estos modelos pueden ayudar a identificar compuestos con potenciales terapéuticos concretos. En un estudio reciente se usaron métodos basados en el aprendizaje automático para realizar predicciones in silico para antibióticos eficaces contra Acinetobacter baumannii, lo que llevó al descubrimiento de la abaucina, que presenta actividad bactericida contra A.baumanni. En otro estudio, una estrategia basada en la IA en la que se utilizó un conjunto de datos entrenado con productos naturales bacterianos ayudó a descubrir la actividad antibiótica de la halicina.
  • Optimización del proceso de extracción: la IA puede ayudar a optimizar los parámetros de extracción para obtener la máxima producción de compuestos bioactivos a partir de fuentes naturales. Esto reduce el tiempo y los recursos necesarios para probar candidatos con interés farmacológico.
  • Integración y análisis de datos: la IA facilita la integración y el análisis de enormes cantidades de datos procedentes de estudios sobre genómica, proteómica y metabolómica. Esta estrategia integral permite entender mejor las complejas interacciones que se dan en los sistemas naturales.
  • Predicción de sinergias: las herramientas de IA pueden predecir interacciones sinérgicas entre diferentes compuestos y ayudar a los investigadores a formular terapias combinadas a base de productos naturales. Esto es especialmente útil para hacer frente a enfermedades complejas.
  • Predicción de la toxicidad: los modelos de IA pueden predecir la toxicidad potencial de los compuestos naturales, lo que garantiza la seguridad de estos productos antes de usarlos para crear fármacos o suplementos para la salud.
Fig. 2 - Análisis de integración de datos
Figura 2. Ilustración que representa los usos de la IA y el aprendizaje automático en la investigación de productos naturales.

El interés por la IA y la investigación de productos naturales ha experimentado un rápido crecimiento en los últimos años, lo que se ha materializado en 650 publicaciones de revistas y patentes y un incremento similar en la proporción entre patentes y artículos de revistas que indica un mayor interés comercial. Aunque sigue siendo un número de publicaciones relativamente bajo, ha habido un aumento gradual entre 2010 y 2022, con un incremento brusco desde 2020 (figura 3). Descubrimos que China domina el panorama de las publicaciones, seguida por Estados Unidos y la India, lo que refleja el uso prevalente de productos naturales en la medicina tradicional china y la introducción del Plan de desarrollo de inteligencia artificial de nueva generación de China (2015-2030), que tiene la finalidad de desarrollar las capacidades de IA en el país.

El interés está creciendo también en el resto del mundo. Hemos encontrado organizaciones que publican sobre estos temas en Brasil, Corea del Sur, Alemania, Reino Unido, Portugal, Polonia, etc. Las iniciativas de descubrimiento de fármacos en fase de investigación también tratan una amplia gama de posibilidades.

Oportunidades para la IA en el descubrimiento de fármacos

La IA puede desempeñar un papel importante en la identificación, la clasificación y la predicción de la actividad de los productos naturales. Las plantas son una fuente conocida de diversos metabolitos secundarios bioactivos, como los alcaloides y los flavonoides, con propiedades antivirales, antineoplásicas, antibacterianas y antifúngicas. Los programas y las tecnologías basados en la IA pueden revisar y analizar los productos naturales para ver si presentan estas propiedades a una velocidad superior y asimilar los datos de una manera eficiente, lo que permite predecir la actividad biológica y acelera el descubrimiento de fármacos.

Por ejemplo, se han explorado diferentes especies de hongos (setas) para estudiar sus propiedades antineoplásicas, inmunomoduladoras, antineurodegenerativas, antiinflamatorias y antioxidantes. Se pueden usar algoritmos basados en la IA y el aprendizaje automático para clasificar nuevas especies de setas e identificar sus productos naturales mediante el reconocimiento basado en imágenes, diseñar estrategias para optimizar la extracción de productos naturales de los hongos y encontrar nuevos usos y propiedades de diferentes setas o de otras especies de hongos (figura 5).

Fig. 3 - Número de publicaciones de revistas
Figura 3. Número anual de publicaciones de revistas y patentes en el campo de la IA para la investigación de productos naturales (mostradas como barras azules y amarillas, respectivamente) entre 2010 y 2022. El gráfico insertado representa el crecimiento de la relación entre patentes y revistas en esta área a lo largo de los cinco últimos años (2018-2022).

El panorama actual de la IA y los productos naturales

Hoy en día, la aplicación más frecuente de IA en el campo de los productos naturales son los agentes antitumorales (figura 4A), seguidos por los agentes antivirales y antibacterianos. Los documentos referentes a los analgésicos (medicamentos empleados para aliviar el dolor), que constituyen un porcentaje pequeño (2 %) de las aplicaciones principales, se han multiplicado por cinco entre 2021 y 2022 (figura 4B). Otras categorías de aplicaciones que han experimentado un crecimiento rápido son los agentes antiinflamatorios, los agentes antidiabéticos, los antineurodegenerativos y los agentes contra la malaria. Curiosamente, el porcentaje de documentos asociados con los agentes antibacterianos se ha reducido entre 2021 y 2022, lo que indica un menor interés de la comunidad científica por este campo.

Fig. 4A y fig. 4B
Figura 4. A. Gráfico circular que representa las principales aplicaciones en las que se usa la IA en la investigación de productos naturales. B Crecimiento de la IA con respecto a las aplicaciones más utilizadas a lo largo de los años (2010-2022).
Fig 5. Principales géneros de plantas
Figura 5. Principales géneros de (A)plantas y (B) hongos en relación con el uso de la IA en la investigación de productos naturales.

Hemos realizado un análisis de datos de sustancias con CAS Content Collection y hemos encontrado alrededor de 5000 sustancias que aparecen asociadas a la IA en la investigación de productos naturales en las publicaciones de revistas y patentes entre 2010 y 2022 (figura 6A). Un análisis más pormenorizado de las clases de sustancias sugiere que las moléculas pequeñas orgánicas e inorgánicas, las secuencias de proteínas y péptidos, los polímeros, los elementos y las sales son las más importantes. El número de sustancias clasificadas como moléculas pequeñas orgánicas e inorgánicas es casi sesenta veces superior a la siguiente clase de sustancias, las secuencias de proteínas y péptidos, y los elementos.

Entre las moléculas pequeñas orgánicas e inorgánicas, la quercetina es la que aparece en más ocasiones asociada al uso de la IA. La quercetina es un flavonol vegetal bioactivo con una gran capacidad antioxidante y antiinflamatoria. Ha mostrado potencial en el tratamiento del cáncer, el SIDA, la hipertensión y la diabetes. Recientemente, la quercetina, junto con el kaempferol (otra molécula pequeña que aparece con frecuencia combinada con el uso de la IA), ha demostrado un efecto positivo contra el virus de la COVID-19. La IA se está utilizando para diseñar modelos que ayudan a optimizar la extracción de la quercetina de fuentes vegetales, diseñar nuevos análogos de la quercetina y crear modelos para probar sus efectos antioxidativos y antineoplásicos.

Un análisis detallado de las secuencias de proteínas y péptidos permite ver que la vancomicina ha presentado el máximo grado de asociación con la IA, especialmente en el diseño de estudios relacionados con el ajuste de dosis para encontrar la dosis óptima. Del mismo modo, las técnicas de aprendizaje automático se han usado para estudiar la concentración de ciclosporina en los modelos de trasplantes renales. En la categoría de polímeros, el quitosano muestra el mayor grado de coincidencia con la IA, lo que tiene relación con los estudios centrados en la síntesis y las pruebas basadas en IA de las nanopartículas de quitosano para aplicaciones antimicrobianas.

Fig. 6 - Distribución de sustancias asociadas
Figura 6. (A) Distribución de sustancias asociadas con la IA en la investigación de productos naturales en el periodo comprendido entre 2010 y 2022 en CAS Content Collection. La tabla de mapa de calor correspondiente incluye las diez sustancias de esas clases con un mayor grado de coincidencia con la IA. (B) Crecimiento de las sustancias seleccionadas con la IA (marcadas con un asterisco rojo en el panel A) a lo largo de los años (de 2010 en adelante).

Perspectiva y oportunidades futuras

En la última década se ha producido una revolución en el uso de la IA en el descubrimiento de fármacos y el campo de los productos naturales no ha quedado al margen de esta transformación. La IA ha pasado de ser usada para la digitalización de la información sobre productos naturales a emplearse en los algoritmos basados en el aprendizaje automático que proporcionan predicciones de bioactividad y en los estudios recientes en los que los científicos utilizan redes neuronales para la minería del genoma y el diseño de moléculas inspiradas en productos naturales. Otras ramas secundarias de la IA, como BioNLP, que se basa en algoritmos que contienen una representación médica generalizada, se pueden usar incluso para extraer información de las publicaciones científicas con el fin de identificar nuevas plantas bioactivas o fuentes de productos naturales.

La IA ha provocado un cambio de paradigma en la investigación de los productos naturales, pero siguen existiendo algunos obstáculos. Uno de ellos es la desreplicación, necesaria para detectar la coincidencia con compuestos o moléculas ya descubiertos. Este problema se podría mitigar usando bases de datos y herramientas sofisticadas basadas en la IA. Otro desafío asociado a los productos naturales es que a menudo se descubren sin que haya dianas proteínicas conocidas. En estos casos, la IA puede ayudar a predecir las dianas.

La integración de la IA en la investigación de productos naturales está dando aún sus primeros pasos, y es importante que los modelos predictivos completen su entrenamiento para identificar y clasificar nuevos productos naturales. Mientras avanza esta investigación, las tendencias de publicación indican que el uso de la IA aumentará en diversas etapas de la investigación de productos naturales. Las oportunidades de encontrar nuevas moléculas con interés farmacológico a partir de fuentes naturales seguirán creciendo, con el consiguiente beneficio para el proceso de desarrollo farmacéutico y, en última instancia, para los pacientes. Puede obtener más información sobre nuestro trabajo reciente en la ampliación de la base de datos NuBBE de Brasil y sobre el efecto de mejorar los datos para optimizar las predicciones de la IA.