El aprendizaje automático en la química: tendencias y oportunidades

Zach Baum , Information Scientist, CAS

machine learning hero image

A lo largo de los últimos veinte años, los avances de la inteligencia artificial (IA), en especial del aprendizaje automático, han transformado nuestra manera de abordar la investigación científica. Desde la cartografía de secuencias genómicas y el descubrimiento de nuevos antibióticos a la creación de modelos del impacto del cambio climático e incluso la exploración de la galaxia en busca de otros planetas con condiciones similares a las de la Tierra, la IA está transformando la investigación en innumerables disciplinas.

La química es una de las áreas de la ciencia en las que la IA está impulsando importantes avances. Nuestro último informe técnico, “Inteligencia artificial en la química: panorama actual y oportunidades futuras”, explora la conexión entre la IA y la química usando nuestras propias tecnologías para analizar el panorama de las publicaciones y las patentes. Hemos identificado las áreas de la química que están liderando el campo con la IA y las que tienen un gran potencial que la adopción de la IA puede hacer realidad.

¿En qué campos de la química ha crecido la IA?

El número de publicaciones y patentes químicas relacionadas con la IA se ha disparado y, en el periodo comprendido entre 2015 y 2020, se ha multiplicado por seis. Hemos identificado las disciplinas que han aportado más publicaciones y patentes, y las hemos comparado para entender qué áreas están sacando partido de esta tecnología emergente. Entre las disciplinas que lideran la adopción de la IA se incluyen la química analítica, la bioquímica, la química industrial y la ingeniería química, mientras que las áreas que presentan oportunidades para la adopción de la IA son, entre otras, los productos naturales y la química orgánica (figura 1).

Visualización de varios gráficos que muestran las disciplinas de la química en las que se usa el aprendizaje automático
Figura 1: máximo porcentaje de publicaciones relacionadas con la IA en todas las disciplinas

Exploramos las relaciones entre estas publicaciones y patentes de 2000 a 2020 para entender cómo ha ayudado la IA a los investigadores a resolver problemas (figura 2). Por ejemplo, entre los primeros años de la década de 2000 y 2014, las publicaciones y patentes relacionadas con la IA pasaron de explorar el diagnóstico de enfermedades en humanos a la creación de algoritmos genéticos y su aplicación en el descubrimiento de fármacos y el microARN.

Recientemente, al cambiar los tipos de problemas que requieren soluciones, las publicaciones y las patentes se han desplazado hacia la metilación del ADN y el cáncer. Y hace poco el interés ha empezado a centrarse en el descubrimiento de fármacos relacionados con la COVID-19.

Cronograma que muestra la evolución de los conceptos concurrentes en las publicaciones de revistas de química relacionadas con la IA entre el año 2000 y 2020
Figura 2: evolución de los conceptos concurrentes en las publicaciones de revistas de química relacionadas con la IA entre el año 2000 y 2020

Como era de esperar, nuestra investigación también mostró que las moléculas pequeñas eran el campo más tratado en las publicaciones y patentes sobre la IA que se analizaron. Esto incluye temas como el descubrimiento de fármacos, la retrosíntesis y la optimización de reacciones, lo que refleja dónde suelen concentrarse las inversiones de las empresas farmacéuticas. 

¿Dónde están las oportunidades para aplicar el aprendizaje automático en la química?

En nuestro análisis de más de 70 000 publicaciones, examinamos colaboraciones interdisciplinares, especificando las disciplinas principal y secundaria (figura 3). Eso nos permitió representar todas las disciplinas en un mapa de calor en el que la intensidad de color refleja la proporción de contribuciones para las distintas disciplinas. De un vistazo, podemos identificar las áreas de la química que están liderando la aplicación de la IA y las que tienen potencial aún no explotado.

Gráfico que muestra un mapa de calor de las disciplinas principal y secundaria que usan la inteligencia artificial en sus procesos
Figura 3: prevalencia relativa de los estudios interdisciplinares publicados en artículos de revistas (las columnas indican las áreas principales de investigación; las filas, las áreas secundarias; y cada cuadrado, una pareja interdisciplinar de áreas de investigación principal y secundaria)

Por ejemplo, las publicaciones interdisciplinares son más frecuentes en la química analítica y la bioquímica, mientras que los algoritmos de aprendizaje automático se están usando para mejorar el análisis de proteínas, péptidos, lípidos y ácidos nucleicos, así como para predecir reacciones químicas e incluso descubrir nuevas moléculas. La IA se está usando también extensamente en la ciencia de los materiales y la química física, ya que las dos disciplinas tienen el objetivo de predecir materiales funcionales, relaciones entre estructura y propiedades, y formas de optimizar el proceso químico.

Las barreras para la adopción de la IA en la química

Algunos expertos destacados debatieron las barreras que obstaculizan la adopción de la IA en nuestro seminario web Inteligencia artificial en la química: panorama actual y oportunidades futuras. Identificaron tres barreras principales para la adopción de la IA en la química:

Calidad de los datos: las predicciones óptimas requieren conjuntos de datos fiables y de alta calidad que proporcionen ejemplos positivos y negativos para el entrenamiento. Acceder a los datos, normalizarlos y prepararlos resulta complicado para muchas organizaciones.

Tecnología: aunque la potencia computacional está aumentando (gracias a los sistemas cuánticos y la nube), siguen existiendo limitaciones perceptibles desde el punto de vista del usuario. Sin embargo, los avances realizados en los ámbitos del software y las interfaces de usuario eliminan la necesidad de contar con conocimientos de programación y permiten a más científicos utilizar el aprendizaje automático en su investigación.

Falta de personal: la falta de personal con formación en el campo de la ciencia de los datos es un hecho conocido, y los químicos no entienden lo accesible que es hoy en día la IA. Aumentar la colaboración entre la química y otras disciplinas científicas puede ayudar a acelerar la integración de la IA.

Una oportunidad para el crecimiento del aprendizaje automático en la química

La IA y los conjuntos de datos de entrenamiento se están usando para resolver problemas e innovar en numerosas instituciones científicas de todo el mundo, y abren la puerta a su aplicación en el análisis de datos y el descubrimiento de fármacos.

Nuestro informe técnico reciente ha revelado varias áreas de la química para las que podría ser beneficioso invertir en la tecnología de IA. Las barreras para la adopción son hoy en día excepcionalmente bajas, y socios como CAS pueden dar acceso a grandes conjuntos de datos de calidad para el análisis. La incorporación de la inteligencia artificial a la investigación científica puede ayudar a resolver algunos de los problemas más apremiantes y abrir nuevas oportunidades inaccesibles con el análisis de datos tradicional.

Obtenga más información sobre nuestros análisis y sobre las conclusiones extraídas leyendo el informe técnico o contacte con CAS si tiene alguna pregunta sobre el uso de la tecnología de IA para impulsar su investigación.