Aunque cada año se sintetizan más compuestos químicos nuevos, el temor a que se esté estancando la innovación en el descubrimiento de moléculas pequeñas va en aumento. Sin embargo, las nuevas investigaciones publicadas por los científicos de CAS en el número de octubre de 2019 del Journal of Organic Chemistry revelan que, en realidad, el ritmo de la innovación en el campo de las moléculas pequeñas se está acelerando desde la perspectiva estructural y ofrecen información sobre la búsqueda de nuevas áreas de investigación con potencial en el enorme espacio químico mayoritariamente inexplorado.
Nuestro análisis pone de manifiesto algunos cambios en la diversidad de estructuras o andamios de un conjunto grande de compuestos orgánicos a lo largo del tiempo. Los resultados tienen importancia práctica para la exploración futura del espacio químico y aconsejan aumentar la inversión en las estrategias tradicionales y emergentes para el descubrimiento de moléculas pequeñas. Dado que las organizaciones se esfuerzan, cada vez más, por optimizar la eficacia y la eficiencia de las inversiones en innovación, estos resultados pueden ayudar a diseñar las estrategias de descubrimiento de moléculas pequeñas en distintos sectores en el futuro.
Aprovechar el poder de los datos seleccionados
Se estima que el número de moléculas orgánicas estables potencialmente sintetizables es de 1063 para las que tienen pesos moleculares de menos de 500 Da y de 10180 para las que tienen pesos moleculares inferiores a 1000 Da. Ante un número tan gigantesco de compuestos posibles, los químicos solo podrán muestrear una parte muy pequeña de la diversidad estructural del espacio químico. Por ello, cabe preguntarse si lo están haciendo de un modo eficiente y productivo. En el descubrimiento de fármacos, esta pregunta es especialmente pertinente, ya que el posible impacto de la innovación en la población es alto, pero el control de los costes es una necesidad cada vez más clara y los investigadores se ven obligados a buscar estrategias más eficientes para explorar un conjunto de compuestos estructuralmente diverso.
Una forma de determinar la proporción del espacio químico que se ha explorado para buscar nuevos compuestos es analizar la diversidad de las sustancias conocidas y las tendencias a lo largo del tiempo. Como las estructuras químicas son una forma conceptualmente sencilla de entender las características comunes de las moléculas, CAS utilizó las estructuras o andamios (es decir, todos los sistemas de anillo de un compuesto y todos los conectores que los unen) para evaluar la diversidad de las sustancias conocidas. Cada estructura se puede entender como una región del vasto espacio químico poblada por moléculas similares, y el número de compuestos que comparten una estructura indica en qué medida se ha explorado esa región.
CAS REGISTRYSM es una completa recopilación de más de 150 millones de sustancias químicas extraídas por nuestros analistas científicos de artículos, patentes y otras fuentes publicadas a lo largo de más de 150 años. Este gran conjunto de datos de sustancias seleccionados de manera sistemática es una herramienta especialmente útil para realizar análisis comparativos detallados a lo largo de un periodo de tiempo extenso. En este estudio, analizamos un subconjunto de 30 millones de compuestos orgánicos para los que disponíamos de datos sobre la estructura y de una fecha de divulgación clara que se podía validar con el fin de identificar los cambios que se han producido en la diversidad estructural a lo largo de los diez últimos años. Un análisis detallado de este conjunto de datos nos permitió determinar los andamios más frecuentes, sus tipos, la diversidad y las distribuciones.
¿Qué reveló el análisis y por qué es importante?
Este estudio amplía un análisis de estructuras anterior en el que realizamos una instantánea de CAS REGISTRY. Han pasado más de diez años desde la publicación de aquel primer estudio, lo que nos ha permitido comparar los datos de una década.
El hallazgo más importante es que el número de nuevos andamios en el nivel de gráfico/nodo en CAS REGISTRY casi se ha duplicado en los diez años transcurridos entre 2008 y 2018. Esto indica un alto grado de innovación y muestra que los científicos se están adentrando, cada vez con más frecuencia, en regiones inexploradas del espacio químico. La figura 1 muestra el número de andamios, clasificados por el año de la primera publicación, en intervalos de diez años desde antes de 1949 hasta 2018. Es muy alentador tener una confirmación tan clara de que la innovación se sigue acelerando y ver que el volumen de nuevos andamios utilizados se duplica prácticamente cada diez años.
El estudio también revela que la exploración del espacio químico está avanzando por dos caminos: la reutilización de andamios que ya se han usado anteriormente (lo que da como resultado moléculas que tienen cierta similitud estructural con las anteriores) y la creación de nuevos andamios (lo que produce moléculas estructuralmente novedosas). Esta es una estrategia racional y eficaz que se emplea habitualmente para el descubrimiento de fármacos.
También es evidente que la diversidad de los andamios ha aumentado, dado que el alto número de andamios nuevos añadidos ha superado con creces el número relativamente pequeño de andamios ya existentes que se reutilizan con frecuencia. La mayoría de los nuevos andamios se basaban en formas topológicas relativamente nuevas, en lugar de usar formas antiguas con andamios nuevos. Esto sugiere que los científicos están ampliando los límites del espacio químico conocido.
Lea el artículo de acceso abierto “Recent Changes in the Scaffold Diversity of Organic Chemistry As Seen in the CAS Registry” en el Journal of Organic Chemistry para conocer la metodología completa, los datos y el análisis de los resultados.
Trazar el mapa de la exploración futura
Estos hallazgos proporcionan a los científicos datos que demuestran el progreso realizado hasta la fecha y la enorme oportunidad de innovación que aún existe en la química de moléculas pequeñas. Además, ponen de manifiesto la importancia de ampliar aún más los límites. Dicho esto, determinar qué áreas del espacio químico se deben explorar sigue siendo una decisión clave para garantizar una innovación eficiente. Saber qué áreas están sobre e infraexploradas guía a los científicos por el panorama y mejora las probabilidades de éxito mediante la identificación de áreas prometedoras con una actividad limitada hasta la fecha. Una visión más clara del panorama de la innovación actual a nivel estructural también puede condicionar los esfuerzos dirigidos a usar el análisis de datos avanzado y el aprendizaje automático para acelerar la innovación e identificar las regiones no exploradas utilizando el espacio químico conocido para trazar la ruta hacia lo desconocido.
¿Le gustaría saber cómo se puede personalizar esta metodología para diseñar sus estrategias de exploración del espacio químico? Contacte con nosotros.