Embora sejam sintetizados um número crescente de novos compostos químicos a cada ano, há uma preocupação crescente de que a inovação possa estar estagnada na descoberta de moléculas pequenas. No entanto, uma nova pesquisa publicada por cientistas do CAS na edição de outubro de 2019 do Journal of Organic Chemistry revela que o ritmo da inovação de moléculas pequenas está realmente acelerando sob uma perspectiva estrutural e oferece insights sobre como encontrar novas áreas frutíferas para investigações adicionais, à medida que os químicos navegam por um vasto e amplamente inexplorado espaço químico.
Nossa análise destaca mudanças na estrutura ou diversidade de andaimes de um grande conjunto de compostos orgânicos ao longo do tempo. As descobertas têm relevância prática para a futura exploração química do espaço e apoiam mais investimentos em abordagens tradicionais e emergentes para a descoberta de pequenas moléculas. À medida que as organizações se esforçam cada vez mais por investimentos em inovação mais eficazes e eficientes, essas descobertas ajudam a informar futuras estratégias de descoberta de pequenas moléculas em todos os setores.
Aproveitando o poder dos dados com curadoria
O número de moléculas orgânicas estáveis potencialmente sintetizáveis é estimado em 1063 para as com peso molecular inferior a 500 Da e 10180 para as abaixo de 1.000 Da. Com um número tão imenso de compostos possíveis, os químicos só poderão tirar amostras de uma parte muito pequena da diversidade estrutural do espaço químico. Isso levanta a questão se eles estão fazendo isso de forma eficiente e produtiva. Na descoberta de medicamentos, essa é uma preocupação específica, pois o potencial impacto humano da inovação é alto, mas a contenção de custos é uma preocupação crescente, exigindo que os pesquisadores busquem abordagens mais eficientes para explorar um conjunto de compostos estruturalmente diverso.
Uma forma de determinar a extensão da exploração do espaço químico na busca por novos compostos é analisar a diversidade de substâncias conhecidas e observar as tendências ao longo do tempo. Como as estruturas químicas são uma maneira conceitualmente simples de entender as características comuns das moléculas, o CAS utilizou estruturas ou andaimes (ou seja, todos os sistemas de anéis de um composto e todos os ligantes que os conectam) para avaliar a diversidade de substâncias conhecidas. Cada estrutura pode ser pensada como uma região do vasto espaço químico que consiste em moléculas semelhantes, e o número de compostos conhecidos que compartilham uma determinada estrutura indica até que ponto essa região foi explorada.
O CAS REGISTRYSM é uma coleção abrangente de mais de 150 milhões de substâncias químicas extraídas por nossos analistas científicos de artigos de revistas, patentes e outras fontes que remontam a mais de 150 anos. Esse grande corpo de dados de substâncias com curadoria consistente se presta exclusivamente a análises comparativas detalhadas por um longo período de tempo. Neste estudo, analisamos um subconjunto de 30 milhões de compostos orgânicos com dados de estrutura disponíveis e data de divulgação clara, que poderia ser validada para identificar mudanças na diversidade estrutural que ocorreram nos últimos dez anos. A análise abrangente desse conjunto de dados nos permitiu determinar os andaimes, tipos, diversidade e distribuições mais usados.
O que foi revelado e por que isso é importante?
Este estudo se baseia em nossa análise de estruturas publicadas anteriormente, que tirou uma visão instantânea do CAS REGISTRY. Mais de dez anos se passaram desde a publicação desse primeiro estudo, o que nos permitiu comparar dados ao longo de uma década.
A principal descoberta é que o número de novos andaimes no gráfico de barras do CAS REGISTRY quase dobrou no intervalo de 10 anos entre 2008 e 2018. Isso mostra um alto grau de inovação e demonstra que os cientistas estão se aventurando cada vez mais em regiões inexploradas do espaço químico. A Figura 1 mostra o número de andaimes, categorizados por ano de primeiro relatório, em intervalos de dez anos de pré-1949 a 2018. É extremamente encorajador ter uma confirmação tão clara de que a inovação continua a acelerando, com o volume de novos andaimes utilizados dobrando quase a cada 10 anos.
O estudo destaca ainda que a exploração do espaço químico avança em duas vertentes: a reutilização de andaimes previamente utilizados (resultando em moléculas com alguma semelhança estrutural com as anteriores) e a criação de novos andaimes (produzindo moléculas estruturalmente novas). Esta é uma estratégia racional e eficaz geralmente usada na descoberta de medicamentos.
Também está claro que a diversidade de andaimes aumentou, pois a adição de um grande número de novos andaimes mais do que compensou a extensa reutilização de um número relativamente pequeno de andaimes existentes. A maioria dos novos andaimes foi baseada em formas topológicas relativamente novas, em vez de formas antigas com novos andaimes. Isso sugere que os cientistas estão expandindo os limites do espaço químico conhecido.
Leia agora o artigo com acesso aberto “Recent Changes in the Scaffold Diversity of Organic Chemistry As Seen in the CAS Registry” no Journal of Organic Chemistry para ver a metodologia completa, os dados e a discussão dos resultados.
Mapeando a exploração futura
Essas descobertas fornecem aos cientistas evidências do progresso até o momento e da tremenda oportunidade de inovação que ainda resta na química de pequenas moléculas. Além disso, elas destacam a importância de ampliar ainda mais os limites. Dito isso, continua sendo uma decisão crítica descobrir quais áreas do espaço químico explorar para garantir uma inovação eficiente. Saber quais áreas são amplamente exploradas e pouco exploradas orienta os cientistas na navegação pelo cenário e aumenta as chances de sucesso ao identificar áreas promissoras com atividade limitada até o momento. Uma visão mais clara do cenário de inovação atual em um nível estrutural também informa os esforços emergentes para alavancar a análise avançada de dados e o aprendizado de máquina que acelerem a inovação e identifiquem espaços em branco, utilizando o espaço químico conhecido para mapear o desconhecido.
Interessado em discutir como essa abordagem pode ser personalizada para fornecer informações para suas estratégias na exploração do espaço químico? Entre em contato conosco