Même si un nombre croissant de nouveaux composés chimiques sont synthétisés chaque jour, on redoute de plus en plus une stagnation de l'innovation dans la recherche des petites molécules. Toutefois, les nouvelles recherches publiées par les scientifiques de CAS dans le numéro d'octobre 2019 du Journal of Organic Chemistry révèlent que le rythme de l'innovation dans les petites molécules accélère du point de vue structurel et livre des enseignements sur la découverte de nouveaux domaines fructueux qui mériteraient d'être approfondis lorsque les chimistes explorent un vaste espace chimique en grande partie inexploré.
Notre analyse met en évidence les changements de la diversité de l'infrastructure ou de l'échafaudage d'un grand nombre de composés organiques au fil du temps. Les résultats présentent une pertinence pratique pour l'exploration future de l'espace chimique et soutiennent un investissement supplémentaire dans des approches traditionnelles et émergentes pour la découverte de petites molécules. Alors que les entreprises s'efforcent de plus en plus de réaliser les investissements les plus efficaces et les plus rapides dans l'innovation, ces résultats peuvent aider à façonner les stratégies futures de découverte de petites molécules dans l'ensemble des secteurs.
Exploiter la puissance des données organisées
Le nombre de molécules organiques stables et susceptibles d'être synthétisées est estimé à 1063 pour celles dont le poids moléculaire est inférieur à 500 Da et à 10180 pour celles dont le poids est inférieur à 1000 Da. Face à un nombre aussi énorme de composés possibles, les chimistes ne pourront jamais échantillonner qu'une très petite partie de la diversité structurelle de l'espace chimique. Cela pose la question de savoir s'ils le font de manière efficace et productive. Dans la découverte de médicaments, il s'agit d'une préoccupation particulière, car l'impact humain potentiel de l'innovation est élevé, mais les contraintes budgétaires deviennent une préoccupation croissante, ce qui oblige les chercheurs à opter pour des approches plus efficaces de l'exploration d'un jeu de composés structurellement divers.
Un moyen de déterminer l'importance de l'espace chimique exploré dans la recherche de nouveaux composés consiste à analyser la diversité des substances connues et à examiner les tendances au fil du temps. Dans la mesure où les infrastructures chimiques sont un moyen simple sur le plan conceptuel de comprendre les fonctionnalités communes des molécules, CAS a utilisé des infrastructures ou des échafaudages (c'est-à-dire l'ensemble des systèmes annulaires d'un composé et des liens qui les relient) pour évaluer la diversité des substances connues. Chaque infrastructure peut être considérée comme une région du vaste espace chimique composée de molécules similaires, et le nombre de composés connus qui partagent une infrastructure donnée indique dans quelle mesure cette région a été explorée.
Le REGISTRE CASSM est une collection complète de plus de 150 millions de substances chimiques extraites par nos analystes scientifiques à partir d'articles de revues, de brevets et d'autres sources remontant à plus de 150 ans. Ce nombre considérable de données organisées de façon cohérente au sujet des substances se prête de façon unique à une analyse comparative détaillée sur une longue période. Dans cette étude, nous avons analysé un sous-ensemble de 30 millions de composés organiques pour lesquels des données d'infrastructure étaient disponibles et une date de divulgation claire pouvait être validée afin d'identifier les changements de diversité structurelle survenus au cours des dix dernières années. Une analyse approfondie de ce jeu de données nous a permis de déterminer les échafaudages, les types, la diversité et les distributions les plus fréquemment utilisés.
Qu'est-ce qui a été révélé et pourquoi est-ce important ?
Cette étude s'appuie sur notre analyse d'infrastructure précédemment publiée, qui a pris un instantané du REGISTRE CAS. Plus de dix ans se sont écoulés depuis la publication de cette première étude, ce qui nous a permis de comparer les données sur une décennie.
Le résultat clé indique que le nombre de nouveaux échafaudages au niveau du graphe/nœud dans le REGISTRE CAS a presque doublé au cours de la décennie 2008-2018. Cela démontre un degré élevé d'innovation et prouve que les scientifiques s'aventurent de plus en plus dans les régions inexplorées de l'espace chimique. La figure 1 présente le nombre d'échafaudages, classés par année de leur première publication, pendant des intervalles de 10 ans d'avant 1949 à 2018. Il est extrêmement encourageant d'avoir une confirmation si claire que l'innovation continue à accélérer, le volume de nouveaux échafaudages utilisés doublant presque tous les 10 ans.
Cette étude souligne également que l'exploration de l'espace chimique se poursuit sur deux voies : la réutilisation d'échafaudages précédemment utilisés (qui aboutit à des molécules présentant une certaine similitude structurelle avec les précédentes) et la création de nouveaux échafaudages (produisant des molécules structurellement nouvelles). Il s'agit d'une stratégie rationnelle et efficace qui est couramment utilisée dans la découverte de médicaments.
Il est également clair que la diversité des échafaudages a augmenté puisque l'ajout d'un grand nombre d'échafaudages a plus que compensé l'importante réutilisation d'un nombre relativement limité d'échafaudages existants. La plupart des nouveaux échafaudages reposaient sur des formes topologiques relativement nouvelles plutôt que sur d'anciennes formes avec de nouveaux échafaudages. Cela suggère que les scientifiques repoussent les limites de l'espace chimique connu.
Lisez dès maintenant l'article en accès libre « Changements récents dans la diversité des échafaudages de la chimie organique constatés dans le Registre CAS » dans le Journal of Organic Chemistry pour découvrir l'ensemble de la méthodologie, des données et de la discussion des résultats.
Cartographier l'exploration future
Ces résultats fournissent aux scientifiques des preuves de la progression jusqu'à ce jour et de l'opportunité considérable d'innovation qui existe encore dans la chimie des petites molécules. En outre, ils démontrent combien il est important de repousser les limites toujours plus loin. Cela dit, comprendre les domaines de l'espace chimique à explorer reste une décision critique pour assurer l'efficacité de l'innovation. La connaissance des espaces très explorés et sous-explorés guide les scientifiques dans la négociation du paysage et améliore les chances de succès en identifiant les zones prometteuses où l'activité reste limitée à ce jour. Une vue plus claire du paysage actuel de l'innovation sur un niveau structurel façonne également les efforts émergents d'exploitation des analyses de données avancées et de l'apprentissage machine pour accélérer l'innovation et identifier les espaces vides en utilisant l'espace chimique connu pour cartographier l'inconnu.
Vous aimeriez discuter de la personnalisation de cette approche pour articuler vos stratégies d'exploration de l'espace chimique ? Contactez-nous