Les modèles d'apprentissage automatique, qui utilisés dans le cadre d'applications de planification de la synthèse, sont largement limités à la chimie observée lors de l'apprentissage : on constate alors que la précision et la diversité de leurs prédictions sont souvent réduites dans les sous-espaces chimiques peu peuplés. En mesurant comment différents ensembles de données affectent les performances des modèles entrainés, nous sommes en mesure d'affirmer avec plus de force des informations en lien avec la couverture et la nouveauté attendues des solutions de planification de la synthèse. En parallèle, nous concevons des ensembles de données qui rendront plus accessibles des domaines scientifiques auparavant complexes.
Dans cette étude, les scientifiques de Bayer démontrent l'impact considérable des réactions sélectionnées par les scientifiques dans CAS Collection de contenus sur le pouvoir prédictif d'un modèle de planification de la synthèse. La précision de la prédiction des résultats dans des classes réactionnelles rares a augmenté de manière significative (32 points de pourcentage), permettant ainsi de développer la compréhension des notions nouvelles et utiles en chimie.
Demandez le rapport CAS Insights ou contactez notre équipe CAS Services personnalisés pour concevoir un ensemble de données permettant de rendre accessibles des domaines scientifiques stimulants.
Ce rapport CAS Insights est publié en collaboration avec les scientifiques de Bayer.
Auteurs :
- Miriam Wollenhaupt, titulaire d'un doctorat, experte en chimie numérique, Bayer AG
- Martín Villalba, titulaire d'un doctorat, expert en mathématiques appliquées, Bayer AG
- Orr Ravitz, titulaire d'un doctorat, solutions de planification des synthèses, CAS