La déformulation est le processus de détermination de la composition exacte de produits connus. À partir des proportions relatives connues des ingrédients, on détermine des quantités précises de chaque ingrédient. La déformulation est également connue sous le nom de rétro-ingénierie chimique.
La déformulation des produits chimiques permet aux laboratoires :
- D'extrapoler de nouvelles recettes à partir de formulations existantes.
- D'améliorer la veille concurrentielle.
- De comparer les produits concurrents.
- D'identifier les contrefaçons.
- De développer des produits sous étiquette privée.
Même si les chercheurs se sont tournés vers l'apprentissage machine pour la découverte et l'optimisation de produits et de matériaux chimiques, la déformulation est généralement réalisée de manière expérimentale avec l'aide de méthodes de chimie analytique. La quantité relativement limitée de données structurées disponibles pour les formulations chimiques entrave de nombreux efforts de déformulation gérés par l'IA. Une grande partie des données de formulation largement disponibles sont incomplètes et incohérentes en termes d'enregistrements d'ingrédients et de quantités.
Formation de modèles prédictifs pour concrétiser des suggestions rapides et gérées par les données de recettes de formulation.
La publication d'Industrial Engineering Chemistry Research, Toward Predictive Chemical Deformulation Enabled by Deep Generative Neural Networks, démontre qu'il est possible de former des modèles génératifs non supervisés, des auto-encodeurs variationnels (VAE), afin de permettre des suggestions rapides gérées par les données des recettes de formulation.
Un réseau neuronal VAE formé avec des données de formulation organisées par des scientifiques de CAS apprend des représentations significatives de formulations dans différentes classes de produits, comme les anti-transpirants et les soins buccaux, dont les performances sont supérieures en moyennes à celles des approches plus conventionnelles. Cet article démontre que cette approche « produit des estimations nettement plus précises que les méthodes voisines les plus proches, extrapole mieux pour obtenir des formulations nettement différentes des précédentes et fournit un moyen d'exploiter des jeux de données volumineux pour produire des capacités pertinentes sur le plan industriel. »
Les formulations organisées dans CAS Collection de contenus™ offrent des représentations cohérentes et hautement structurées des formulations et des identités chimiques de leurs composants. En raison de procédés d'organisation uniques qui utilisent à la fois des technologies spécialisées et une expertise scientifique, CAS est en mesure d'identifier de manière cohérente les composants chimiques de chaque formulation, leurs regroupements et leurs quantités. Les auteurs rapportent que « sans le jeu de données de CAS, la validation pratique de ces méthodes génératives pour les applications de déformulation n'aurait pas été possible. »
Découvrez ces résultats dans la publication complète, « Toward Predictive Chemical Deformulation Enabled by Deep Generative Neural Networks ».
Vous aimeriez atteindre des prédictions de déformulation plus précises ? CAS Services personnalisés adapte nos technologies spécialisées, notre expertise scientifique et notre contenu incomparable à vos besoins uniques.