La desformulación es el proceso que permite determinar la composición exacta de productos conocidos. Partiendo de las proporciones relativas de los ingredientes, se determinan las cantidades precisas de cada uno de ellos. La desformulación también se conoce como ingeniería química inversa.
La desformulación química de productos permite a las organizaciones:
- Extrapolar nuevas recetas a partir de formulaciones existentes.
- Mejorar la información sobre la competencia.
- Comparar productos que compiten entre sí.
- Identificar falsificaciones.
- Desarrollar productos de marca blanca.
Aunque los investigadores han recurrido al aprendizaje automático para el descubrimiento y la optimización de productos químicos y materiales, la desformulación se suele realizar de manera experimental con la ayuda de los métodos de la química analítica. La cantidad relativamente limitada de datos estructurales disponibles para las formulaciones químicas lastra muchas iniciativas de desformulación basadas en la IA. Buena parte de los datos de formulación fácilmente accesibles están incompletos y son incoherentes en cuanto a su registro de los ingredientes y las cantidades de estos.
Entrenamiento de modelos predictivos para obtener sugerencias de recetas de formulación basadas en datos con rapidez
El artículo Toward Predictive Chemical Deformulation Enabled by Deep Generative Neural Networks de Industrial Engineering Chemistry Research demuestra que es posible entrenar unos modelos generadores no supervisados, los autocodificadores variacionales (VAE), para obtener sugerencias de recetas de formulación basadas en datos con rapidez.
Una red neuronal VAE entrenada con datos de formulaciones seleccionados por los científicos de CAS aprende representaciones de formulaciones de varias clases de productos, como antitranspirantes y productos para el cuidado bucal, que han tenido mejores resultados, de media, que los métodos más convencionales. El artículo afirma que este enfoque “produce estimaciones que son considerablemente más precisas que los métodos de vecinos más cercanos, se extrapolan mejor a formulaciones que son muy distintas de las ya conocidas y proporcionan una manera de aprovechar conjuntos de datos grandes con fines relevantes desde el punto de vista industrial”.
Las formulaciones catalogadas en CAS Content Collection™ ofrecen representaciones coherentes y muy estructuradas de las formulaciones e identidades químicas de sus componentes. Gracias a unos procesos de selección exclusivos que utilizan tanto tecnologías especializadas como conocimientos científicos, CAS puede identificar de manera coherente los componentes químicos de cada formulación, sus grupos y sus cantidades. Los autores señalan que “sin el conjunto de datos de CAS, la validación práctica de estos métodos generadores para aplicaciones de desformulación no habría sido posible”.
Explore estos hallazgos en el artículo completo, “Toward Predictive Chemical Deformulation Enabled by Deep Generative Neural Networks”.
¿Le gustaría obtener predicciones de desformulación más precisas? CAS Custom Services adapta a sus necesidades nuestro excepcional conjunto de contenido, tecnologías especializadas y conocimientos expertos.