Os modelos de aprendizado de máquina que apoiam aplicações de planejamento de síntese são amplamente limitados à química vista no treinamento, e a precisão e a diversidade de suas previsões geralmente são diminuídas em subespaços químicos escassamente povoados. Ao medir como diferentes conjuntos de dados afetam o desempenho de modelos treinados, podemos fazer afirmações mais robustas sobre a cobertura esperada e a originalidade das soluções de planejamento de síntese e projetar conjuntos de dados que abrirão as portas de áreas da ciência que antes eram difíceis.
Neste estudo, os cientistas da Bayer demonstram o impacto significativo que as reações, com curadoria feita por cientistas, do CAS Content Collection têm sobre o poder preditivo de um modelo de planejamento de síntese. A precisão na previsão de resultados em classes de reações raras aumentou significativamente – um aumento de 32 pontos percentuais – expandindo a compreensão para uma química nova e útil.
Solicite o relatório do CAS Insights ou entre em contato com nossa equipe de Custom Services para projetar um conjunto de dados que abra as portas de áreas desafiadoras da ciência.
O Relatório do CAS Insights foi publicado em colaboração com cientistas da Bayer.
Autores:
- Miriam Wollenhaupt, Ph.D., Química computacional, Bayer AG
- Martín Villalba, Ph.D., Especialista em Matemática Aplicada, Bayer AG
- Orr Ravitz, Ph.D., Soluções de planejamento de síntese, CAS