Este conjunto de dados de código aberto contém mais de 290 mil dados de relação estrutura-atividade (SAR) direcionados a proteínas, vírus e doenças com foco na covid-19, disponíveis na literatura científica, patentes e outras fontes públicas das mais de 9 mil substâncias incluídas no conjunto de dados CAS covid-19 de compostos candidatos com atividade antiviral.
Como especialista em soluções de informação científica, o CAS está em parceria com organizações de pesquisa do mundo todo para enfrentar o desafio complexo e em rápida evolução do covid-19. Alinhado à nossa missão, como uma divisão da American Chemical Society, o CAS está disponibilizando uma ampla variedade de ativos, conhecimentos e recursos para apoiar essa luta.
Como parte deste esforço, o CAS criou um conjunto de dados de código aberto que contém dados de relação estrutura-atividade (SAR) direcionados a proteínas, vírus e doenças com foco na covid-19, disponíveis na literatura, patentes e outras fontes públicas. Este conjunto de dados está associado ao conjunto de dados CAS covid-19 de compostos candidatos com atividade antiviral. Os termos de licença do conjunto de dados dá suporte a aplicações, incluindo pesquisa, mineração de dados, aprendizado de máquina e análises sem nenhum custo.
Preencha o formulário abaixo para baixar o conjunto de dados (e o arquivo leia-me)
Sobre o conjunto de dados
O conjunto de dados está no formato de arquivo de valor separado por vírgula (.csv) e contém mais de 290.000 pontos de dados de bioatividade de estruturas, incluindo IC50, EC50 e métricas de potência adicionais. Os arquivos no formato CSV podem ser facilmente importados como dados para ferramentas de planilha, como o Microsoft Excel. Os dados são organizados por títulos de coluna: cas_rn; proteína; uso terapêutico; tipo de atividade; valor da atividade; unidade de atividade; fonte. Para ferramentas de ciência de dados, como o software livre SciKit-Learn, com linguagem de programação Python, os dataframes da biblioteca do Pandas podem ser utilizados para implantar o conjunto de dados para aprendizado de máquina.
Entre em contato com a Central do cliente CAS caso tenha dúvidas ou se deseja solicitar outros dados ou serviços para apoiar pesquisas ou análises relacionadas à covid-19.
Recursos adicionais do CAS covid-19
- Hub de recursos do CAS covid-19
- Conjunto de dados CAS covid-19 de compostos candidatos com atividade antiviral
- Research and Development on Therapeutic Agents and Vaccines for covid-19 and Related Human Coronavirus Diseases (leia o artigo na ACS Central Science)