此开源数据集包含文献、专利和其他公共资源(为 CAS COVID-19 抗病毒候选化合物数据集提供了超过 9,000 种物质)中收录的关于 COVID-19 蛋白质、病毒和疾病靶点的 290,000 多构效关系 (SAR) 数据。
作为科学信息解决方案专业机构,CAS 正与全球研究机构合作,应对COVID-19 带来的复杂而又快速变化的挑战。 作为美国化学会 (ACS) 的分支机构,CAS 致力于践行 ACS 的使命,持续开发、开放提供一系列资源(包括数据、工具、专业咨询等),以共同抗击 COVID-19。
为此,CAS 建立了一个开源数据集,专门收录文献、专利和其他公共资源中报道的关于 COVID-19 蛋白质、病毒和疾病靶点的构效关系 (SAR) 数据。 该数据集是 CAS COVID-19 抗病毒候选化合物数据集的配套数据集。 该数据集的许可条款支持研究人员无需支付任何费用即可利用这些数据进行研究、数据挖掘、机器学习和数据分析。
填写下表即可下载该数据集(和说明文件)
关于该数据集
本数据集采用 .CSV 格式,包含超过 29 万条构效关系数据,包括 IC50、EC50 和其他数值。 能够便捷地将 CSV 文件导入到电子表格工具(如 Microsoft Excel)。 数据按表头排列:cas_rn、蛋白质、治疗用途、活性类型、活性值、活性单位、来源等。 对于数据科学工具而言,例如可考虑使用 Python 编程语言的免费软件 SciKit-Learn、pandas library dataframes 等,将数据集部署到机器学习中。
如果您有任何疑问,或需要其他数据或服务来支持与 COVID-19 相关的研究或分析,请联系 CAS 客户中心。
其他 CAS COVID-19 资源
- CAS COVID-19 资源中心
- CAS COVID-19 抗病毒候选化合物数据集
- COVID-19 及其他与冠状病毒相关疾病的治疗药物和疫苗研发概览(ACS Central Science 中的综述文章)