整合关键数据,利用巴西的生物多样性推动创新

Steven P. Watkins , Scientific Data Engineer

Brazil Biodiversity

想象一下你家几辈人收集的那些经年累月的家庭照片: 把所有照片都收到一个地方,比如一个盒子里,这既不能让它们更具价值,也不会让它们更有意义,但很多人恰恰就是这么做的。 你要花很长时间才能找到一张想要的照片,也很难与他人分享。 由此可见,你的盒子珍藏经常就此束之高阁了。

有了当今的数字工具之后,检索、分享、整理自己的照片要比以前容易得多。 现在,你可以将照片快速上传到整理好的相册里,还能在世界上任何地方查看。 有了这种随时可用的资源之后,人们就会抛弃那些四处散落的照片盒子,转而使用数字工具创建更有效的收藏合集。

科学家在处理宝贵的研究数据时也面临同样的挑战。 仅仅将内容收集和汇总可不够;不经过合理的编排和整理,创新人员就无法充分利用这些信息。 从日常研究到实现人工智能、预测分析和机器学习等数字技术,强大的数据基础对几乎所有研发活动都至关重要。

保护巴西的生物多样性

巴西虽然拥有地球上 15%-20% 的生物物种,但在这丰富的物种资源之中,有很大一部分尚未被充分探索。 由于缺乏归类整理的信息,研究人员在检索、筛选,甚至对比相关化学物质时困难重重。 这也限制了他们识别新目标,以及在已有发现的基础上有所建树并推动创新的能力。

因此,圣保罗州立大学 (IQ-UNESP) 的研究人员找到了更好的方法以获取巴西独特生物资源的相关信息。 城市化和森林砍伐的加剧让稀有物种濒临灭绝,这也加大了人们对系统性收录数据的需求。 如果不能对样本进行快速处理和分类,这些与物质相关的信息可能会永远消失。

2018 年,保护重要信息的需求被进一步放大,当年的一场大火席卷了里约热内卢国家博物馆,稀有样本付之一炬,为研究造成了巨大的阻力。 为此,CAS 的专家们向巴西科学界提供了支持,联合 IQ-UNESP 管理并整合自然生物活性化合物的相关信息,以确保这些信息可供未来的研究使用。

CAS 的科学信息专家与巴西自然产物研究人员联合产出了一个经过归类整合且内容完善的自然产物合集。 相关数据被系统地收录到可以公开访问的 NuBBE 数据库(Nucleus for Bioassays, Biosynthesis and Ecophysiology of Natural Products Database:自然产物生物测定、生物合成与生理生态核心数据库)中,该项目由Vanderlan Bolzani博士【圣保罗州立大学化学系 (IQ-UNESP)】和Adriano Andricopulo博士【圣保罗大学圣卡洛物理研究所 (IFSC-USP)】发起。

CAS 团队利用他们深厚的科学知识和在数据管理方面的专业技术,从 30,000 多份相关科学出版物中摘录并处理信息。 最终的内容合集最大限度地提高了巴西自然生物活性化合物相关信息的访问机会和利用率,从而为创新提供支持。

nubbedb 标志立刻下载案例研究,了解 CAS 和 IQ-UNESP 如何合作建立数据合集,该合集记录了 54,000 多种代表巴西生物多样性的物质。

利用归类整合的可访问数据达成洞察

效率是及时创新的关键。 如果科学信息无法被获取、检索,或缺失可信度,将会阻碍科学发现。 事实上,10%-20% 的开发工作重复都是因为数据完的整性和可获取性问题造成的。 因此,研究团队必须能顺利访问大量一致、准确的科学和商业信息,否则就会导致代价高昂的延迟和错误。

过去几十年间,科学信息的体量和复杂程度都呈爆炸式增长,造成了数据断档、无序的混乱情况。 即使在内部系统,也有各种不同的数据来源,其提供的数据格式和质量都不相同。 因此,创建并维持整理有序且便于检索的数据库虽然困难重重,其重要性却更甚以往。

根据 FAIR Guiding Principles for scientific data management and stewardship(《FAIR科学数据管理和组织方式指导原则》), 保持数据的可寻性、可获取性、互操作性和循环使用性至关重要。 根据正确的语义和关联清理并规范数据是一项艰巨的任务,需要专业的技能并投入大量资源。 因此,很多组织都会聘请 CAS 这样的外部专家,为它们的数据快速赋能,实现成本效益。

科学专家实现数据价值最大化

一致、可靠的数据将提供强大的基础,确保您的团队和技术取得高效进展。 例如,一家受困于内部数据的可获取性和准确性问题的公司,通过与 CAS 合作,优化并规范其知识管理系统,每年为其研究人员节约了 3,300 多个小时

建立和维持优质的数据合集需要专业的技术。 CAS 聘请了数百名科学家,他们跨越不同学科、50 多种语言。 虽然算法能够为数据处理提供帮助,但是没有任何算法可以取代经验丰富的科学家,因为他们会解读各项研究结果,并在看似无关的信息块之间建立关联。

CAS 专家将根据您的具体项目为您收录定制的内容合集。 围绕您的确切需求构建解决方案,从而简化工作流程,提高可寻性,增强内外部资源投资的作用,从而加速实现各项计划。

CAS 现提供定制服务,帮助各组织解决数据收录和整合的挑战。 联系我们,用我们的专业技术为您的数据赋能。