Organizar dados vitais para desbloquear a inovação da biodiversidade brasileira

Steven P. Watkins , Scientific Data Engineer

Brazil Biodiversity

Considere uma coleção de fotografias de família iniciada há muito tempo, fotos acumulando ao longo dos anos. Reunir todas as imagens em um só lugar, digamos, uma caixa de sapatos, como muitas pessoas fazem, não agrega valor ou as tornam mais úteis. Leva muito tempo encontrar a imagem que você está procurando e é difícil compartilhar com outras pessoas. Sendo assim, você deixa sua coleção de caixas de sapatos intocada e sem uso, esquecida em um armário.

Com as ferramentas digitais atuais, pesquisar, compartilhar e organizar suas fotos é mais fácil do que nunca. Agora, você pode fazer upload de imagens rapidamente em coleções organizadas que podem ser visualizadas em todo o mundo. Com esses recursos disponíveis, as pessoas estão deixando de lado caixas de sapatos cheias de fotos, optando por selecionar coleções poderosas digitalmente.

Os cientistas enfrentam desafios semelhantes com seus valiosos dados de pesquisa. Não é suficiente simplesmente coletar e reunir conteúdo; sem a estrutura e organização adequadas, os inovadores não podem utilizar plenamente essas informações. Uma base de dados robusta é crucial para quase todas as atividades de P&D, desde a pesquisa diária até a implementação de tecnologias digitais como IA, análise preditiva e aprendizado de máquina.

Preservando a biodiversidade do Brasil

Embora tenha de 15 a 20% da diversidade biológica da Terra, uma parte substancial da abundante biodiversidade do Brasil permanece pouco explorada. A falta de informações organizadas tornava extremamente difícil para os pesquisadores buscar, rastrear ou mesmo comparar substâncias químicas relevantes. Isso atrapalhava a capacidade de identificar novos objetivos, desenvolver descobertas anteriores e impulsionar a inovação.

Como resultado, pesquisadores da Universidade Estadual Paulista (IQ-UNESP) buscaram uma forma melhor de tornar acessíveis informações relevantes sobre a singular biodiversidade brasileira. O aumento da urbanização e do desmatamento que colocam em risco espécies raras intensificou a necessidade de curadoria sistemática de dados. As informações sobre as substâncias podem ser perdidas para sempre, a não ser que as amostras sejam processadas e categorizadas rapidamente.

A necessidade de preservar informações valiosas foi ampliada em 2018, quando um incêndio consumiu o Museu Nacional do Rio de Janeiro, impedindo pesquisas com perdas permanentes de amostras raras. Em resposta, os especialistas do CAS estenderam o apoio à comunidade científica no Brasil, em parceria com o IQ-UNESP para gerenciar e organizar informações sobre compostos bioativos naturais para garantir que estejam disponíveis para pesquisas futuras.

A colaboração entre os especialistas em informação científica do CAS e pesquisadores de produtos naturais do Brasil resultou em uma coleção organizada e refinada de produtos naturais. Os dados estão sendo sistematizados no Banco de Dados do Núcleo de Bioensaios, Biossíntese e Ecofisiologia de Produtos Naturais (NuBBE), de acesso público, projeto iniciado pela Professora Dra. Vanderlan Bolzani (Instituto de Química da Universidade Estadual Paulista – IQ-UNESP) e pelo Professor Dr. Adriano Andricopulo (Instituto de Física de São Carlos da Universidade de São Paulo – IFSC-USP).

A equipe do CAS usou seu profundo conhecimento científico e experiência no gerenciamento de dados para extrair e processar informações de mais de 30.000 publicações científicas relevantes. A coleção de conteúdo resultante maximiza o acesso e aumenta a utilidade dos compostos bioativos naturais do Brasil para que possam apoiar a inovação.

logotipo nubbedbBaixe agora mesmo o estudo de caso para saber mais sobre como a colaboração entre o CAS e o IQ-UNESP resultou em uma coleta de dados de mais de 54.000 substâncias da rica biodiversidade do Brasil.

Dados organizados e acessíveis possibilitam insights mais poderosos

A eficiência é a chave para a inovação na hora certa. Quando as informações científicas não estão acessíveis, nem confiáveis ou não podem ser pesquisadas as descobertas ficam muito mais difíceis. Na verdade, problemas de integridade e acessibilidade de dados fazem com que, de 10 a 20% de todo o trabalho de desenvolvimento precise ser refeito. Portanto, as equipes de pesquisa precisam de acesso contínuo a uma ampla gama de informações científicas e comerciais que sejam consistentes e precisas, ou correm o risco de atrasos e erros caros.

O volume e a complexidade das informações científicas explodiram nas últimas décadas, criando um cenário caótico de dados desconectados e desorganizados. Mesmo os sistemas internos têm uma variedade de fontes, que fornecem dados em diferentes formatos e níveis de qualidade. Sendo assim, criar e manter um repositório de dados bem-organizado e que possa ser pesquisado é uma tarefa desafiadora, mas mais importante do que nunca.

De acordo com os Princípios Orientadores FAIR para gerenciamento e administração de dados científicos, é essencial que os dados sejam localizáveis, acessíveis, interoperáveis e reutilizáveis. É difícil limpar e normalizar dados com o significado e as conexões semânticas corretas e exige habilidades especializadas e um investimento significativo de recursos. Como resultado, muitas organizações estão contratando especialistas externos, como o CAS, para liberar o poder de seus dados de forma rápida e econômica.

A experiência científica maximiza o valor dos dados

Uma base sólida de dados consistentes e validados garante que suas equipes e tecnologia possam avançar com eficiência. Em um exemplo, uma empresa que lutava com a acessibilidade e a precisão dos dados internos fez uma parceria com o CAS para harmonizar e padronizar seu sistema de gestão do conhecimento, economizando mais de 3.300 horas anuais de seus pesquisadores.

Construir e manter um conjunto de dados de alta qualidade requer conhecimento. O CAS emprega centenas de cientistas que abrangem uma ampla gama de disciplinas que, juntos falam mais de 50 idiomas. Embora os algoritmos possam ajudar no processamento de dados, nenhum algoritmo pode substituir a capacidade de cientistas experientes de interpretar descobertas e fazer conexões entre informações aparentemente díspares.

Os especialistas do CAS organizam coleções de conteúdo adaptadas ao escopo de seu projeto específico. Com base em suas exigências específicas, podemos simplificar os fluxos de trabalho, aumentar a visibilidade e aprimorar o impacto de investimentos de recursos internos e externos e acelerar uma grande variedade de iniciativas.

Os Serviços personalizados do CAS já ajudam organizações a resolver seus maiores desafios de integração e curadoria de dados. Entre em contato conosco para liberar o poder de seus dados com nossa experiência.