Aprovechar el poder de los datos oscuros en la I+D de química: estrategias para el éxito

GettyImages-507492447_CAS-Insights-Hero-Image

¿Qué son los datos ocultos?

El poder de revolucionar la I+D está al alcance de las compañías químicas innovadoras. El enorme volumen de datos no utilizados, conocidos como "datos ocultos", permite a estas compañías obtener unos conocimientos sin precedentes y acelerar la innovación más que nunca. Si se implementan estrategias eficaces de gestión del conocimiento, las probabilidades de realizar descubrimientos y avances revolucionarios son ilimitadas.

Los datos ocultos suelen ser datos sin estructurar o semiestructurados poco accesibles en los que no resulta fácil hacer búsquedas. Se estima que el 55 % de los datos almacenados por las organizaciones son datos oscuros. A pesar de eso, alrededor del 90 % de los ejecutivos y directores globales de negocio y de TI coinciden en que todas las organizaciones tendrán que extraer valor de esos datos no estructurados para alcanzar el éxito en el futuro.

En el contexto de la I+D de química diversificada, esto podría incluir datos de cuadernos de laboratorio digitales, sistemas de gestión de información de laboratorio, informes experimentales, referencias bibliográficas y otros muchos contenidos que no se incorporan a las bases de datos que admiten búsquedas. Estos datos pueden ser valiosos para identificar materiales nuevos, mejorar las formulaciones existentes y acortar los ciclos de I+D.

Para aprovechar el valor de los datos ocultos, las organizaciones químicas diversificadas deben identificar dónde se ocultan sus datos más valiosos e implementar estrategias eficaces de gestión del conocimiento que les permitan consultar, recopilar, organizar y analizar esos datos cuando sea necesario.

En busca de las joyas ocultas: identificación de los datos de I+D de química más valiosos

Los datos ocultos podrían estar escondidos en cualquier punto del flujo de trabajo de I+D de química. Desde los pasos iniciales de la investigación hasta la fabricación, las formulaciones, la clasificación e incluso la monitorización posventa, se generan y se recopilan datos valiosos, pero es posible que no se aproveche todo su potencial. Para aprovechar el valor de los datos ocultos y acelerar la innovación, es crucial para las organizaciones de I+D identificar dónde se ocultan esos datos y desarrollar estrategias para acceder a ellos y usarlos de un modo eficaz.

Hay varios tipos de datos ocultos valiosos para la investigación. Por ejemplo, los datos experimentales históricos suelen estar dispersos, incompletos o desestructurados, pero, con un mínimo de organización y análisis, pueden proporcionar información valiosa para proyectos actuales o futuros. Al margen de las iniciativas de I+D de una organización, algunas fuentes de datos externas, como artículos académicos, patentes e informes del sector, también pueden ofrecer conocimientos valiosos y ayudar a identificar nuevas oportunidades de innovación e investigación. Por último, los datos no estructurados, como los datos de texto de artículos científicos o notas de laboratorio, pueden contener información oculta, pero es necesario contar con las herramientas y técnicas adecuadas para analizarlos de un modo eficaz.

Las organizaciones pueden identificar estos datos ocultos y acceder a ellos con los siguientes pasos cuando sea necesario en sus flujos de trabajo:

  • Realizar un inventario exhaustivo de las fuentes de datos disponibles, tanto internas como externas, estructuradas y sin estructurar, es esencial.
  • Asignar prioridades a las fuentes de datos en función de su valor potencial para las iniciativas de I+D actuales y futuras puede ayudar a las organizaciones a sacar el máximo partido de sus recursos. Por ejemplo, si tiene previsto aumentar la escala de la producción de un material funcional recientemente validado, es posible que desee priorizar el acceso a las formulaciones históricas y los datos de fabricación para facilitar la predicción de las condiciones ideales.
  • Fomentar una cultura de toma de decisiones basada en datos y mejora continua puede ayudar a las organizaciones químicas innovadoras a desarrollar todo el potencial de los datos ocultos.

Cinco estrategias de gestión del conocimiento esenciales para aprovechar los datos oscuros

Los conjuntos de datos seleccionados de forma personalizada, los marcos de trabajo semánticos, la minería de datos automatizada y los flujos de trabajo colaborativos son cruciales para aprovechar el valor de los datos ocultos e impulsar la innovación. A continuación, analizaremos con más detenimiento cómo pueden ayudar estas estrategias:

  1. Selección personalizada 
    La selección personalizada conlleva la selección manual de los datos químicos por expertos en los distintos dominios para crear conjuntos de datos de alta calidad que se adapten a las necesidades de la organización. Con la selección personalizada, los científicos especializados en materiales funcionales, cosméticos, agricultura u otros campos de la química diversificada pueden asegurarse de trabajar con datos actualizados que sean precisos y relevantes para sus objetivos de investigación. Al trabajar con seleccionadores de datos expertos, las organizaciones también pueden conectar la información internamente y con la ciencia del mundo, lo que añade solidez a sus datos internos. Puede ir aún más lejos e impulsar iniciativas de transformación digital basadas en la IA mediante la obtención de conjuntos de datos seleccionados de forma personalizada especialmente diseñados para los modelos de aprendizaje automático.

    Descargue este caso práctico para descubrir cómo mejoraron los conjuntos de datos de entrenamiento seleccionados la precisión y la transferibilidad de las predicciones de un modelo de IA. 
     
  2. Marcos de trabajo semánticos 
    Los marcos de trabajo semánticos son estrategias estandarizadas para organizar y clasificar conceptos y relaciones de un dominio concreto, como el de los materiales funcionales. Estos marcos de trabajo pueden incluir elementos de glosarios, ontologías y taxonomías especializados, y están diseñados para proporcionar un lenguaje y una interpretación comunes de los datos químicos en el conjunto de una organización. Esta estrategia puede contribuir a acelerar la I+D y ayudar a los científicos a tomar decisiones más fundamentadas.

    Por ejemplo, un investigador está intentando identificar un material novedoso para usarlo en un nuevo dispositivo electrónico. Para ello, empieza usando glosarios, ontologías y taxonomías especializados para clasificar y organizar las propiedades y características de los materiales conocidos. Podría usar una taxonomía especializada para clasificar los materiales en función de su conductividad eléctrica, sus propiedades ópticas o su estabilidad térmica. Organizar los materiales de esta forma permite al químico identificar con más facilidad las lagunas que hay en sus conocimientos o las áreas en las que pueden necesitarse nuevos materiales. También puede usar ontologías para definir las relaciones entre diferentes propiedades de los materiales, como la existente entre la estructura de un material y sus propiedades electrónicas. Esto puede ayudarle a tomar decisiones más fundamentadas sobre los materiales que conviene seguir investigando.

    Descargue este caso práctico para descubrir cómo los conocimientos patentados almacenados pueden revelar información y facilitar las decisiones basadas en datos.
     
  3. Minería de datos automatizada 
    Las técnicas de minería de datos automatizada permiten a las organizaciones de I+D descubrir patrones e informaciones ocultas en grandes volúmenes de datos químicos no estructurados. El aprendizaje automático y la analítica avanzada pueden analizar datos químicos de experimentos anteriores, condiciones de fabricación, artículos científicos, patentes y otras fuentes para identificar relaciones entre sustancias químicas, reacciones y formulaciones. Esta información puede llevar al descubrimiento de nuevas oportunidades para la I+D y ampliar los conocimientos sobre los productos y procesos existentes.

    Por ejemplo, un investigador podría examinar miles de artículos relacionados con su área de investigación y extraer información esencial sobre las propiedades de los materiales, los métodos de síntesis y las métricas de rendimiento. Una vez extraída esta información, el investigador puede usar los algoritmos de aprendizaje automático para analizar los datos e identificar patrones o correlaciones que podrían llevar al descubrimiento de un nuevo material. El investigador podría descubrir que algunos métodos de síntesis o condiciones para aumentar la escala de la producción generan por sistema materiales con las propiedades deseables, o que los materiales con determinadas características estructurales suelen tener un buen rendimiento en algunas aplicaciones concretas.
     
  4. Herramientas de colaboración 
    Las herramientas y tecnologías de colaboración, como las bases de datos centralizadas y los sistemas integrados de gestión de la información del laboratorio, ofrecen a los equipos de I+D una forma eficiente y fiable de compartir el conocimiento y la información y derribar los silos de datos aislados. Al proporcionar acceso a un repositorio de datos centralizado, las organizaciones de I+D pueden mejorar la comunicación y acelerar la innovación. Una base de datos centralizada basada en la nube también puede mejorar el intercambio de conocimiento entre equipos e investigadores remotos que pueden estar geográficamente dispersos.

    Además, los ecosistemas digitales modernos facilitan la transferencia de conocimiento entre dos organizaciones. Esto es especialmente valioso para los proyectos realizados conjuntamente por el mundo académico y la industria y durante las fusiones y adquisiciones, cuando los investigadores necesitan compartir los conocimientos sobre las características o los datos de rendimiento de un material basándose en las investigaciones anteriores. Con un ecosistema de I+D digital que fomente la colaboración, las organizaciones pueden identificar mejor las posibles oportunidades de innovación.

    Aprovechar los datos ocultos e implementar estrategias de gestión del conocimiento eficaces permite a las organizaciones dedicadas a la química acelerar la innovación y mejorar los resultados de la I+D. Pueden acortar los ciclos, identificar nuevas oportunidades de investigación, mejorar las formulaciones de los productos y tomar decisiones más fundamentadas sobre los proyectos de investigación que se deben llevar a cabo.

    Descargue este caso práctico para descubrir cómo ha logrado Toray Industries eliminar los silos de datos e incorporar mejor los datos en sus flujos de trabajo. 
     
  5. Asóciese con un experto para poner en práctica las estrategias de gestión del conocimiento
    Las complejidades de la información científica a lo largo de todo el flujo de trabajo de I+D de química la convierten en un desafío para cualquier equipo de TI interno. Un socio externo puede ayudarle a crear soluciones para almacenar y conectar los datos existentes con un formato estructurado, lo que permitirá que todos los empleados puedan acceder a datos de I+D valiosos de una forma sencilla y eficiente. La experiencia de un socio externo puede tener un valor incalculable. Su familiaridad con las prácticas recomendadas y su experiencia en el campo de la gestión del conocimiento contribuirán a garantizar el éxito de sus iniciativas.

curate-connect--analyze