Libération de la puissance des Dark data dans la R&D du secteur de la chimie : stratégies de succès

GettyImages-507492447_CAS-Insights-Hero-Image

Que sont les Dark data ?

Le pouvoir de révolutionner la R&D est à la portée des entreprises chimiques innovantes. Disposant d'une abondance de données inexploitées, couramment appelées « dark data », ou données cachées, ces entreprises sont en mesure d'en tirer parti pour accélérer l'innovation plus que jamais auparavant. En mettant en œuvre des stratégies efficaces de gestion des connaissances, le potentiel en termes de découvertes et de progrès révolutionnaires est illimité.

Les « dark data » sont généralement des données non structurées ou semi-structurées qui ne sont pas facilement exploitables ou accessibles. On estime que 55 pour cent des données stockées par les entreprises sont des données cachées, ou dark data. Pourtant, environ 90 % des entreprises et des responsables informatiques dans le monde reconnaissent que chaque entreprise devra extraire de la valeur de ces données non structurées pour réussir à l'avenir.

Dans le contexte de la diversification de la R&D en chimie, cela pourrait concerner les données provenant des cahiers de laboratoire, des systèmes LIMS, des rapports expérimentaux, des références de la littérature et autres, qui ne sont pas intégrées à des bases de données exploitables. Ces données peuvent être précieuses pour identifier de nouveaux matériaux, améliorer les formulations existantes et réduire la durée des cycles de R&D.

Pour libérer la valeur des « dark data », les entreprises chimiques diversifiées doivent identifier les endroits où se cachent leurs données les plus précieuses et mettre en œuvre des stratégies efficaces de gestion des connaissances qui leur permettront d'accéder, de collecter, d'organiser et d'analyser ces données en fonction de leurs besoins.

Découverte des joyaux cachés : identifier les données les plus précieuses de la R&D chimique

Les « dark data » peuvent se cacher un peu partout dans le flux de travail de la R&D chimique. De la recherche initiale à la fabrication, aux formulations, à la caractérisation et même à la surveillance après mise sur le marché, de précieuses données sont générées et collectées, mais risquent de ne pas être exploitées à leur plein potentiel. Pour tirer parti de l'intégralité de leur valeur et accélérer l'innovation, les organisations de R&D doivent impérativement identifier les emplacements où se cachent ces données et développer des stratégies pour y accéder et les exploiter efficacement.

Plusieurs types de « dark data » sont utiles pour la recherche. Par exemple, les données expérimentales historiques sont souvent dispersées, incomplètes ou non structurées, alors qu'elles pourraient fournir des informations utiles pour les projets en cours et futurs si elles étaient organisées et analysées. Si l'on regarde au-delà des efforts de R&D de l'entreprise elle-même, les sources de données externes telles que les articles universitaires, les brevets et les rapports industriels peuvent aussi apporter de précieuses informations et permettre d'identifier de nouvelles opportunités d'innovation et de recherche. Enfin, les données non structurées, comme les textes extraits d'articles scientifiques ou de notes de laboratoire, peuvent contenir des informations cachées, mais il faut utiliser des outils et techniques adéquats pour bien les analyser.

Les entreprises peuvent identifier ces données cachées et y accéder en faisant appel aux opérations suivantes selon les besoins de leur flux de travail :

  • Il est essentiel de réaliser un inventaire approfondi des sources de données disponibles, qu'elles soient internes ou externes, structurées ou non.
  • La hiérarchisation des sources de données en fonction de leur valeur potentielle pour les initiatives de R&D actuelles et futures peut aider les entreprises à tirer le meilleur parti de leurs ressources. Par exemple, si vous envisager de mettre à l'échelle un matériau fonctionnel récemment validé, vous souhaiterez peut-être hiérarchiser l'accès aux formulations historiques et aux données de fabrication pour contribuer à prédire les conditions idéales.
  • Favoriser une culture de prise de décisions axée sur les données et d'amélioration continue peut aider les entreprises chimiques innovantes à concrétiser pleinement le potentiel des « dark data ».

Cinq stratégies essentielles de gestion des connaissances pour libérer les « dark data »

Jeux de données organisés sur mesure, infrastructures sémantiques, exploration des données automatisée et flux de travail collaboratifs : telles sont les stratégies fondamentales de gestion des connaissances qui permettront de libérer la valeur des « dark data » et de dynamiser l'innovation. Observons plus en détail l'utilité de ces stratégies :

  1. Organisation personnalisée 
    L'organisation personnalisée passe par l'organisation manuelle des données chimiques par les experts du domaine pour créer des jeux de données de grande qualité spécifiquement adaptés aux besoins de l'entreprise. En utilisant l'organisation personnalisée, les chercheurs dans les secteurs des matériaux fonctionnels, de la cosmétique, de l'agriculture ou d'autres domaines des produits chimiques diversifiés peuvent faire en sorte que les données avec lesquelles ils travaillent soient précises, à jour et pertinentes pour leurs objectifs de recherche. En travaillant avec des analystes experts des données, les entreprises peuvent aussi connecter les informations en interne avec la science mondiale et, ainsi, renforcer leurs données internes. Vous pouvez aller encore plus loin pour solidifier les initiatives de transformations numériques basées sur l'IA en obtenant des jeux de données organisés sur mesure, spécialement conçus pour les modèles d'apprentissage machine.

    Téléchargez cette étude de cas pour découvrir comment les jeux de données d'entraînement organisés améliorent la précision et le caractère transférable d'un modèle d'IA. 
     
  2. Infrastructures sémantiques 
    Les infrastructures sémantiques sont des approches standardisées pour l'organisation et le classement des concepts et des relations dans un domaine spécifique, tel que celui des matériaux fonctionnels. Ces infrastructures peuvent inclure des éléments de lexiques spécialisés, des ontologies et des taxonomies et sont conçues pour fournir un langage commun et une compréhension des données chimiques dans l'ensemble d'une organisation. Cette approche peut contribuer à accélérer la R&D et permettre aux chercheurs de prendre des décisions plus éclairées.

    Par exemple, un chercheur s'efforce d'identifier un nouveau matériau à utiliser dans un nouvel appareil électronique. Pour ce faire, il peut commencer par utiliser des lexiques, ontologies et taxonomies spécialisés, afin de classer et d'organiser les propriétés et caractéristiques des matériaux connus. Il peut utiliser une taxonomie spécialisée pour classer les matériaux selon leur conductivité électrique, leurs propriétés optiques ou leur stabilité thermique. En organisant les matériaux ainsi, le chimiste est mieux en mesure d'identifier les lacunes de connaissances ou les domaines dans lesquels de nouveaux matériaux pourraient être nécessaires. Il peut aussi utiliser des ontologies pour définir les relations entre différentes propriétés des matériaux, par exemple entre la structure d'un matériau et ses propriétés électroniques. Cela peut l'aider à prendre des décisions mieux éclairées quant aux matériaux qui méritent une attention plus approfondie.

    Téléchargez cette étude de cas pour découvrir comment les connaissances exclusives stockées peuvent révéler des informations et favoriser les décisions qui s'appuient sur la donnée.
     
  3. Exploration de données automatisée 
    Les techniques d'exploration automatisée de données permettent aux organisations de R&D de découvrir des modèles et des informations cachés dans de gros volumes de données chimiques non structurées. L'apprentissage machine et l'analytique avancée permettent d'analyser les données chimiques issues d'expériences antérieures, les conditions de fabrication, les articles scientifiques, les brevets et d'autres sources pour identifier les relations entre substances chimiques, réactions et formulations. Ces informations peuvent aboutir à la découverte de nouvelles opportunités pour la R&D et apporter un éclairage sur les produits et procédés existants.

    Par exemple, un chercheur peut analyser des milliers d'articles liés à son domaine de recherche et en extraire des informations clés telles que les propriétés des matériaux, les méthodes de synthèse et les métriques de performance. Une fois ces informations extraites, il peut utiliser des algorithmes d'apprentissage machine pour analyser les données et identifier des modèles ou des corrélations susceptibles d'aboutir à la découverte d'un nouveau matériau. Le chercheur peut ainsi découvrir que certaines méthodes de synthèse ou certaines conditions de mise à l'échelle produisent systématiquement des matériaux aux propriétés intéressantes ou que des matériaux présentant certaines caractéristiques structurelles ont tendance à être particulièrement performants dans des applications spécifiques.
     
  4. Outils de collaboration 
    Les outils et technologies de collaboration, tels que les bases de données centralisées et les systèmes LIMS intégrés, offrent aux équipes de R&D un moyen efficace et fiable de partager des connaissances et des informations et de briser les silos de données. En donnant accès à un référentiel de données centralisé, les organisations de R&D peuvent améliorer la communication et accélérer l'innovation. Une base de données centralisée dans le cloud peut aussi améliorer le partage des connaissances entre équipes distantes et chercheurs éloignés géographiquement.

    Les écosystèmes numériques modernes facilitent aussi le transfert des connaissances entre deux organisations. C'est particulièrement utile pour les projets conjoints entre les universitaires et l'industrie et lors des fusions et acquisitions, lorsque les chercheurs ont besoin de partager des connaissances basées sur des recherches antérieures concernant les caractéristiques ou les données de performance d'un matériau. Grâce à un écosystème de R&D numérique favorisant la collaboration, les organisations sont mieux en mesure d'identifier les opportunités d'innovation.

    En exploitant les « dark data » et en mettant en œuvre des stratégies efficaces de gestion des connaissances, les entreprises chimiques peuvent accélérer l'innovation et améliorer les résultats de leur R&D. Elles peuvent alors réduire la durée des cycles, identifier de nouvelles opportunités de recherche, améliorer la formulation des produits et prendre des décisions mieux éclairées au sujet des projets de recherche à approfondir.

    Téléchargez cette étude de cas pour découvrir comment Toray Industries élimine les silos de données et intègre mieux les données à ses flux de travail. 
     
  5. Devenez partenaire d'un expert pour mettre en action les stratégies de gestion des connaissances
    La complexité des informations scientifiques dans l'ensemble du flux de travail de la R&D chimique les rend difficiles à maîtriser par toute équipe informatique interne. Un partenaire extérieur peut vous aider à construire des solutions pour stocker et connecter vos données existantes dans un format structuré, permettant à tous et à toutes d'accéder rapidement et efficacement à de précieuses données de R&D. L'expérience d'un partenaire extérieur peut être extrêmement utile. Ses points de vue sur les bonnes pratiques et son expertise de la gestion des connaissances peuvent contribuer à faire en sorte que vos efforts soient fructueux.

organiser-connecter-analyser