Les technologies numériques évoluent si vite qu'il est difficile d'en suivre le rythme. Les avancées semblent apparaître presque quotidiennement, avec des récits très commentés au sujet de l'intelligence artificielle (IA) qui permettrait aussi bien de prédire la croissance des cancers que de reproduire le cerveau humain. De nouvelles applications sont constamment découvertes dans des secteurs tels que la santé, la finance, les transports et bien d'autres. Il n'est pas surprenant qu'avec un tel potentiel tout nouveau, les entreprises de R&D soient également impatientes de se lancer en investissant fortement dans ce domaine. Cependant, un problème subsiste. Le taux de succès de ces projets est estimé à seulement 15 % ! Un exemple récent est celui des échecs très commentés de la mise en œuvre de la technologie Watson d'IBM dans le domaine de la santé.
Quelle est donc la réponse ? Si vous attendez, vous risquez de prendre du retard sur des concurrents qui obtiennent des avantages grâce aux technologies numériques. Comment faire des investissements intelligents qui positionneront votre entreprise sur la voie du succès avec les technologies actuelles, telles que l'apprentissage profond, mais aussi pour les prochaines avancées de la recherche ? Cette publication du blog vous indique pourquoi la création d'un socle de données solide est essentielle pour le succès à long terme en mettant en œuvre des technologies numériques et comment vous pouvez débuter dès aujourd'hui par des investissements intelligents qui seront rentables à l'avenir.
Données erronées en entrée, données erronées en sortie : les données désorganisées peuvent vous coûter cher
L'une des raisons du taux élevé d'échecs des projets de technologie numérique des entreprises tient au fait que ces dernières se laissent impressionner par le battage fait autour des possibilités qu'offrent de nouvelles technologies comme l'IA et ignorent les lacunes existantes dans des éléments de base moins fascinants qui sont néanmoins nécessaires pour assurer le succès de ces technologies. Cette négligence, associée aux attentes exagérément ambitieuses quant aux capacités de l'IA, peuvent souvent aboutir à des résultats décevants.
L'une des lacunes les plus courantes que sous-estiment les entreprises concerne la force de leurs actifs de données sous-jacentes. Il est indispensable de vous assurer que vous disposez d'une fondation de données robuste et de haute qualité sur laquelle construire et former ces technologies numériques. La prévalence de cet « angle mort des données » est prouvée par une enquête récente de Forrester, dans laquelle 83 % des personnes interrogées ont déclaré que disposer d'une collection de données bien organisée n'était pas leur préoccupation majeure.
Pourquoi donc les données de haute qualité sont-elles aussi importantes pour réussir dans le domaine des technologies numériques ? L'élément clé tient au fait que ces technologies ne sont pas en mesure de créer de nouvelles connaissances. Elles apprennent et se développent en fonction des informations que vous leur fournissez. Tous les résultats sont liés à la qualité des données entrées, à savoir vos données. Par conséquent, si vous entrez des données incomplètes, non structurées ou non pertinentes, la qualité des informations retournées en souffrira beaucoup, et si vous comptez trop sur de telles données, les risques pour le succès, voire la sécurité de l'entreprise pourraient être considérable. En fait, on estime que les données de mauvaise qualité coûtent à l'économie américaine 3,1 billions de dollars par an en raison de décisions erronées, d'inefficacité, de perte de revenus, etc.
Mais comment élaborer une stratégie efficace de transformation numérique pour votre entreprise ? Téléchargez notre dernier livre blanc.
Les blocs constitutifs d'une fondation de données de haute qualité
Construire des fondations de données de haute qualité pour votre entreprise est l'investissement le plus essentiel à faire avant d'entreprendre une transformation numérique. Mais quelle qualité faut-il atteindre ? La définition de ce qui constitue les données de haute qualité est large, mais nous avons identifié trois attributs majeurs par rapport auxquels mesurer la préparation de vos données :
- Vous devez disposer d'un volume de données suffisant. Les technologies numériques sont gourmandes et absorbent toutes les données que vous pouvez leur apporter. Il leur faut un vaste ensemble de données pour pouvoir parvenir à des conclusions précises. Par exemple, la reconnaissance faciale sur Facebook possède un taux de précision de 97,35 %, très proche de la performance humaine. Cela n'a été rendu possible que grâce à l'accès à un ensemble de données de 4 millions d'utilisateurs de Facebook. La quantité de données dont votre entreprise de R&D scientifique et technologique a besoin dépend de la nature et de la complexité des problèmes que vous essayez de surmonter. Tenez compte des besoins de vos applications futures lorsque vous définissez vos besoins de données.
- Vous devez disposer de données diverses. Il vous faut absolument utiliser une collection de données large et approfondie en rapport avec les compétences centrales et les marchés de votre entreprise. Toutefois, si vous avez l'intention d'utiliser les technologies numériques pour rechercher des opportunités de croissance et d'innovation, la diversité des données est également très importante. Si vos données ne concernent qu'un domaine que vous connaissez déjà, les technologies comme l'analyse de réseau ou l'IA ne sont pas susceptibles de découvrir beaucoup d'autres nouvelles opportunités, mais se contenteront de valider vos connaissances actuelles. Il est donc important d'identifier et d'inclure des collections de données portant sur des secteurs adjacents à votre cœur de métier.
- Des données bien organisées sont indispensables. Pour être utile afin de générer des informations exploitables, votre collection de données doit impérativement être bien structurée. Construire un modèle de données global, l'organiser et le nettoyer sont des tâches importantes pour les données scientifiques particulièrement complexes qui peuvent inclure du texte, des structures chimiques, des relations médicament/cible, des noms taxonomiques d'animaux (royaume, embranchement, genre, etc.), des valeurs financières, des schémas, graphiques, tableaux, etc. Même si les analyses statistiques et les algorithmes informatiques peuvent être utiles pour organiser et enrichir vos grands ensembles de données, il est important de prévoir également une organisation humaine au sein de votre processus de gouvernance des données. Des chimistes, biochimistes et scientifiques des données expérimentés peuvent analyser vos données et offrir des perspectives qu'aucun système d'IA ne peut fournir..
Augmentation rapide de votre fondation de données
Le développement de vos données peut vous donner l'impression de ralentir votre progression, mais il s'agit en réalité d'un investissement vital pour le succès de tout projet de technologie numérique. Avec une technologie en évolution très rapide, une fondation de données solide vous offrira la liberté requise pour mettre en œuvre plus efficacement chaque nouvelle application d'IA et d'apprentissage machine en apportant un avantage qui restera tangible pendant de nombreuses années.
Vous êtes soumis à des délais serrés ou devez faire face à des pénuries de talents qui entravent votre projet ? Envisagez de nouer un partenariat avec des experts externes capables de proposer des collections de données bien structurées et de haute qualité pour construire votre fondation de données plus rapidement et dont l'expertise peut vous aider à construire efficacement les structures et processus nécessaires. Chez CAS, nous gérons, organisons et extrayons l'information des données scientifiques depuis plus d'un siècle. Prêt à vous lancer ? CAS peut vous aider.
Téléchargez notre livre blanc sur la transformation numérique rentable dans la R&D pour en savoir plus ou contactez-nous pour discuter de vos besoins spécifiques.