Las tecnologías digitales están evolucionando tan deprisa que resulta difícil mantenerse al día. Parece que hay avances prácticamente a diario y los medios nos bombardean con historias sobre todo lo que hace la inteligencia artificial (IA): desde predecir el crecimiento del cáncer hasta imitar al cerebro humano. Constantemente, se encuentran nuevas aplicaciones en sectores como la sanidad, las finanzas, el transporte y muchos otros. No es de extrañar que, en mitad de esta eclosión, las organizaciones de I+D también estén deseando participar y realizando importantes inversiones en este espacio. Sin embargo, hay un problema. Se estima que la tasa de éxito de estos proyectos es solo del 15 %. Un ejemplo reciente de esto son los mediáticos reveses que ha sufrido la aplicación de la tecnología Watson de IBM a la sanidad.
Así pues, ¿cuál es la respuesta? Si espera, quedará rezagado con respecto a sus competidores, que disfrutarán de las ventajas proporcionadas por las tecnologías digitales. ¿Cómo puede realizar inversiones inteligentes que favorezcan el éxito de su organización con las tecnologías actuales, como el aprendizaje profundo, y con los próximos avances? En esta entrada del blog descubrirá que unos cimientos de datos sólidos son esenciales para el éxito a largo plazo de la implementación de tecnologías digitales y aprenderá a iniciar su andadura con pequeñas inversiones que producirán importantes dividendos en el futuro.
Si entra basura, sale basura: los datos desorganizados pueden pasarle factura
Uno de los motivos de la elevada tasa de fracaso de los proyectos corporativos relacionados con la tecnología digital es que las organizaciones se dejan arrastrar por el furor que rodea a las posibilidades ofrecidas por tecnologías nuevas como la IA y pasan por alto las deficiencias de elementos fundacionales menos atractivos que son esenciales para que estas tecnologías tengan éxito. Esta omisión, sumada a unas expectativas excesivamente ambiciosas en cuanto a las prestaciones de la IA, puede llevar a resultados decepcionantes.
Uno de los factores que muchas organizaciones pasan por alto es la calidad de los activos de datos subyacentes. Contar con unos cimientos de datos sólidos y de alta calidad para crear y entrenar estas tecnologías digitales es crucial. La prevalencia de este "ángulo muerto de los datos" se puso de manifiesto en una encuesta reciente de Forrester en la que el 83 % de los encuestados afirmaron que disponer de una recopilación de datos bien seleccionados no era su principal preocupación.
¿Por qué es tan importante contar con datos de alta calidad para tener éxito en el ámbito de las tecnologías digitales? La clave es que estas tecnologías no pueden crear conocimiento nuevo. Aprenden y se desarrollan gracias a la información que se les proporciona. Todos los resultados que producen están vinculados con la calidad de la información que se les suministra; es decir, con los datos que usted introduce en ellas. Por tanto, si se suministran datos incompletos, desestructurados o irrelevantes, la calidad de lo que se obtiene será muy deficiente y, si se confía ciegamente en ello, puede representar un riesgo importante para el éxito e incluso la seguridad de las organizaciones. De hecho, se estima que los datos con una calidad deficiente, derivados de decisiones desacertadas, ineficiencias, ingresos perdidos, etc. tienen un coste anual de 3,1 billones de dólares para la economía de Estados Unidos .
Así pues, ¿cómo puede diseñar una estrategia de transformación digital eficaz para su organización? Descargue nuestro informe técnico más reciente.
Los pilares de unos cimientos de datos de alta calidad
Crear unos cimientos de datos de alta calidad para una organización es la inversión más importante cuando se inicia una transformación digital. ¿Pero qué se considera suficientemente bueno? La definición de lo que se considera alta calidad en los datos es amplia, pero hemos identificado tres atributos principales que se pueden usar como referencia para medir el estado de los datos:
- Debe tener suficientes datos. Las tecnologías digitales tienen "hambre" de datos, de tantos como se les pueda suministrar. Solo con un conjunto de datos grande pueden extraer conclusiones precisas. Por ejemplo, el reconocimiento facial de Facebook tiene una tasa de precisión del 97,35 %, que se acerca bastante al rendimiento humano. Para lograrlo, ha sido necesario acceder a un conjunto de datos integrado por 4 millones de usuarios de Facebook. La cantidad de datos que necesita su empresa de I+D científica y tecnológica depende de la naturaleza y la complejidad de los problemas que pretenda abordar. Tenga en cuenta las necesidades de las aplicaciones futuras previstas al definir los requisitos de datos.
- Debe tener datos diversos. Es esencial contar con una recopilación extensa y profunda de datos relacionados con las competencias y los mercados básicos de su organización. Sin embargo, si las tecnologías digitales se van a usar para buscar oportunidades de crecimiento e innovación, la diversidad de los datos también es muy importante. Si sus datos tienen relación únicamente con un área que ya conoce bien, es poco probable que tecnologías como el análisis de red o la IA encuentren muchas oportunidades nuevas; se limitarán a validar el conocimiento existente. Por ello, es importante identificar e incluir recopilaciones de datos de áreas adyacentes al tema central.
- Debe tener datos bien organizados. Para que permitan extraer conocimientos útiles, es crucial que la recopilación de datos esté bien estructurada. Al crear un modelo de datos amplio, la selección y la limpieza son especialmente importantes para los datos científicos, que son particularmente complejos y pueden incluir contenido de texto, estructuras químicas, relaciones entre fármacos y dianas, nombres taxonómicos de animales (reino, filo, género, etc.), valores financieros, diagramas, gráficos, tablas, etc. Aunque los análisis estadísticos y los algoritmos informáticos pueden ser útiles para organizar y enriquecer los conjuntos de datos de gran tamaño, es importante incorporar también una selección humana al proceso de gobernanza de datos. Los químicos, bioquímicos y científicos de datos experimentados pueden analizar los datos y ofrecer perspectivas que ningún sistema de IA puede proporcionar.
Ampliar con rapidez los cimientos de datos
Aunque tal vez piense que desarrollar los datos ralentiza su progreso, es una inversión vital para el éxito de cualquier proyecto de tecnología digital. Dada la rapidez con la que evoluciona la tecnología, unos cimientos de datos sólidos le darán la libertad de implementar cada aplicación de IA y aprendizaje automático con más eficiencia, lo que se traducirá en una ventaja que seguirá dando frutos durante muchos años.
¿Trabaja con plazos ajustados o no cuenta con el personal necesario para el proyecto? Plantéese la posibilidad de asociarse con expertos externos que puedan suministrar recopilaciones de datos bien estructuradas y de alta calidad para crear sus cimientos de datos más deprisa y que ofrezcan conocimientos especializados para ayudarle a desarrollar las estructuras y los procesos necesarios de un modo eficiente. En CAS, llevamos más de cien años gestionando, seleccionando y extrayendo información de los datos científicos. ¿Está preparado para empezar? CAS puede ayudarle.
Descargue nuestro informe técnico sobre una transformación digital rentable en el campo de la I+D para obtener más información o contacte con nosotros para que podamos analizar sus necesidades.