デジタル技術は急速に発展しており、それに追いついて行くのは困難です。 癌の成長の予測から人間の脳の模倣まで、人工知能(AI)に関わる話題が大きく公表されており、ほぼ毎日発展があるようです。 医療、金融、輸送などの業界で、新たな応用が絶え間なく発見されています。 これほど急成長の可能性がある中、R&D組織も参入しようと大きな投資をしはじめているのも、驚くべきことではありません。 しかし問題があります。 これらのプロジェクトの成功率は、低い時は15%と推定されているからです。 最近では、大々的に報道されていた、IBMのワトソン技術をヘルスケアに応用して失敗した例などもあります。
では、どうしたらよいのでしょうか。 もたもたしていると、他社がデジタル技術で優位に立たれ、後塵を拝するリスクがあります。 ディープラーニングや次のブレークスルーなど、今日の技術を活用して貴組織を成功に導くためには、どうやったら賢い投資ができるのでしょうか。 本ブログの投稿記事では、デジタル技術の導入で長期的な成功を収めるには堅実なデータ基盤の構築がいかに重要かということと、将来的に長きにわたって配当が得られるような賢い投資を始めるにはどうすればよいのかということを紹介します。
「ゴミを入れればゴミしか出てこない。」 - まとまりのないデータがもたらす損失
企業のデジタル技術プロジェクトの失敗率が高い理由のひとつは、AIなどの新技術によってもたらされる可能性の誇大宣伝に夢中になってしまい、これらの技術を成功させるために必要な、もっと地味な基本要素部分にまだ残っているすき間を見落としてしまうからです。 この見逃しは、AIの能力に対する過度の野心的な期待と相まって、しばしば失望する結果につなががります。
この見落としがちな隙間で最も一般的なもののひとつに、基盤データ資産の強さがあげられます。 デジタル技術を構築、訓練するために、確実に高品質で強固なデータ基盤があることが重要です。 この「データの盲点」はいたるところに見られます。これは、「きちんと整理されたデータのコレクションを持つことは、特に重要視していることではない」と回答者の83%が答えた、Forresterによる最近の調査でも明らかになっています。
では、デジタル技術の分野での成功のためには、なぜ高品質のデータはそれほど重要なのでしょうか。 ここでポイントとなるのは、これらの技術は新しい知識を生み出すことができないということです。 これらの技術は提供された情報に基づいて学び、発達します。 すべての出力は入力の品質、すなわち貴組織のデータにリンクされています。 その為、不完全な、構造化されていない、または無関係なデータを入力すると、返されるデータの品質が大きく損なわれ、これに大きく依存すると、成功と更には安全に対して組織的なリスクが発生する可能性があります。 実際、低品質なデータは、間違った決定や非効率、または収益の損失などにより、米国経済に年間3.1兆ドルの損失をもたらしているものと推定されています。
これらの状況を踏まえて、成功するDX戦略を構築するにはどうすればよいでしょうか。 詳細は、弊社の最新のホワイトペーパーをダウンロードしてお読みください。
高品質なデータ基盤の構成要素
組織のための高品質のデータ基盤を構築することは、デジタル変換を開始する際に行う最も重要な投資です。 ただ、どこまでやれば高品質になるのでしょうか。 高品質なデータとは何か、という定義は広範ですが、データの準備状況を測定するための主な属性は3つあります。
- データには十分な量が必要だということ。 デジタル技術は、できるだけ多くのデータを必要としています。 大きいデータセットでのみ、正確な結論に達することができます。 例えば、Facebook上での顔認識は97.35%の精度を持ち、人間のパフォーマンスにとても近づいています。 これは、400万人のFacebookユーザーのデータセットへのアクセスによってのみ可能になりました。 科学技術のR&D会社が必要とするデータの量は、貴社が取り組もうとしている問題の性質と複雑さによって決まります。 データ要件を定義する際に、目標とする将来のアプリケーションのニーズを考慮しましょう。
- データには多様性が必要であるということ。 組織の中核となる技量や市場に関する広く深いデータ収集が重要です。 しかし、成長とイノベーションの機会を模索するためにデジタル技術を使用する場合、データの多様性も非常に重要です。 データが既知の領域にのみ関連している場合、ネットワーク解析やAIなどの技術が多くの新しい機会を明らかにする可能性は低く、単にあなたの現在の知識を検証します。 従って、中核となるものに合わせたデータコレクションを特定し、含めることが重要です。
- データは、よく整理されている必要があるということ。 使える洞察を引き出すためには、データ収集がよく構造化されていることが重要です。 特異的に複雑になっている科学データにとっては、包括的なデータモデルを構築し、そしてそれに対するキュレーションとクリーンアップを行うことは、特に重要です。この化学データには、テキストコンテンツや化学構造、薬剤・標的関係性、分類学的動物名(界、門、属など)、財務数値、回路図、グラフ、チャートなど、さまざまなものが含まれます。統計解析や計算アルゴリズムは、大規模なデータセットを整理して強化させるのに役立ちますが、データガバナンスのプロセスでは、人による精選も行えるようにしておくことも重要です。 経験豊富な化学者、生化学者、データ科学者は、データを分析し、AIシステムができない洞察を提供することができます。
データ基盤の迅速な立ち上げ
データの開発は進歩を遅らせるように感じるかも知れませんが、それはあらゆるデジタル技術プロジェクトの成功に不可欠な投資です。 技術が急速に進化するのに伴い、堅実に構築されたデータ基盤は、新しいAIや機械学習アプリケーションをより効率的に実装する自由を提供し、今後長年に渡ってリターンを提供し続ける利点を提供します。
スケジュールが厳しくて、または人材不足でプロジェクトに支障をきたしているようなら、 外部の専門家と提携することを検討しても良いでしょう。そして素早くデータ基盤を構築するための高品質でよく構造化されたデータコレクションと、必要な構造とプロセスを効率的に構築するためのノウハウを提供してもらうのです。 CASでは、100年以上にわたって科学データから洞察を管理、収集、抽出してきました。 そろそろ始めようとお考えでしたら、 CASがお手伝いいたします。
詳細は、弊社の『R&Dにおける有益なデジタル変換』のホワイトペーパーをダウンロードしてお読みください。または具体的なニーズについては、お気軽にお問い合わせください。