Google Cloud Platform

CIO 向けのデータ アナリティクス / 機械学習ガイドを公開

編集部注 : 『CIO's guide to data analytics and machine learning』は、こちらからダウンロードできます。

AI(人工知能)の飛躍的な進歩が、ビジネスやテクノロジーのリーダーたちの想像力を捉えて離さなくなってきています。たとえば、宇宙の元素数よりも手の数が多いボード ゲームの世界で、コンピュータは人間界のチャンピオンを打ち破りました。また、人気のビデオ ゲームをマスターしたり皮膚ガンの診断を手助けしたりしています。

こうしたブレークスルーを支える AI のテクニックは、産業の違いを越えて多様な分野へと広がりを見せており、すでにアーリー アダプターの一部は結果を出しています。特に勇気を与えてくれるのは、小売業、金融サービス、製造業といった古くから確立された産業のプロセスが AI によって変化しつつあることです。

しかし、AI のブレークスルーをビジネスに活かせるかどうかは、しっかりとした基礎にかかっています。データを収集、準備して分析するための規律ある基礎能力です。実際、データ サイエンティストたちは、AI が約束する予測能力を実現するうえで前段階となる “data wrangling”(操作)、“data munging”(変換)、“data janitor”(管理)に作業時間の 80 % を費やしています。

データの収集、準備、分析は、AI への取り組みを成功に導くための基本となります。Google Cloud は、この重要なサイクルを軌道に乗せたいと考えるビジネスおよび IT リーダーを支援するにあたって、個々のステップの確立に必要なテクノロジーを解説した『CIO's guide to data analytics and machine learning』を作成しました。このガイドで特に重要なのは、ビッグデータ処理の成熟度にかかわらず、マネージド クラウド サービスが AI 活用の長い道のりをいかに単純化してくれるかを明らかにしていることです。

このことが重要なのは、AI のような新しい能力の獲得以上に、データ管理の基礎レベルを確保することが、多くの企業にとって大きな課題となっていくからです。

Oliver Wyman のコンサルタントである Nick Harrison 氏と Deborah O'Neill 氏は、Harvard Business Review に最近掲載された記事『If Your Company Isn't Good at Analytics, It's Not Ready for AI』(アナリティクスをマスターしていない企業は AI に歯が立たない)の中で、「企業の経営陣は、AI などの高度なテクノロジーに直接向き合えば基本的なデータ アナリティクスのベスト プラクティスを避けて通れると考えがちですが、好むと好まざるとにかかわらず、基礎を省略する贅沢は許されません」と指摘しています。

今回のガイドでは、新しい研究成果とビッグデータに関する Google 自身の経験を基に、データ管理サイクルの各ステップについて、実例とともに何が可能かを具体的に示しながら解説を加えています。データ戦略を展開する過程で企業が直面するさまざまな問題を取り上げ、その解決を任されたビジネス / IT リーダーを支援することを目的として書かれているのです。

最も重要な自社のビジネス プロセスを踏まえたうえで、将来起こりうる問題に対処できる適切な基盤を確保するには、どのようにして生データを収集すればよいのでしょうか。また、そうした基盤を高いコスト効果で実現するにはどうすればよいのでしょうか。具体的には次のような課題です。

  • オペレーショナル / トランザクショナル データベースに収まらない非構造化データ(未加工のファイル、ドキュメント、イメージ、システム ログ、チャットやサポート記録、ソーシャル メディアなど)をどのように処理すべきか。
  • ビジネス上の課題が新たに発生したときに、すぐに解決策を出せるようにするには、収集した生データをどのように処理すればよいか。
  • ビジネスへのリアルタイムな視点が必要とされる場面では、履歴データのバッチ処理ではない、どのようなプロセスが必要なのか。データ ストリームをリアルタイムで簡単に処理するにはどうすればよいか。
  • 社内に散らばっているデータのサイロを統一し、端から端まで全体を見通せるようにするにはどうすればよいか。複数のクラウド サービスや SaaS プロバイダーのようなオフプレミスに格納されているデータをどのように活用すべきか。
  • この能力を、社内のデベロッパーやデータ サイエンティストだけでなく、ビジネス パーソンにも浸透させるにはどうすればよいか。
企業の機密データを扱うマネージド クラウド サービスでは、データ管理サイクルのすべてのステップでデータのセキュリティ確保が最重要課題になります。データの暗号化や、企業ネットワークと Google ネットワークの直結といったテクニックは、クラウドへのデータ移行から、その後の追加データの格納、準備、分析までを通じて、知見を生み出すデータ資産の保護に関するベスト プラクティスを反映しています。

データ資産に関する成熟度がどのようなものであれ、Google Cloud はいつでもお客様の力になります。データの潜在能力を最大限に引き出せるように支援しますので、お客様が抱える課題についてぜひお聞かせください


* この投稿は米国時間 7 月 24 日、Google Cloud Platform の Director of Product Management である Fausto Ibarraによって投稿されたもの(投稿はこちら)の抄訳です。

- By Fausto Ibarra, Director of Product Management, Google Cloud Platform