統一され、柔軟でアクセスしやすい未来のデータ

Google Cloud Japan Team
※この投稿は米国時間 2022 年 5 月 7 日に、Google Cloud blog に投稿されたものの抄訳です。
人や企業が生成するデータ量が指数関数的に増加し続ける中、テック企業やあらゆる業界のスタートアップ企業にとって、データドリブンなアプローチが不可欠であることは言うまでもありません。しかしながら、お客様との会話や業界の多くの論評には、データを管理しそこから価値を抽出することは依然として困難であり、規模が大きい場合は難易度がさらに増すとの意見が何度も出てきます。
データへのアクセスやストレージの問題、一貫性のないツール、新しく常に進化するデータソースや形式、コンプライアンスの懸念事項、セキュリティへの配慮といった課題には、数々の要因が影響しています。このたび、これら課題の特定と解決に役立てていただけるよう、新たにホワイトペーパー「統一され、柔軟でアクセスしやすい未来のデータ」を作成しました。同ペーパーでは、データを最大限に活用すべく Google Cloud をお選びいただいたお客様がその理由として最も一般的に挙げられる項目の多くを取り上げました。
たとえば、レガシー システムにあるデータを新しいテクノロジーと組み合わせる必要があるとします。これは、すべてのデータをクラウドに移行するということでしょうか。その場合、1 つのクラウドに置くべきか、それとも複数のクラウドに分散すべきでしょうか。サイロを増やすことなく、すべてのデータから真の価値を抽出するにはどうすればよいでしょうか。
他にも、データをリアルタイムで処理できず、バッチで分析しなければならないため、アーキテクチャが複雑化し、レイテンシ対策に高額なメンテナンスが必要になる場合があります。あるいは、非構造化データを分析し管理するためのスケーラブルな方法がなく、苦戦を強いられる場合もあります。このように要因は多岐にわたりますが、その多くはデータへのアクセスが不適切であることや、サイロ化が進んでいること、さらにはデータを処理し理解する能力が十分備わっていないことに起因しています。
最新の技術スタックは、ストリーミング スタックである必要があります。つまり、データに合わせてスケーリングが可能で、リアルタイム解析に対応し、さまざまな種類のデータを取り込んで理解できなくてはならず、さらには AI / ML を使用して予測に基づく分析情報を導き出しプロセスを運用化できなければなりません。すなわち、データアセットを効果的に活用できるようにするには、次のような要件を満たす必要があるのです。
データは、会社全体は言うまでもなく、サプライヤー、パートナー、プラットフォーム間で統一し、組織的サイロや技術的サイロを取り除く。
組織の分析戦略においては、非構造化データを解放し、活用する。
技術スタックを統一しつつ、オフライン データの分析からリアルタイム ストリーミング、ML の適用にいたるまでのユースケースをサポートできるよう柔軟なものとし、複数のカスタム技術スタックを維持する必要性をなくす。
技術スタックはオンデマンドでアクセスでき、異なるプラットフォーム、プログラム言語、ツールのほか、社員の既存のスキルセットと互換性のあるオープン標準をサポートするものにする。
- ビッグデータおよび分析担当クラウド コンサルタント Julianne Cuneo



