データ分析

2021 年の Google Cloud データ分析: 1 年の振り返り

#da

※この投稿は米国時間 2021 年 12 月 23 日に、Google Cloud blog に投稿されたものの抄訳です。

2021 年を振り返ったとき、Google のデータ プラットフォームを使用して、新たな知見を獲得し、新しいビジネスモデルを構築して、従業員や顧客のエクスペリエンスを高めている企業が急増していることをうれしく思います。

データ自体は単なる情報であり、活用しなければ意味がありません。データが本当の力を発揮するのは、インテリジェントなアプリケーションの開発、的確な意思決定、自動化の拡大、そして最終的に価値創出方法の変革に使われたときです。

今年は、何万ものお客様が Google Cloud の統合データ プラットフォームにより、データ面のメリットを享受しました。それは、データサイロの解消から、インターネット規模のアプリケーション開発、AI を使ったスマート プロセスの開発、自社の枠を越えてデータを資産に変えるデータメッシュの構築にまで及びます。

こうしたお客様は、いずれも Google Cloud の統合データ プラットフォームを使用して、データサイロ間の壁を取り除き、分析への投資を加速させ、ビジネス上の成果を短期間で達成しています。

パートナー様、お客様、専門家の皆さまにとっての今年の重要なできごとについてご紹介できることを光栄に思います。日頃のご愛顧とご協力に感謝するとともに、サイロを解消し、データを価値あるものに変えるイノベーションのパートナーとして Google Cloud を選んでいただいたことにお礼申し上げます。

このソリューションの導入実例として挙げられるのが、フランス最大の食料品小売業者である Carrefour です。Carrefour は、適切な店舗で、適切な商品を、適切な買い物客に提供できるようにする必要がありました。そこで同社は Google Cloud を利用して商品推奨ツールを開発しました。これにより、店舗ごとにカスタマイズされた品揃えを提供できるようになり、店舗責任者は在庫ニーズへの自主対応ができるようになりました。また、Carrefour 本社がフランチャイズ店舗ごとの販売計画を立てる際にも、このツールを利用することにより、状況把握が容易になりました。

リアルタイム エンタープライズの実現

2021 年には、Google Cloud を使ったリアルタイムでのデータの処理や分析への移行を検討したお客様が増えました。ビジネスのスピードに合わせて意思決定を行い、優れたカスタマー エクスペリエンスを提供することが目的です。たとえば、Twitter のデータ プラットフォームでは、日々、何兆ものイベントが取り込まれ、数百ペタバイトのデータが処理され、数万件のジョブが十数個のクラスタで実行されています。今回の拡大パートナーシップで、Twitter は BigQuery、Dataflow、Cloud Bigtable、機械学習(ML)のツールを含む Google のデータクラウドを採用することになりました。こうしたツールにより、急拡大する同社のデータ エコシステムが強化され、データに基づく迅速な意思決定が可能になるだけでなく、より深層の ML を活用したサービスのイノベーションが可能になります。

別の事例として Verizon Media があります。同社は別のプロバイダから Google Cloud に乗り換え、毎日 200 TB を取り込んで BigQuery に 100 PB を格納し、1 秒間に 300 MB をストリーミングしています。また、Looker や BigQuery のほか、データ プラットフォームのその他の機能を組み合わせて生産性を 90% 以上高めています

最後に ATB Financial の事例を紹介します。同社は 80 万人以上の顧客をサポートする大規模な SAP バックボーンを Google Cloud に移行し、リアルタイムでのデータの取得、拡充、AI 支援とセルフサービスの分析のためのシステムを構築しました。

医療とライフ サイエンス分野の成長

HCA Healthcare は BigQuery を使い、年間 3,200 万人に及ぶ受診者のデータを分析し、診療を改善できる箇所を特定しています。特に印象に残ったのは、同社の CEO である Sam Hazen 氏が「次世代の診療にはデータ サイエンスに基づく意思決定のサポートが必要」と説明したこと、また「取り組みの基礎としてのイノベーションと継続的改善」に対する熱意は Google と HCA Healthcare の両社に共通のものと認識されていることです。

Moderna は、データを活用して、パンデミックの影響がマイノリティ集団に偏っている事実に対応しています。Looker の分析情報を使用して、COVID-19(新型コロナウイルス感染症)ワクチンの臨床試験参加者の多様性を高めることで、代表性を改善することが可能です。「Looker には奥深さがあります。単なる可視化ではありません。わかることが増えたら、さらに深堀りできます」と、Moderna の情報学、データ サイエンス、AI 担当バイス プレジデントを務める Dave Johnson 氏は述べています。

また、Google が迅速で安全なデータ共有により、アメリカ国立がん研究所の乳がん研究をサポートできたことも光栄に思っています。大量の異種データを扱えるよう AI Platform と BigQuery を連携させ、「研究者が大量のデータを低コストで迅速に分析できること」を実証できました。

エンタープライズ アジリティの向上

Niantic Labs は、数百万人のユーザーに対応する、グローバルにスケーラブルなゲームを Google Cloud 上に構築しました。この動画では、Google Kubernetes Engine(GKE)と Spanner を使ったスケーリングの経験のほか、同社のデータ サイエンス チームがどのように BigQuery、Dataflow、Pub/Sub を使ってデータ分析を行っているかを伺いました。

最後に、Telefónica は、スペイン国内でデジタル トランスフォーメーション、5G モバイルのエッジ コンピューティングを推進するために Google Cloud との提携を決めました。この提携の一環として、Google Cloud は、COVID-19(新型コロナウイルス感染症)の感染が拡大する中、経済回復を支援するためスペインに新たなクラウド リージョンを設ける予定です。また、Telefónica は、グローバル規模の顧客ベースに継続的に新しいサービスやツールを提供できるようにするため、社内のデジタル能力(機械学習、人工知能(AI)、データ分析、アプリケーション開発などの分野)を向上させる目的でも Google Cloud のサービスを利用する予定です。

Google Cloud のお客様が形作る 2021 年のデータクラウド動向

今年のお客様事例の中で特に印象深かったのは、お客様からのヒントや後押しが Google のプロダクトやサービスのレベルアップにつながった例です。

こういった例は、5 月末に初開催された Data Cloud Summit で発表されたデータ関連のあらゆる最新のプロダクトや機能の中に見ることができました。新たにリリースされた Dataplex は、お客様やユーザーがデータレイク、データ ウェアハウス、データマートの垣根を越えてデータを一元的に管理、モニタリング、統制できるサービスです。また、Datastream は、サーバーレスの変更データ キャプチャ(CDC)とレプリケーションのサービスです。Analytics Hub は BigQuery を基盤に構築されたフルマネージド サービスで、お客様は安全で管理可能なデータ共有のエコシステムを作成できます。Database Migration Service により、Cloud SQL への移行はより簡単かつ迅速になりました。移行全体の 85% 以上が 1 時間以内に完了しており、大半のお客様が他のクラウドからデータベースを移行しています。

Google Cloud Next ‘21 では、サービスの改善点や新バージョンをお客様に報告するためだけの時間を設けました。多くの発表があった中、特にポイントとなるものをお伝えします。Google Cloud での Spark は、Google Cloud データ プラットフォーム向けの世界初の自動スケーリング可能なサーバーレスの Spark サービスです。BigQuery Omni はクロスクラウドの分析ソリューションです。Google Earth Engine on Google Cloud は、50 ペタバイト以上に及ぶ Google Earth Engine の衛星画像や地理空間データセットのカタログを地球規模の分析に利用できるようにします。そして Spanner PostgreSQL Interface では、人気の PostgreSQL エコシステムのスキルやツールを使用して、Spanner の比類ないグローバル スケール、99.999% の可用性、強整合性といったメリットを享受できます。

年 1 回の Looker のユーザー カンファレンス JOIN の第 6 回も開催されました。教育的コンテンツが 3 日間にわたりライブ配信され、15 社を超えるお客様やパートナー様が、5 つの基調講演、33 のブレイクアウト セッション、12 の入門ガイド、27 の Data Circles of Success、そして好評のハッカソンに参加してくださいました。内容は、データ エクスペリエンス、組み立て可能な分析、そして統合セマンティック モデルの活用方法に重点が置かれました。JOIN のセッションは現在、すべてオンデマンドでご覧いただけます

データ エコシステムの活用

お客様からよくいただくフィードバックとして、データの対象を拡大し、周辺のデータ エコシステムを活用することへの関心がありました。このフィードバックには主に次の 3 つの方法で対応しました。

最初に BigQuery 上に集合的インテリジェンスのエコシステムを立ち上げました。現在では 3,000 を超える組織が 250 ペタバイトを超えるデータを共有し、また Google Cloud は多様なユースケースに使用できる 150 を超える一般公開データセットを共有しています。

2 つ目として、この知識共有の精神をさらに進め、30 を超えるアーキテクチャ設計のパターンをパッケージ化しました。これにはコード、データ モデル、業界のベスト プラクティスが含まれます。また、小売、金融サービス、医療、ゲームなど業種別の専門知識を強化し、業種別ホワイト ペーパーの作成を継続しています。たとえば Cloud Spanner を使ったグローバル マルチプレーヤー ゲームの開発方法では、お客様のための価値創出までの時間短縮の方法を示しています。

3 つ目として、Neo4j、Databricks、MongoDB、Informatica、Tableau、C3.ai などのデータ パートナー様のオープン エコシステムのサポートを継続しています。これによりお客様はデータクラウドを構築する際に 1 つのアプローチに縛られることなく、柔軟な選択が可能です。 

想像のその先へ

データの活用に Google Cloud をお選びくださったお客様に大変感謝しております。今後どのような展開が繰り広げられるのか、非常に楽しみです。Google Cloud のソリューションを使ってさまざまな組織がどのようにデータクラウドを構築しているのかをご覧ください。

- データベース、データ分析、Looker 担当バイス プレジデント兼ゼネラル マネージャー Gerrit Kazmaier