データ分析

2021 年の Google Cloud データ分析: 1 年の振り返り

2021年12月27日

Google Cloud Japan Team

※この投稿は米国時間 2021 年 12 月 23 日に、Google Cloud blog に投稿されたものの抄訳です。

2021 年を振り返ったとき、Google のデータプラットフォームを使用して、新たな知見を獲得し、新しいビジネスモデルを構築して、従業員や顧客のエクスペリエンスを高めている企業が急増していることをうれしく思います。

データ自体は単なる情報であり、活用しなければ意味がありません。データが本当の力を発揮するのは、インテリジェントなアプリケーションの開発、的確な意思決定、自動化の拡大、そして最終的に価値創出方法の変革に使われたときです。

今年は、何万ものお客様が Google Cloud の統合データプラットフォームにより、データ面のメリットを享受しました。それは、データサイロの解消から、インターネット規模のアプリケーション開発、AI を使ったスマートプロセスの開発、自社の枠を越えてデータを資産に変えるデータメッシュの構築にまで及びます。

こうしたお客様は、いずれも Google Cloud の統合データプラットフォームを使用して、データサイロ間の壁を取り除き、分析への投資を加速させ、ビジネス上の成果を短期間で達成しています。

パートナー様、お客様、専門家の皆さまにとっての今年の重要なできごとについてご紹介できることを光栄に思います。日頃のご愛顧とご協力に感謝するとともに、サイロを解消し、データを価値あるものに変えるイノベーションのパートナーとして Google Cloud を選んでいただいたことにお礼申し上げます。

このソリューションの導入実例として挙げられるのが、フランス最大の食料品小売業者である Carrefour です。Carrefour は、適切な店舗で、適切な商品を、適切な買い物客に提供できるようにする必要がありました。そこで同社は Google Cloud を利用して商品推奨ツールを開発しました。これにより、店舗ごとにカスタマイズされた品揃えを提供できるようになり、店舗責任者は在庫ニーズへの自主対応ができるようになりました。また、Carrefour 本社がフランチャイズ店舗ごとの販売計画を立てる際にも、このツールを利用することにより、状況把握が容易になりました。

リアルタイムエンタープライズの実現

2021 年には、Google Cloud を使ったリアルタイムでのデータの処理や分析への移行を検討したお客様が増えました。ビジネスのスピードに合わせて意思決定を行い、優れたカスタマーエクスペリエンスを提供することが目的です。たとえば、Twitter のデータプラットフォームでは、日々、何兆ものイベントが取り込まれ、数百ペタバイトのデータが処理され、数万件のジョブが十数個のクラスタで実行されています。今回の拡大パートナーシップで、Twitter は BigQuery、Dataflow、Cloud Bigtable、機械学習（ML）のツールを含む Google のデータクラウドを採用することになりました。こうしたツールにより、急拡大する同社のデータエコシステムが強化され、データに基づく迅速な意思決定が可能になるだけでなく、より深層の ML を活用したサービスのイノベーションが可能になります。

別の事例として Verizon Media があります。同社は別のプロバイダから Google Cloud に乗り換え、毎日 200 TB を取り込んで BigQuery に 100 PB を格納し、1 秒間に 300 MB をストリーミングしています。また、Looker や BigQuery のほか、データプラットフォームのその他の機能を組み合わせて生産性を 90% 以上高めています。

最後に ATB Financial の事例を紹介します。同社は 80 万人以上の顧客をサポートする大規模な SAP バックボーンを Google Cloud に移行し、リアルタイムでのデータの取得、拡充、AI 支援とセルフサービスの分析のためのシステムを構築しました。

医療とライフサイエンス分野の成長

HCA Healthcare は BigQuery を使い、年間 3,200 万人に及ぶ受診者のデータを分析し、診療を改善できる箇所を特定しています。特に印象に残ったのは、同社の CEO である Sam Hazen 氏が「次世代の診療にはデータサイエンスに基づく意思決定のサポートが必要」と説明したこと、また「取り組みの基礎としてのイノベーションと継続的改善」に対する熱意は Google と HCA Healthcare の両社に共通のものと認識されていることです。

Moderna は、データを活用して、パンデミックの影響がマイノリティ集団に偏っている事実に対応しています。Looker の分析情報を使用して、COVID-19（新型コロナウイルス感染症）ワクチンの臨床試験参加者の多様性を高めることで、代表性を改善することが可能です。「Looker には奥深さがあります。単なる可視化ではありません。わかることが増えたら、さらに深堀りできます」と、Moderna の情報学、データサイエンス、AI 担当バイスプレジデントを務める Dave Johnson 氏は述べています。

また、Google が迅速で安全なデータ共有により、アメリカ国立がん研究所の乳がん研究をサポートできたことも光栄に思っています。大量の異種データを扱えるよう AI Platform と BigQuery を連携させ、「研究者が大量のデータを低コストで迅速に分析できること」を実証できました。

エンタープライズアジリティの向上

Niantic Labs は、数百万人のユーザーに対応する、グローバルにスケーラブルなゲームを Google Cloud 上に構築しました。この動画では、Google Kubernetes Engine（GKE）と Spanner を使ったスケーリングの経験のほか、同社のデータサイエンスチームがどのように BigQuery、Dataflow、Pub/Sub を使ってデータ分析を行っているかを伺いました。

最後に、Telefónica は、スペイン国内でデジタルトランスフォーメーション、5G モバイルのエッジコンピューティングを推進するために Google Cloud との提携を決めました。この提携の一環として、Google Cloud は、COVID-19（新型コロナウイルス感染症）の感染が拡大する中、経済回復を支援するためスペインに新たなクラウドリージョンを設ける予定です。また、Telefónica は、グローバル規模の顧客ベースに継続的に新しいサービスやツールを提供できるようにするため、社内のデジタル能力（機械学習、人工知能（AI）、データ分析、アプリケーション開発などの分野）を向上させる目的でも Google Cloud のサービスを利用する予定です。

Google Cloud のお客様が形作る 2021 年のデータクラウド動向

今年のお客様事例の中で特に印象深かったのは、お客様からのヒントや後押しが Google のプロダクトやサービスのレベルアップにつながった例です。

こういった例は、5 月末に初開催された Data Cloud Summit で発表されたデータ関連のあらゆる最新のプロダクトや機能の中に見ることができました。新たにリリースされた Dataplex は、お客様やユーザーがデータレイク、データウェアハウス、データマートの垣根を越えてデータを一元的に管理、モニタリング、統制できるサービスです。また、Datastream は、サーバーレスの変更データキャプチャ（CDC）とレプリケーションのサービスです。Analytics Hub は BigQuery を基盤に構築されたフルマネージドサービスで、お客様は安全で管理可能なデータ共有のエコシステムを作成できます。Database Migration Service により、Cloud SQL への移行はより簡単かつ迅速になりました。移行全体の 85% 以上が 1 時間以内に完了しており、大半のお客様が他のクラウドからデータベースを移行しています。

Google Cloud Next ‘21 では、サービスの改善点や新バージョンをお客様に報告するためだけの時間を設けました。多くの発表があった中、特にポイントとなるものをお伝えします。Google Cloud での Spark は、Google Cloud データプラットフォーム向けの世界初の自動スケーリング可能なサーバーレスの Spark サービスです。BigQuery Omni はクロスクラウドの分析ソリューションです。Google Earth Engine on Google Cloud は、50 ペタバイト以上に及ぶ Google Earth Engine の衛星画像や地理空間データセットのカタログを地球規模の分析に利用できるようにします。そして Spanner PostgreSQL Interface では、人気の PostgreSQL エコシステムのスキルやツールを使用して、Spanner の比類ないグローバルスケール、99.999% の可用性、強整合性といったメリットを享受できます。

年 1 回の Looker のユーザーカンファレンス JOIN の第 6 回も開催されました。教育的コンテンツが 3 日間にわたりライブ配信され、15 社を超えるお客様やパートナー様が、5 つの基調講演、33 のブレイクアウトセッション、12 の入門ガイド、27 の Data Circles of Success、そして好評のハッカソンに参加してくださいました。内容は、データエクスペリエンス、組み立て可能な分析、そして統合セマンティックモデルの活用方法に重点が置かれました。JOIN のセッションは現在、すべてオンデマンドでご覧いただけます

データエコシステムの活用

お客様からよくいただくフィードバックとして、データの対象を拡大し、周辺のデータエコシステムを活用することへの関心がありました。このフィードバックには主に次の 3 つの方法で対応しました。

最初に BigQuery 上に集合的インテリジェンスのエコシステムを立ち上げました。現在では 3,000 を超える組織が 250 ペタバイトを超えるデータを共有し、また Google Cloud は多様なユースケースに使用できる 150 を超える一般公開データセットを共有しています。

2 つ目として、この知識共有の精神をさらに進め、30 を超えるアーキテクチャ設計のパターンをパッケージ化しました。これにはコード、データモデル、業界のベストプラクティスが含まれます。また、小売、金融サービス、医療、ゲームなど業種別の専門知識を強化し、業種別ホワイトペーパーの作成を継続しています。たとえば Cloud Spanner を使ったグローバルマルチプレーヤーゲームの開発方法では、お客様のための価値創出までの時間短縮の方法を示しています。

3 つ目として、Neo4j、Databricks、MongoDB、Informatica、Tableau、C3.ai などのデータパートナー様のオープンエコシステムのサポートを継続しています。これによりお客様はデータクラウドを構築する際に 1 つのアプローチに縛られることなく、柔軟な選択が可能です。

想像のその先へ

データの活用に Google Cloud をお選びくださったお客様に大変感謝しております。今後どのような展開が繰り広げられるのか、非常に楽しみです。Google Cloud のソリューションを使ってさまざまな組織がどのようにデータクラウドを構築しているのかをご覧ください。

- データベース、データ分析、Looker 担当バイスプレジデント兼ゼネラルマネージャー Gerrit Kazmaier

投稿先

Data Analytics

BigQuery の会話型分析のご紹介

執筆者: Vasiya Krishnan • 所要時間: 3 分

Data Analytics

Dataflow の ML インフラストラクチャに関する最新情報

執筆者: Efesa Origbo • 所要時間: 3 分

Data Analytics

BigQuery AI: Gemini 3.0 対応、エンベディング生成の簡素化、新しい類似度関数

執筆者: Tianxiang Gao • 所要時間: 5 分

Data Analytics

Cloud Composer で Apache Airflow 3.1 を活用し、ワークフローオーケストレーションを強化

執筆者: Piotr Wieczorek • 所要時間: 4 分

2021 年の Google Cloud データ分析: 1 年の振り返り

Google Cloud Japan Team

リアルタイム エンタープライズの実現

医療とライフ サイエンス分野の成長

エンタープライズ アジリティの向上

Google Cloud のお客様が形作る 2021 年のデータクラウド動向

データ エコシステムの活用

想像のその先へ

関連記事

BigQuery の会話型分析のご紹介

Dataflow の ML インフラストラクチャに関する最新情報

BigQuery AI: Gemini 3.0 対応、エンベディング生成の簡素化、新しい類似度関数

Cloud Composer で Apache Airflow 3.1 を活用し、ワークフロー オーケストレーションを強化

リアルタイムエンタープライズの実現

医療とライフサイエンス分野の成長

エンタープライズアジリティの向上

データエコシステムの活用

Cloud Composer で Apache Airflow 3.1 を活用し、ワークフローオーケストレーションを強化