データ分析

BigQuery Omni のイノベーションでデータとクロスクラウド分析を組み合わせることでカスタマー エクスペリエンスを向上

#da

※この投稿は米国時間 2022 年 4 月 15 日に、Google Cloud blog に投稿されたものの抄訳です。

IT 責任者は多くの根拠に基づいて各種のクラウドを選択しますが、社内の他の人間は、こうした決定によって複雑性が生じる場合、何とかしてこれに対処する以外の選択肢は与えられていません。データ アナリストは、複数のデータサイロへの対応を迫られる際にその複雑性が強く感じられるのではないでしょうか。Google Cloud は、このデータスタックの異種性に起因する「壁」を解決するための投資に力を入れてきました。2021 年 10 月、Googleは、データアナリストがマルチクラウド環境の壁を越えてデータアクセスとデータクエリを簡単に実行できるよう、BigQuery Omni を発表しました。そして複数のクラウドにわたってデータを一括して表示、統合、分析するシームレスな方法として、引き続きクロスクラウド分析の強化に努めています。  

今年に入り、BigQuery Omni を早期から導入していた L’Oreal は、データ プラットフォームを最大限に活用するうえでのクロスクラウド分析のメリットについて語りました。Google は、データを移動またはコピーしなくてもデータ分析できる環境を企業が求めていることを理解しています。また、ときには少量のデータをクラウド間で移動し、クラウドならではの機能を利用する必要があることも認識しています。総合的なクロスクラウド分析ソリューションであれば、そのままでもデータを分析でき、必要に応じてデータを柔軟に複製することも可能です。

Google は先週、複数のクラウドにあるデータを簡単にまとめられる BigQuery Omni クロスクラウド転送機能を発表しました。これによりデータ アナリスト、データ サイエンティスト、データ エンジニアは、一括表示画面で AWS や Azure から BigQuery へとデータ パイプラインなしにデータを読み込めます。また、すべて SQL で管理されるため、あらゆる組織レベルでアクセスできます。この機能は、主に以下の 3 つのメリットを意図しています。

  • ユーザビリティ: BigQuery を使用し、一括表示画面でコンテキストの切り替えなしに複数クラウドにわたるデータのフィルタと移動を実行できる。

  • セキュリティ: フェデレーション ID モデルにより、データアクセスやコピーのための認証情報をクラウド プロバイダ間で共有または保存する必要がない。

  • レイテンシ: BigQuery の高性能 Storage API でデータの移動を管理するため、ユーザーが複雑なパイプを待つことなく必要なデータだけを楽に移動できる。

BQ control plane.jpg

お客様から伺った主なユースケースの一つは、AWS/Azure の PoS データを Google Analytics のデータと組み合わせて、総合的な購入予想モデルを作成することです。以下にデモをご紹介します。

デモからわかるように、データ アナリストは複数のクラウドにわたってエンドツーエンドでワークフローを実行できます。BigQuery Omni を使用したデータの変換、クロスクラウド転送によるデータの読み込み、ML モデルのトレーニングまで、すべて SQL で行えます。そのため、以下のメリットを通じてビジネスに大きな効果をもたらすことができます。

  • データセット間のユーザーの重複をなくし、トレーニング データを改善

  • マーケティング セグメンテーション モデルの精度向上

  • 広告費用対効果を改善することで、多額の企業キャンペーン費用を節約できる可能性

しかしこれで終わりではありません。Google は今後も多くの BigQuery ネイティブ ツールを提供して機能を強化し、スマートなデータ移動をサポートする予定です。いずれは、パイプのないパイプラインでのクロスクラウド データ移動となるでしょう。つまり、手軽なクロスクラウドのレイクハウスです。

プレビューに参加し、開発プロセスに関与していただける方は、ぜひこちらの簡単なフォームを送信してください


- BigQuery Omni プロダクト マネージャー Joe Malone