コンテンツに移動
データ分析

安全なデータ交換が可能な Analytics Hub の一般提供を開始

2022年12月15日
Google Cloud Japan Team

※この投稿は米国時間 2022 年 12 月 1 日に、Google Cloud blog に投稿されたものの抄訳です。

今日の世界では、組織はデータ共有をデータ戦略全体における不可欠な要素と見なしています。パートナーや顧客などのソースから得たデータを共有して利用することで、新たな分析情報を活用し、より多くの情報に基づいた意思決定の推進に取り組んでいます。また、多くの組織が、データアセットを収益化することで新たな収益源を生み出そうとしています。しかし、データ交換に使用されている既存のテクノロジーは、多くの課題をもたらします。FTP、メール、API などの従来のデータ共有手法は維持費がかかり、特に大規模な共有では、古いデータのコピーが複数作成されることがよくあります。組織は、データ共有の信頼性と整合性を高める方法を模索しています。

Google は最近、Analytics Hub の一般提供開始を発表しました。このフルマネージド サービスを使用することで、組織は、データアセットや分析アセットを組織内外と安全に交換できます。BigQuery 独自のアーキテクチャを基盤として、リアルタイム データを移動することなく大規模に共有できるようになりました。これは、データ管理費用の大幅な削減につながります。Google は今回のリリースの一環として、データ プロバイダとサブスクライバーの両者が共有データの可能性を最大限に引き出せるように、次のような機能を追加しました。

  • リージョン サポート: Analytics Hub サービスを、BigQuery のすべてのサポートされるリージョンで利用できるようになりました。

  • サブスクリプションの管理: データ プロバイダは、すべての共有データセットのサブスクリプションを 1 つのビューで簡単に表示して管理できるようになりました。

  • ガバナンスとアクセス: 管理者は、Analytics Hub の使用状況を監査ログと情報スキーマでモニタリングできるようになっただけでなく、VPC Service Controls でデータを安全に共有できるようになりました。

  • 検索と検出: サブスクライバーが関連するリストをすばやく見つけられるように、フィルタ ファセットを追加して検索機能を向上させました。

  • データ エコシステム: Analytics Hub に金融、地理空間、気候、小売などの業界の公開リスティングと商用リスティングを新たに数百件追加して、組織がサードパーティ ソースのデータを利用できるようにしました。また、Google トレンド、Google のダイバーシティ年次報告書、Google Cloud リリースノート、GCP データセンターのカーボンフリー エネルギー データ、COVID-19(新型コロナウイルス感染症)Open Data(ワクチン接種に関する検索インサイト)など、Google の自社データも追加しました。

パブリッシュ / サブスクライブ モデルでデータを安全に共有

Analytics Hub は、パブリッシュ / サブスクライブ モデルを使用して、データを大規模に配布します。データ プロバイダは、安全なデータ エクスチェンジを作成し、共有するデータセットを含んだリスティングを公開できます。エクスチェンジを使用することで、リスティングの表示や登録を行えるユーザーやグループを管理できます。エクスチェンジはデフォルトでは、Analytics Hub で限定公開ですが、公開するようリクエストして、公開データセットや商用データセットを Google Cloud のすべてのユーザーが利用できるようにすることも可能です。組織は、何百ものエクスチェンジを作成して、そのデータ共有のニーズを満たすことができます。

Analytics Hub はさらに、すべてのエクスチェンジのリスティングをシームレスに閲覧、検索できる機能も提供します。データ サブスクライバーは、対象となるデータセットを簡単に見つけ(1)、アクセスをリクエストしたり、アクセスできるリスティングに登録したりできます(2)。リスティングに登録すると、Analytics Hub の自身のプロジェクト内に、読み取り専用のリンクされたデータセットが作成され、クエリできるようになります(3)。リンクされたデータセットはデータのコピーではなく、共有データセットへのシンボリック リンクにすぎません。ソースに加えられた変更との同期も維持されます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1_Analytics_Hub.max-1900x1900.jpg

Analytics Hub のデータ共有のユースケース

2022 年 9 月の 1 週間で、BigQuery では 6,000 を超える組織が 275 ペタバイトを上回るデータを外部と共有していることが確認されました。これらのお客様の多くは、プレビュー版の Analytics Hub も使用して、さまざまなシナリオでデータを大規模に共有していました。そのユースケースの一部をご紹介します。

組織内でのデータ共有 - さまざまなビジネス機能や地理的情報のエクスチェンジを作成して、組織内でデータを共有できます。たとえば、マーケティング データのエクスチェンジを設定して、チャネルの最新のパフォーマンス、顧客プロフィール、商品の販売状況などをすべて公開できます。

外部とのコラボレーション - データを組織外部と共有する場合は、各パートナーや企業に限定公開するエクスチェンジを作成できます(B2B)。一般的な例としては、小売業者が各サプライヤーと販売データを共有するケースが挙げられます。

データアセットの収益化 - データ プロバイダは、データセットを収益化し、商用エクスチェンジでデータを配布することもできます。商用プロバイダは現在、資格付与や請求をオフラインで行えるプロセスを使用し、Analytics Hub でデータへのアクセスをプロビジョニングしています。

サードパーティ データで分析情報を拡充 - 外部やサードパーティのデータを活用することで、新たな分析情報を発見したり、競争優位性を獲得したりできます。Analytics Hub とその充実したデータ エコシステムは、分析に適した公開データセットや商用データセットへの簡単なアクセスを可能にします。このプラットフォームでよく利用されるデータセットの一例としては、Google トレンドが挙げられます。

お客様とパートナーの声をご紹介します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/LiveRamp_v1.max-700x700.jpg

LiveRamp のプロダクト担当 SVP である Kimberly Bloomston 氏は、次のように述べています。「Analytics Hub を使用すると、データ サイエンティストがクラウド上の新しいデータアセットを簡単に見つけて登録できます。このサービスが追加されたことで、LiveRamp はネイティブ ソリューションのスイートで GCP を完全にサポートできるようになりました。その結果、マーケティングと広告での精度が向上し、パートナーとのつながりが強化され、より多くのオーディエンスを有効化できるようになったのです。このようなパートナーシップの拡大により、不可欠な分析インフラストラクチャが構築され、厳格に定められたグローバルなプライバシー規制を遵守しつつ、データからより多くの価値を引き出せるようになりました。」

https://storage.googleapis.com/gweb-cloudblog-publish/images/ravelin_v1.max-700x700.jpg

「パートナーやクライアントとデータを安全に共有することは常に課題です。所有権、課金、セキュリティの問題は、どの組織にとっても一筋縄ではいきません。パブリッシュ / サブスクライブ モデルを使用する Analytics Hub には、こういった問題を解決する術がすでに盛り込まれています」と、Ravelin のプリンシパル ソフトウェア エンジニアである Jono MacDougall 氏は語っています。

https://storage.googleapis.com/gweb-cloudblog-publish/images/true_fit_v1.max-700x700.jpg

「BigQuery の採用を決めた主な要因の一つは、Analytics Hub(AH)を利用できることです。従来のモデルでは、データをフラット ファイルとして共有したり、受信したりしていたため、手間がかかり、非効率的で、費用もかさんでいました。Analytics Hub の先行導入によってこの状況を大幅に変え、GCP をメインで使っているお客様やパートナーにその機能を紹介しています。そして、これらのエンティティ間の多方向のデータ交換を可能にし、その過程で獲得した貴重な分析情報の収益化を進めています」と、True Fit の CTO である Raj Chandrasekaran 氏は述べています。

次のステップ

今すぐ Analytics Hub を使い始めるには、こちらのガイドを使用する、BigQuery の無料トライアルを開始する、Google Cloud の営業チームに問い合わせる、のいずれかの方法をご利用ください。このサービスには、プロバイダの使用状況に関する指標、承認ワークフロー、プライバシーに配慮したクエリを可能にするデータ クリーンルーム、商用化ワークフローなど、さまざまな機能を追加していきますので、今後の最新情報にご期待ください。


- Google Cloud、プロダクト管理リード Nikhil Gaekwad
投稿先