Analytics Hub で大規模なデータと分析アセットを安全に交換、プレビュー版提供開始
Google Cloud Japan Team
※この投稿は米国時間 2022 年 4 月 8 日に、Google Cloud blog に投稿されたものの抄訳です。
昨今、組織はイノベーションを推進し、オペレーショナル エクセレンスを実現するために、これまで以上にリアルタイムの正確なデータ分析ソリューションを利用してしています。組織は AI と機械学習を駆使して、さまざまなソースからのデータを組み合わせて実用的な分析情報を引き出し、結果を予測して、より多くの情報に基づく意思決定を行っています。また、多くの組織が、データアセットを収益化し、ユーザーにエコシステム外のデータへの安全なアクセスを提供するための新しい方法を模索しています。
とはいえ、セキュリティ上の脅威やプライバシー規制が高まる中で、パートナー、顧客、他の組織と安全にデータを共有したり交換したりすることは困難であるとも感じています。バッチ ETL パイプラインや FTP ダウンロードなど、従来のデータ共有の手法は維持費が高く、適切にスケーリングすることができません。データの断片化や陳腐化の原因となることもあります。
このようなデータ共有の課題を解決するために、このたび、Google は Analytics Hub のプレビュー版をリリースいたしました。この新しいフルマネージド サービスでは、組織間の境界を越えて、貴重なデータや分析アセットを効率的かつ安全に交換することが可能です。Analytics Hub は、Google のペタバイト規模のサーバーレス クラウド データ ウェアハウスである BigQuery を基盤としています。BigQuery 独自のアーキテクチャで、データのコピーを複数作成することなく、大規模なデータ共有が可能になります。データは常に「ライブ」で、組み込みのストリーミング機能を使用してリアルタイムで使用できます。BigQuery に組み込まれた機械学習機能、地理空間機能、高度な分析機能に加え、Looker、Google スプレッドシート、データポータルなど、ネイティブにサポートするビジネス インテリジェンス ツールも利用できます。
BigQuery のデータ共有は目新しいものではありません。実際、2010 年のリリース以来、BigQuery には組織を超えたインプレースのデータ共有機能が備わっています。2021 年 11 月時点で、4,500 以上のさまざまな組織が、BigQuery で 1 週間あたり 250 ペタバイト以上のデータを共有しています。Analytics Hub によりデータ共有がさらに容易になり、組織は共有データの可能性を最大限に発揮できるようになります。
ここでは、先行ユーザーの声をご紹介しましょう。
「あらゆる業界の組織で外部のデータがますます重要になり、一元化されたデータ統合と分析のニーズはこれまでになく高まっています。Google Cloud と協力して Analytics Hub のリリースを支援し、数百の外部データセットを数百の事前設計済みデータ パイプラインに供給できることを光栄に思います。Analytics Hub で実現される共有機能を利用すれば、実務担当者のデータ モビリティの要件が大幅に強化されるでしょう。Crux のデータ統合プラットフォームは、あらゆる外部データソースを迅速に統合し、Google Cloud とそのクライアントに代わって配信するためにスタンバイしています」- Crux、プロダクト担当シニア バイス プレジデント、Dan Lynn 氏
「Universal Film は GCP を活用して、高可用性とセキュリティに支えられたデータ サイエンスと分析の取り組みを、アジャイルで試験運用的なアプローチで変革することができました。Analytics Hub と BigQuery を組み合わせることで、全世界のマーケティング チーム全体でデータドリブンな出力の迅速なスケールアウトを促進し、データ パートナーとのデータ共有プロセスを合理化することができました。しかも DataOps のオーバーヘッドは最小限に抑えられています」- NBC Universal、グローバル データ戦略および変革担当シニア バイス プレジデント、Chris Massey 氏
「データと分析は世界を変えることができます。今日の絶えず変化する複雑なビジネス環境に対応するための支援から、誰もがより持続可能な未来に貢献できる方法の特定まで、それは多岐にわたります。当社の幅広いデータと Google Cloud の Analytics Hub との統合に期待しています。これにより、世界中のより多くのお客様が信頼性の高いデータにアクセスして、リスクを事前に特定し、将来の成長の機会を発見することが可能になります」- Dun & Bradstreet、データ担当最高責任者、Gary Kotovets 氏
「Neustar は Fortune 100 企業の 70% に、最も洗練されたマーケティング活動のための ID 解決、オーディエンス ターゲティング、測定の機能を提供しています。Google とのパートナーシップにより、Analytics Hub を通じて高度な機能を共通のお客様に直接提供できるようになりました」- TransUnion 傘下企業 Neustar、プロダクト管理担当バイス プレジデント、Ryan Engle 氏
「より持続可能なネットゼロの未来への移行を実現するには、投資家や企業が、持続可能性について、比較可能で信頼できる情報にアクセスできることが極めて重要といえます。Google Cloud の最先端のインフラストラクチャにより、ESG Book は、ESG データに対するデジタル化、合理化されたアプローチを提供し、実用的で価値のあるリアルタイムの分析情報を引き出せるようになりました。Google Cloud と協力し、市場をリードする Analytics Hub を活用できること嬉しく思います」- ESG Book(Arabesque)、CEO、Daniel Klier 博士
安全なデータ交換
Analytics Hub では、組織はデータの一元的な管理と配布を容易に行うことができます。データ パブリッシャーは、安全なデータ エクスチェンジを作成し、サブスクライバーに配信するデータセットを含んだリスティングを公開できます。デフォルトでは、エクスチェンジは完全に非公開で、プロビジョニングしているユーザーやグループのみが、リスティングの表示や登録を行えます。エクスチェンジを公開して、Google Cloud のすべてのお客様がリスティングの表示や登録を行えるようにすることもできます。データ共有のニーズに合わせて、複数のエクスチェンジを簡単に作成できます。
データ サブスクライバーには、Analytics Hub で、アクセス可能なすべてのエクスチェンジのリスティングを閲覧、検索するためのシームレスなエクスペリエンスが提供されます。関心のあるデータセットが見つかったら、そのリスティングに登録します。これにより、プロジェクト内に、リンクされた読み取り専用のデータセットが作成され、データのクエリや分析を実行できるようになります。リンクされたデータセットはデータのコピーではなく、共有データセットへのシンボリック リンクにすぎません。データ パブリッシャーが行った変更との同期も維持されます。
データ エコシステムのブートストラップ
組織では、サードパーティのソースからのデータを利用し、内部データでそれを補完して新たな分析情報を得る機会が増えてきています。Google は、Analytics Hub を利用して、信頼できる価値の高いソースのデータセットを簡単に検出して登録できるようにしたいと考えています。ユーザーは利用初日から以下のデータセットに登録できます。
一般公開データセット: 気象と天候、暗号通貨、医療とライフ サイエンス、運輸に関するデータなど、Google が管理する数百もの一般公開データセットに簡単にアクセスできます。
Google データセット: Google 独自の無料で使用できるデータセットで、例として Google トレンドのデータセットが挙げられます。このデータセットでは、ユーザーは Google 検索全体における特定のトピックや検索キーワードへの関心を、米国全土から都市に至るさまざまなレベルで測定できます。現在は、50 の国際市場のデータを利用することができます。
商用データセット: Crux Informatics との提携で、金融、地理空間、小売などにわたり、あらゆるデータを BigQuery に取り込んでいる商用プロバイダを利用できます。最近の Dun & Bradstreet との戦略的契約によるビジネスデータやインサイトにもご期待ください。
次のステップ
今すぐ Analytics Hub を使い始めるには、こちらのガイドを使用する、BigQuery の無料トライアルを開始する、Google Cloud セールスチームに問い合わせる、のいずれかの方法をご利用ください。パブリッシャー用の使用状況の指標、パラメータ化されたデータセット、プライバシーに配慮したクエリ、商業化の管理など、今後の機能のアップデートにもご期待ください。
- Google Cloud、プロダクト管理リード Nikhil Gaekwad