キュレートされたデータとコンテキストのための Dataplex Universal Catalog のデータ プロダクトのご紹介
Deepinder Dhuria
Product Manager
George Verghese
Product Manager
※この投稿は米国時間 2025 年 12 月 5 日に、Google Cloud blog に投稿されたものの抄訳です。
多くの組織は、断片化されたデータが多すぎて、それがビジネス目標にどのように影響するのかを明確に把握できていません。これは、重大な断絶を引き起こします。データ利用者(分析情報を生成するためにデータを必要とするアナリストやデータ サイエンティスト)は、必要なデータを簡単に発見、アクセス、信頼することができません。一方、データ プロデューサー(これらのデータアセットを所有するチーム)は、利用者がセルフサービスでデータにアクセスできるようにすることができません。信頼できるコンテキスト豊富なデータに簡単にアクセスできなければ、組織は AI やエージェント技術の導入に苦労する可能性があります。
組織がこれらの課題を克服できるよう、Google はデータ プロダクトを、Google Cloud の統合されたインテリジェント データから AI ガバナンス ソリューションである Dataplex Universal Catalog に導入します。データ プロダクトとは、特定のビジネス課題を解決するために意図的に組み立てられた、データアセット、ドキュメント、ガバナンス管理からなる、キュレートされたすぐに使用できるパッケージです。データ プロダクトは単なるデータではなく、ビジネス価値を実証し、組織内の AI イノベーションを促進するのに役立ちます。データ プロダクトは現在プレビュー版として利用可能です。
データ プロダクトについて
データ プロダクトとは、本質的にアセットのグループがビジネス問題にどのように対処するかをモデル化した、ディストリビューションの論理ユニットです。Google はこれを、棚に並んでいるラベル、説明書、品質保証が付いた商品のデータ版と考えています。元のデータアセットを抽象化して、組織全体で信頼性の高い、検出可能な価値のあるリソースへと変換します。これにより、データチームは以下をより効率的に行えるようになります。
-
期待値を定義する: データ プロデューサーは、同じアドホックな質問に何度も答える代わりに、データ品質、鮮度、想定されるユースケースに関する情報を、データ プロダクトのドキュメントや契約書に直接カタログ化できます。
-
管理トイルを削減する: データ プロダクトを使用することで、ユースケースごとにアセットを論理的にグループ化できます。これによりアクセス管理が簡素化され、個々のアセットを管理するために必要な手作業が軽減されます。
-
価値を実証する: データアセットをそれらが提供するビジネス ユースケースに直接リンクすることで、データチームは創出する価値を明確に実証し、履歴データだけでなく影響に基づいて予算支出を正当化できます。
データ プロダクトの使用方法
データ プロダクトは、大まかに以下の基本的な機能を提供します。
-
ユースケースに合わせて設計する: ビジネス課題を特定し、そのユースケースを解決するデータ プロダクトをモデル化します。
-
オーナー権限を確立する: データ プロダクトのオーナー権限を定義し、アカウンタビリティを確保します。
-
コンテキストを民主化する: プロダクトが解決する問題を、使用例と期待値とともに文書化します。
-
契約を定義する: 消費者に信頼を提供し、契約上の保証を伝えます。
-
アセットを管理する: プロダクトを閲覧できるユーザーを管理し、データアセットへのアクセスを規制します。
-
発見を可能にする: データ利用者がデータ プロダクトを簡単に探してアクセスをリクエストできるよう支援します。
-
サービスを進化させる: プロダクトを反復的に進化させ、利用者のニーズに応えます。
具体的にはどのような意味があるのでしょうか?あなたはマーケティング チームのデータ プロデューサーであるとします。組織のデータ サイエンティストなどのデータ利用者は、四半期ごとのキャンペーンのパフォーマンスを分析して、今後の調整を提案することが常に求められています。「マーケティング キャンペーン分析」データ プロダクトでデータ利用者を支援する方法は以下のとおりです。
-
データ プロダクトを作成する: まず「マーケティング キャンペーン分析」という名前の新しいデータ プロダクトを作成します。ご自身を所有者として割り当て、連絡先情報を入力してください。
-
プロジェクトを横断してアセットをキュレートする: 次に、分析に必要な関連アセットを追加します。たとえば、BigQuery のテーブルとビュー(ad_spend_daily、customer_conversions、website_traffic_logs など)を含めることができます。
-
ロールと権限を定義する: データ プロダクトのアセットへのアクセスを管理および制御するため、data_scientist グループを作成し、このグループにすべてのアセットに対する viewer アクセス権を付与します。
-
データ契約を確立する: 信頼構築のため、データ プロダクトの更新頻度を指定し、契約条件を伝えます。
- 詳細ドキュメントを追加する: 最後に、このデータ プロダクトがキャンペーン分析における唯一の信頼できる情報源であることを説明する詳細な説明を追加します。SQL クエリの例やその他のアーティファクトへのリンクを含めてください。


画像 1: データ プロデューサーは、アセット、権限、契約、コンテキストをパッケージ化してデータ プロダクトを作成する
データ サイエンティストは、「キャンペーン分析」を検索し、このデータ プロダクトを見つけてアクセスをリクエストするだけで、データの品質と出所を確信したうえで業務に必要なすべての情報をすぐに入手できます。


画像 2: データ利用者はデータ プロダクトを見つけてそのコンテキストを理解し、アクセスをリクエストする
「私たちは、Google Cloud のデータ プロダクトを使用して、Virgin Media O2 のデータ共有機能を強化しています。この進化により、データ契約の豊富なコンテキスト、明確なデータリネージ、強化されたメタデータなど、データが真のプロダクトとして扱われるようになります。この合理化されたワークフローにより、チームは必要なデータをより迅速に取得できるようになり、データに基づく意思決定が加速します。」- Virgin Media O2、データ アプリケーション担当ディレクター、Jonathan Ford 氏
データ プロダクトは AI とエージェントをどのように強化するか
Google は、データ プロダクトは AI とエージェント テクノロジーの導入の基盤であり、組織が個々のデータアセットを管理する段階から、価値主導の論理ユニットを提供する段階へと移行するのに役立つと考えています。データ プロダクトは、以下の方法で AI とエージェントによるイノベーションを促進します。
-
ビジネスですぐに使用できる高品質なデータを提供する: データ プロダクトは特定のビジネス課題を解決するアセットで事前にキュレートされているため、AI エージェントが、すでにクレンジング、整理され、ビジネス目標に沿ったデータでトレーニングおよび運用されることを保証するのに役立ちます。
-
豊富なコンテキストでエージェントをグラウンディングして正確な分析情報を得る: AI の重要な課題の一つに、グラウンディングがあります。グラウンディングとは、モデルの出力を検証可能な情報源に紐付け、虚偽または誤解を招くコンテンツが生成される可能性を低減する機能です。データ プロデューサーは、包括的なドキュメント、契約書、その他のメタデータなど、豊富なコンテキスト情報でデータ プロダクトを充実させ、AI エージェントがレスポンスの根拠とする強固な基盤を提供できます。
-
会話型 AI と行動につながるインサイトを強化する: 高品質のデータと豊富なコンテキストを組み合わせることで、データ プロダクトは会話型 AI を強化できます。ユーザーがデータ プロダクトを活用する AI エージェントと対話する際、エージェントはより関連性が高く、ニュアンスに富んだレスポンスを提供できます。
上記と同様の「マーケティング キャンペーン分析」の例を使用すると、ビジネス コンテキスト、サンプルクエリ、ad_spend_daily と customer_conversions のスキーマ定義を含む詳細なドキュメントを含むデータ プロダクトにより、AI エージェントがこのコンテキストを「読み込み」、より正確なレスポンスを提供できるようになります。
準備は整いましたか?Dataplex Universal Catalog のデータ プロダクトの詳細については、こちらのドキュメントをご覧ください。
-プロダクト マネージャー Deepinder Dhuria
-プロダクト マネージャー George Verghese


