データ分析

Data Catalog と Dataplex の統合によるデータの管理とガバナンスの効率化

※この投稿は米国時間 2022 年 7 月 21 日に、Google Cloud blog に投稿されたものの抄訳です。

本日、Google Cloud Data Catalog を Dataplex と統合して単一のユーザー インターフェースとすることをお知らせします。この統合により、組み込みのデータ インテリジェンスと自動化機能を活用して、データの検索、関連するビジネス情報の付加、論理データドメインによる整理、分散データの一元的な管理とモニタリングが単一の環境で可能になります。お客様は統合されたメタデータ プラットフォームにアクセスできるようになりました。技術と運用のメタデータをビジネスのメタデータに接続し、この補強されたアクティブなメタデータを活用してインテリジェントなデータ管理とガバナンスを強化します。

エンタープライズ データを取り巻く状況は多様性を増し、複数のストレージ システムにわたる分散化が進んでおり、メタデータ、セキュリティ、ガバナンスはシステムによって異なっています。そのため、運用は複雑さを極めており、分散したデータを一貫して運用できるメタデータ プラットフォームへの需要が高まっています。

Dataplex では、データファブリックによる大規模な分散データのデータ管理、ガバナンス、検出、探索の自動化が可能です。Dataplex を使用することで、企業はデータを整理してデータドメインにし、データの所有権、使用、共有を、適切なビジネス コンテキストを持つデータ所有者に容易に委任できます。また、組織内のさまざまなデータドメインにおいて、一貫したデータのモニタリング、統制を行い一元管理できます。

この統合の前に、データのオーナー、スチュワード、管理者は、2 つのインターフェースを使用する必要があります。それは、データを整理、管理、統制する Dataplex と、データを検出、理解、拡充する Data Catalog です。この統合により、単一の一貫したユーザー エクスペリエンスを実現できます。これにより、お客様は所有するすべてのデータを自動的に検出してカタログ化できるようになります。また、データ系列の理解、データ品質の確認、ビジネス知識の補強、データをドメインに整理することが可能になり、結合したメタデータを使用してデータ管理を強化できます。さらに、組織のデータ ガバナンスの多様なニーズに対応する統合されたエクスペリエンスを提供し、大規模なデータ管理を可能にします。

「Data Catalog が Dataplex の一部となったことで、統合され、シンプルで効率化されたエクスペリエンスを通して効果的にデータを検出し、管理できるようになりました。これにより、当社のチームの生産性の向上と、迅速な分析が可能になりました。単一のエクスペリエンスで関連するビジネス コンテキストとともにデータを検索および検出できるようになり、このデータのビジネス ドメインに基づいた整理と管理も、信頼できるデータへの分析とデータ サイエンス目的でのアクセスも可能になりました。こうしたことがすべて同じプラットフォームで実現したのです」と、Loblaw Companies Limited のデータ エンジニアリング担当シニアディレクター Elton Martins 氏は言います。

unified dataplex.jpg

開始方法

既存および新規の Data Catalog と Dataplex のお客様は、メタデータの検出、管理、ガバナンスを目的とした Dataplex の使用を開始できるようになりました。ユーザー エクスペリエンスのインターフェースはこのリリースによって統合されますが、両製品の既存の API と機能はこれまでどおりに動作します。詳しくは、技術ドキュメントを参照するか、Google Cloud セールスチームにお問い合わせください。

- Google Cloud シニア プロダクト マネージャー Lu Yang

- Google Cloud プロダクト マネージャー George Verghese