コンテンツに移動
データ分析

一貫性のあるビジネス用語を確立してデータの信頼性を高める

2023年2月7日
https://storage.googleapis.com/gweb-cloudblog-publish/images/da_2022_tDyfibl.max-2500x2500.jpg
Google Cloud Japan Team

※この投稿は米国時間 2023 年 2 月 1 日に、Google Cloud blog に投稿されたものの抄訳です。

本日は、公開プレビュー版になった Dataplex のビジネス用語集についてお知らせします。Dataplex は、分散データの大規模な管理、モニタリング、統制を可能にするインテリジェントなデータ ファブリックです。Dataplex のビジネス用語集を使用してクラウドネイティブな手法でビジネス用語および定義のメンテナンスと管理を行うことで、一貫性のあるビジネス用語を確立し、データの信頼性を高め、セルフサービスでのデータの利用を実現できます。

企業には、その規模にかかわらず、さまざまなチームが多数存在します。ある程度の期間が経つと、各チームが独自の用語の使い方をするようになります。たとえば、企業担当チームにとって「顧客」が「法人」を意味する一方、中央プラットフォーム担当チームでは「個人 / 法人 / 政府機関」となる場合などが考えられます。この認識のずれからコラボレーションで問題が発生することがあり、さらに悪くすると、データが誤って解釈されて分析情報や意思決定に影響が及ぶおそれもあります。また、この認識のずれによって、領域の専門外のユーザーはセルフサービスでデータを利用できなくなり、社内の仲間内の知識に依存せざるを得なくなることもあります。自分で対処しようとすると手作業の負担が増え、最新の変更内容を把握することが困難になります。

Dataplex のビジネス用語集は、以下の操作に対応しています。

  • 用語集に独自のビジネス用語を取り込む

  • 定義済みの用語をデータエントリ列にアタッチすることで、カタログ化されたデータエントリをこのビジネス用語で拡充する

  • 用語間の関連付けを行うことで、用語間のセマンティックな関係性を説明する

https://storage.googleapis.com/gweb-cloudblog-publish/images/Dataplex_business_glossary.max-2000x2000.jpg

Dataplex のビジネス用語集は、データ技術者を複数の面でサポートします。まず、チーム間でデータの定義と解釈を行う際にセマンティックな一貫性を促進することで、冗長性を最小限に抑え、データ利用時の混乱や誤った解釈が発生する可能性を低減します。たとえば、「小売取引」という用語について一元的にキュレーションされた定義が存在するとします。2 つのチームが小売取引の詳細を取り込む 2 つの異なるデータアセットを作成する場合、定義済みの用語との一貫性を保つようにこれらのデータアセットを構成します。

セマンティックな一貫性を確保することで、データに対する理解とデータの信頼性が強化されます。データアセットにアタッチされた用語集の用語は、一元的にキュレーションされた一貫性のあるビジネス コンテキストの追加のレイヤとなり、ユーザーはこのレイヤによってデータアセットが自分の目的にどの程度適合しているかを明確に確認できます。前述の顧客データの例で、アナリストが「すべての顧客テーブルを表示する」と検索した場合、「顧客」が個人を指すのか法人を指すのかといった、特定されたデータアセットのさまざまな解釈について懸念する必要がありません。ビジネス用語集を使用すると、関連付けられた用語集の用語を介して正しい解釈が行われ、これらのデータアセットに必要なコンテキストが提供されるとともに、アナリストは発見されたデータの関連性をより信頼性の高い方法で特定できるようになります。

ここからさらに、セルフサービスでのデータの利用が可能になります。ユーザーは用語集のコンテンツを利用してデータアセットを発見し(例:「定義内で ‘小売取引’ に言及している用語集の用語をアタッチしたエントリすべてを表示する」などの検索クエリを介して行います。検索でデータアセットを特定するときに、説明や関連付けられたデータ スチュワードなど、さまざまな用語のメタデータがどのように処理されるかに注意)、これらのデータアセットのセマンティックを理解し、結果的にこれらのデータアセットの適切な利用シナリオを特定できます。

さらに、Dataplex のビジネス用語集はデータ ガバナンスにも対応しており、データ ガバナンス チームは用語集のコンテキストを使用してデータ ガバナンス ポリシーの構成に関する決定を支援できます。たとえば、顧客データの処理に関するアクセス制御ポリシーを追加で制定する際に、「顧客」に言及している用語集の用語に関連付けられたデータアセットを考慮できます。

つまり、Dataplex のビジネス用語集と Dataplex の幅広いデータ ガバナンス機能を併用することで、一貫性のある共通のビジネス用語の確立、データの信頼性の強化、セルフサービスによる利用の促進、データからの価値の獲得を実現できます。

ご利用方法

Dataplex のビジネス用語集は Dataplex の [用語集] タブにあります。ビジネス用語を取り込むには、用語集、用語、用語間の関係を定義します。

続けて、Dataplex の検索でデータエントリを閲覧しながら、カタログ化されたエントリと定義した用語を関連付けます。

用語集のコンテンツの定義とデータエントリとの関連付けが完了すると、探索と検索で用語集のコンテンツを利用できるようになります。

詳細情報:



- プロダクト マネージャー Andrew Ikonnikov
- アドバンスト アナリティクス担当プロダクト マーケティング責任者 Ragi Mahil
投稿先