データメッシュとは

データメッシュは、複雑な組織のデータを管理するためのアーキテクチャフレームワークです。一元化されたモデルとは異なり、データメッシュではデータの所有権をドメイン固有のチームに分散します。このアプローチは、データをプロダクトとして扱うことでボトルネックを解消するのに役立ちますが、新たなリソース要件も発生します。データメッシュの成功は、特定のデータエンジニアリングスキルとガバナンス機能を備えたドメインチームに依存します。分散チームをサポートするリソースを備えた組織の場合、データメッシュによってアジリティを向上させることができます。そうでない場合、データウェアハウスやデータレイクなどの一元化されたモデルの方が、引き続きより効率的なソリューションとなることもあります。

データメッシュの基本原則

データメッシュは、新しいツールやテクノロジーのセットではありません。これはデータについての企業の考え方の変化です。データメッシュのアプローチには、4 つの基本原則があります。これらの原則により、従来の一元的なデータアーキテクチャの問題を解決するアプローチが非常に効果的になります。

ドメイン指向の所有権

従来のデータアーキテクチャでは、IT チームやデータエンジニアリングチームなど、単一の中央チームがすべてのデータを管理します。データメッシュでは、データの所有権は、データを作成するビジネスドメインに分散されます。たとえば、セールスチームは自分たちが生成する顧客データを所有し、マーケティングチームは自分たちが作成するキャンペーンデータを所有します。これにより、チームは自分たちが生成するデータに対する責任や説明責任が大きくなります。

プロダクトとしてのデータ

ドメイン指向の所有権では、データを作成するチームは、データをプロダクトのように扱う必要があります。企業が顧客に高品質なプロダクトを提供するのと同じように、データドメインチームは、データを必要とする他のチームに高品質なデータを提供する必要があります。つまり、データを検出、理解、使用しやすくします。また、データは信頼性が高く、安全で、適切に文書化されている必要があります。また、アクセス制御を組み込んで、適切なユーザーのみが、自分のユースケースに適したデータにアクセスできるようにする必要があります。

プラットフォームとしてのセルフサービス型データインフラストラクチャ

データをプロダクトとして扱えるように、データメッシュはセルフサービスプラットフォームを使用します。このプラットフォームは、データドメインチームが、中央データチームによる支援を必要とせずにデータプロダクトを簡単に作成、管理できるようにするツールとサービスのセットです。これはシンプルで使いやすいプラットフォームで、データストレージ、セキュリティ、ガバナンスなど、データ管理に伴う多くの技術的タスクを自動化します。

連携型コンピューティングガバナンス

データは分散化されてさまざまなチーム全体に広がっているため、全員が同じルールに従うようにする方法が必要です。そこで役立つのが、連携型コンピューティングガバナンスです。このモデルでは、小規模な中央チームがすべてのデータに関するグローバルなルールと基準を設定します。ただし、これらのルールの適用は、それぞれのデータドメインチーム自身によって行われます。これにより、ポリシーの一元化と実行の分散化の両方の利点を活かすことができます。

データメッシュに関するよくある質問

メッシュ内のデータプロダクトはどのような機能を提供する必要がありますか？

データメッシュのデータプロダクトは、見つけやすく、参照可能で、信頼でき、自己記述型で、安全である必要があります。データ利用者が簡単にデータを発見し、その内容を理解し、高品質であることを認識できるようにする必要があります。また、明確で一貫したアクセスルールを適用して、セキュリティを確保することも必要です。

データメッシュを始めるにはどうすればよいですか？

データメッシュの導入は段階的なプロセスです。多くの場合、小規模なパイロットプロジェクトと少数の意欲的なドメインチームから始めるのが最も良い方法です。まず、データの自律性を高めることでメリットが得られるビジネスドメインを特定します。次に、そのチームがデータプロダクトを作成できる最小限のセルフサービスプラットフォームを作成します。プロジェクトが成功したら、その結果を概念実証として使用し、組織全体にデータメッシュアーキテクチャを導入します。

データメッシュの導入にリスクや課題はありますか？

最大の課題の一つは、企業文化の変革です。一元的なデータチームが管理を放棄するのは難しい場合があります。また、データセキュリティの確保や分散システムの管理など、技術的な課題もあります。しかし、慎重な計画と明確なコミュニケーション戦略があれば、これらの課題を克服できます。

データメッシュは既存のデータシステムをどのようにサポートし、統合しますか？

データメッシュは、既存のデータシステムと連携するように設計されています。現在のデータレイクやデータウェアハウスを廃棄する必要はありません。代わりに、それらの上に実装できます。データメッシュは、統一されたセルフサービス方式により、チームがさまざまなソースからデータにアクセスできる新たなレイヤとして機能します。

データメッシュに関してよくある誤解や誤った認識にはどのようなものがありますか？

データメッシュは、購入できるサービスだと誤解されることがよくあります。そのようなものではありません。これは、データを整理、管理する新しい方法です。また、データメッシュが大企業のみを対象としているという誤った認識もあります。これは大企業で最も一般的に使用されますが、その原則は小規模組織にも同様に適用できます。

データメッシュの成功や ROI をどのようにして測定しますか？

データメッシュの成功を測定するのは難しい場合があります。なぜなら、最初はメリットが金銭的なものではないことが多いからです。代わりに、データ配信の速度、データプラットフォームを使用しているチームの数、チームが使用しているデータに対して持つ信頼などを調べることで成功を測定できます。時間が経つにつれて、こうした改善が、ビジネス成果の向上や投資収益率（ROI）の向上につながる可能性があります。

データメッシュと従来のデータアーキテクチャの比較

データメッシュアプローチは、従来のデータアーキテクチャで発生するいくつかの一般的な問題を解決するために作成されました。個々の部門やチームが所有するデータウェアハウスやデータレイクなどのモデルは、特に企業の成長に伴って、データサイロやガバナンスのリスクを生み出す可能性があります。データメッシュはこれらの問題に対処するために、所有権を分散して個々のチームを強化しながらも一元管理を維持し、ドメインを横断してデータを統制、モニタリングします。

機能	データメッシュ	従来のアーキテクチャ
アーキテクチャモデル	非集中化され、ビジネスドメイン全体に分散されます。	一元化され、モノリシックであり、単一のチームによって管理されます。
データの所有権	データは、データを作成して使用するドメインチームが所有する。	データは中央データチームが所有および管理する。
データアクセス	チームは標準化されたデータプロダクトを通じてデータにアクセスします。	チームは、データを入手するために中央チームを経由する必要がある。
スケーラビリティ	新しいドメインチームやデータプロダクトの追加に合わせて、簡単に拡張できます。	組織の成長やデータ量の増加に伴い、ボトルネックが生じる可能性があります。
データ品質	ドメインチームが自身のデータの品質に対して説明責任を負うため、データの信頼性と精度を向上させることができます。	中央チームが各ドメインのコンテキストを把握していないと、データ品質に一貫性がなくなる可能性があります。
データガバナンス	ガバナンスは、一元的に設定され、ドメインチームによって適用されるグローバルな標準とルールにより連携されます。	ガバナンスは一元化され、1 つのチームですべて処理されます。
ユースケース	多様なデータと独立したビジネスユニットを持つ大規模で複雑な組織に最適です。	小規模な組織や、信頼できる唯一の情報源を必要とする特定のユースケースに最適です。
必要な技術的専門知識 / リソース	各ドメインチーム内に分散された技術スキル（エンジニアリング、ガバナンス）が必要です。	技術的な専門知識を 1 つのコア IT チームやデータエンジニアリングチームに集中させます。

機能

データメッシュ

従来のアーキテクチャ

アーキテクチャモデル

非集中化され、ビジネスドメイン全体に分散されます。

一元化され、モノリシックであり、単一のチームによって管理されます。

データの所有権

データは、データを作成して使用するドメインチームが所有する。

データは中央データチームが所有および管理する。

データアクセス

チームは標準化されたデータプロダクトを通じてデータにアクセスします。

チームは、データを入手するために中央チームを経由する必要がある。

スケーラビリティ

新しいドメインチームやデータプロダクトの追加に合わせて、簡単に拡張できます。

組織の成長やデータ量の増加に伴い、ボトルネックが生じる可能性があります。

データ品質

ドメインチームが自身のデータの品質に対して説明責任を負うため、データの信頼性と精度を向上させることができます。

中央チームが各ドメインのコンテキストを把握していないと、データ品質に一貫性がなくなる可能性があります。

データガバナンス

ガバナンスは、一元的に設定され、ドメインチームによって適用されるグローバルな標準とルールにより連携されます。

ガバナンスは一元化され、1 つのチームですべて処理されます。

ユースケース

多様なデータと独立したビジネスユニットを持つ大規模で複雑な組織に最適です。

小規模な組織や、信頼できる唯一の情報源を必要とする特定のユースケースに最適です。

必要な技術的専門知識 / リソース

各ドメインチーム内に分散された技術スキル（エンジニアリング、ガバナンス）が必要です。

技術的な専門知識を 1 つのコア IT チームやデータエンジニアリングチームに集中させます。

データメッシュのユースケース

データメッシュのアプローチは、複数のビジネスユニットと大量のデータを抱える大規模で複雑な組織に特に役立ちます。ここでは、データメッシュが大きな価値を提供できる一般的なユースケースをいくつか紹介します。

データ分析と BI

データメッシュは、組織がデータ分析とビジネスインテリジェンス（BI）の取り組みからより多くの価値を引き出すのに役立ちます。さまざまなドメインのデータプロダクトを使用することで、データサイエンティストやアナリストは、ビジネスをより包括的に把握できるようになります。たとえば、小売企業は、セールスドメインの顧客データとマーケティングドメインのウェブトラフィックデータを組み合わせることで、顧客の行動をより深く理解できます。

お客様の 360 度イニシアチブ

お客様の 360 度イニシアチブは、さまざまなソースのデータを組み合わせてお客様の完全なビューを作成することを目的としています。一元化されたデータアーキテクチャでは、データがさまざまな部門にサイロ化さていることが多いため、これは困難になる可能性があります。データメッシュでは、標準化された方法で、セールス、マーケティング、サポートなどのさまざまなドメインのデータプロダクトにアクセスして組み合わせることができるため、これを非常に簡単に実現できます。

モニタリングと不正行為の検出

金融サービスでは、データメッシュはリアルタイムモニタリングや不正検出に役立ちます。たとえば、銀行では、トランザクション用のデータプロダクトと顧客ログインデータ用のデータプロダクトを別々に持つことができます。不正検出システムは、この両方のデータプロダクトにアクセスして、不審な行為を特定できます。データメッシュは、その非集中的な性質により、このような種類のアプリケーションに必要な速度と信頼性の向上に役立ちます。

規制遵守とデータ主権

データプライバシー規制が複雑になるにつれて、一元化されたデータモデルでコンプライアンスを確保するのが困難になる可能性があります。データメッシュは、ドメインチームが自身のデータプロダクトを管理し、現地の法律を遵守していることを確認できるようにすることで、規制遵守を支援します。これは、国ごとに異なるデータ主権規則を遵守する必要がある多国籍企業にとって特に重要です。

データサイエンスエージェントと AI エージェント

高度な AI アプリケーションとエージェントが効果的に機能するには、高品質でコンテキストが豊富なデータが必要です。データメッシュでは、ドメインチームが利用目的に合わせてデータをキュレートし、データをクリーンで、ラベル付けされ、文書化された状態にします。これにより、データサイエンティストは、データの準備に過度の時間を費やすことなく、信頼できる入力に基づいてモデルをトレーニングできます。さらに、AI エージェントは API を介してこれらのモジュール式データプロダクトにアクセスし、リアルタイムの情報を取得できるため、さまざまなビジネスドメイン全体にわたる複雑なタスクをより高い精度で実行できます。

データメッシュの導入によるメリット

データメッシュの導入は、組織に大きなメリットをもたらします。非集中型モデルに移行することで、企業は従来のアーキテクチャのボトルネックを克服し、より良いビジネス成果を達成できます。

アジリティとスケーラビリティ

データメッシュはよりアジャイルになることができます。各データドメインは独立して動作できるため、組織はより迅速に拡大し、進化できます。中断を引き起こすことなく、新しいデータプロダクトやサービスを簡単に追加できるようになります。

データ品質と信頼性

データメッシュでは、データを生成するドメインチームにアカウンタビリティを割り当てることができます。ドメインチームは自身のデータの主な利用者でもあるため、その品質を確保する強い動機があります。このことが、より信頼性の高いデータにつながります。

費用対効果

また、データメッシュは、企業の費用効率の向上にも役立ちます。一元化されたデータプラットフォームでは、チームはデータのニーズを満たすために、中央のデータチームの支援を待たなければならないことがよくあります。これにより、遅延やリソースの無駄が発生する可能性があります。

統合データファブリックと一元化されたガバナンスを確立する

Knowledge Catalog は統合データファブリックとして機能し、データメッシュ全体に中央ガバナンスレイヤを提供します。これはさまざまな環境に分散されたデータを検出、管理、統制するのに役立ち、メタデータとポリシーの信頼できる唯一の情報源を確保できます。まず、Knowledge Catalog レイクを作成する必要があります。Knowledge Catalog レイクは、データを保持する最上位のコンテナで、通常はビジネスドメインにマッピングされます。

レイクを作成する手順は次のとおりです。

Google Cloud コンソールで、Knowledge Catalog の [レイク] ページに移動します。
[作成] をクリックした後、新しいレイクに「Sales Data Domain」や「Marketing Data Mesh」などのわかりやすい名前を付けます。
レイクのリージョンを選択します。
レイクを作成したら、ゾーンを追加できます。ゾーンはレイク内のサブドメインで、特定のチームやデータ契約を表します。たとえば、「Sales Data Domain」レイク内に、未処理データ用の「Raw」ゾーンと、クリーンアップされたプロダクションレディなデータ用の「Curated」ゾーンを作成できます。
ゾーンを作成したら、アセットをゾーンにアタッチできます。アセットは、Cloud Storage や BigQuery などのサービスに保存されている実際のデータです。Knowledge Catalog ゾーンでデータのロケーションを指定するだけです。

Knowledge Catalog はこれらのアセットを自動的にスキャンし、メタデータを検出してカタログ化します。

データプロダクトマーケットプレイスで発見を加速

「プロダクトとしてのデータ」原則の重要な要素は、データを簡単に見つけられるようにすることです。BigQuery のデータ共有により、データプロダクトマーケットプレイスを構築できます。これにより、ドメインチームはデータをコピーまたは移動することなく、データプロダクトを他のチームと安全に共有できます。これはデータ利用者が必要なデータを見つけるのに役立ち、データ利用者は明確で適切に定義されたインターフェースを使用してデータにアクセスできます。

サーバーレスプラットフォームでデータプロダクトを構築してデータを共有

Google Cloud のサーバーレスサービスにより、ドメインチームは最小限のオーバーヘッドで独自のデータプロダクトを作成、管理できます。BigQuery は、チームが大規模なデータセットを迅速かつ効率的に分析できる、高性能なサーバーレスデータウェアハウスです。Dataflow は、データプロダクトのデータパイプラインを構築して自動化するために使用できるサーバーレスのデータ処理サービスです。これらのサービスにより、中央のデータエンジニアリングチームがインフラストラクチャを管理する必要性が軽減され、ドメインチームの自律性と俊敏性が向上します。

属性ベースのアクセス制御でコンプライアンスを確保

連携型コンピューティングガバナンスとは、中央チームがグローバルルールを定義し、ドメインチームがそれを適用するという原則です。Google Cloud の Identity and Access Management（IAM）の条件は、これを実装するためのツールを提供します。IAM Conditions を使用すると、属性ベースのアクセス制御（ABAC）が可能になり、データ属性に基づいてきめ細かい権限を設定できます。たとえば、ユーザーが特定のリージョンの顧客データにのみアクセスできるようにするポリシーを作成して、GDPR などのデータ主権に関する規制を確実に遵守することができます。

Google Cloud でビジネスの課題を解決する

新規のお客様には、Google Cloud で使用できる無料クレジット $300 分を差し上げます。

次のステップ

$300 分の無料クレジットと 20 以上の無料枠プロダクトを活用して、Google Cloud で構築を開始しましょう。

開始にあたりサポートが必要な場合
お問い合わせ
信頼できるパートナーと連携する
パートナーを探す
もっと見る
すべてのプロダクトを見る

データメッシュとは

BigQuery と Knowledge Catalog（旧 Dataplex）でのデータメッシュの構築

データメッシュの基本原則

ドメイン指向の所有権

プロダクトとしてのデータ

プラットフォームとしてのセルフサービス型データインフラストラクチャ

連携型コンピューティングガバナンス

データメッシュに関するよくある質問

メッシュ内のデータプロダクトはどのような機能を提供する必要がありますか？

データメッシュを始めるにはどうすればよいですか？

データメッシュの導入にリスクや課題はありますか？

データメッシュは既存のデータシステムをどのようにサポートし、統合しますか？

データメッシュに関してよくある誤解や誤った認識にはどのようなものがありますか？

データメッシュの成功や ROI をどのようにして測定しますか？

データメッシュと従来のデータアーキテクチャの比較

データメッシュのユースケース

データ分析と BI

お客様の 360 度イニシアチブ

モニタリングと不正行為の検出

規制遵守とデータ主権

データサイエンスエージェントと AI エージェント

データメッシュの導入によるメリット

アジリティとスケーラビリティ

データ品質と信頼性

費用対効果

統合データファブリックと一元化されたガバナンスを確立する

データプロダクトマーケットプレイスで発見を加速

サーバーレスプラットフォームでデータプロダクトを構築してデータを共有

属性ベースのアクセス制御でコンプライアンスを確保

Google Cloud でビジネスの課題を解決する

関連プロダクトとソリューション

次のステップ

開始にあたりサポートが必要な場合

信頼できるパートナーと連携する

もっと見る

データメッシュとは

BigQuery と Knowledge Catalog（旧 Dataplex）でのデータメッシュの構築

データメッシュの基本原則

ドメイン指向の所有権

プロダクトとしてのデータ

プラットフォームとしてのセルフサービス型データ インフラストラクチャ

連携型コンピューティング ガバナンス

データメッシュに関するよくある質問

メッシュ内のデータ プロダクトはどのような機能を提供する必要がありますか？

データメッシュを始めるにはどうすればよいですか？

データメッシュの導入にリスクや課題はありますか？

データメッシュは既存のデータシステムをどのようにサポートし、統合しますか？

データメッシュに関してよくある誤解や誤った認識にはどのようなものがありますか？

データメッシュの成功や ROI をどのようにして測定しますか？

データメッシュと従来のデータ アーキテクチャの比較

データメッシュのユースケース

データ分析と BI

お客様の 360 度イニシアチブ

モニタリングと不正行為の検出

規制遵守とデータ主権

データ サイエンス エージェントと AI エージェント

データメッシュの導入によるメリット

アジリティとスケーラビリティ

データ品質と信頼性

費用対効果

統合データ ファブリックと一元化されたガバナンスを確立する

データ プロダクト マーケットプレイスで発見を加速

サーバーレス プラットフォームでデータ プロダクトを構築してデータを共有

属性ベースのアクセス制御でコンプライアンスを確保

Google Cloud でビジネスの課題を解決する

関連プロダクトとソリューション

次のステップ

開始にあたりサポートが必要な場合

信頼できるパートナーと連携する

もっと見る

プラットフォームとしてのセルフサービス型データインフラストラクチャ

連携型コンピューティングガバナンス

メッシュ内のデータプロダクトはどのような機能を提供する必要がありますか？

データメッシュと従来のデータアーキテクチャの比較

データサイエンスエージェントと AI エージェント

統合データファブリックと一元化されたガバナンスを確立する

データプロダクトマーケットプレイスで発見を加速

サーバーレスプラットフォームでデータプロダクトを構築してデータを共有