データソースを Data Catalog と統合する

Data Catalog は、いくつかの Google Cloud データソースや、多くの一般的なオンプレミスのデータソースから、最新のメタデータをインポートして保持できます。

メタデータを取り込むと、Data Catalog は次の処理を行います。

検索で既存のメタデータを検出できるようになります。詳細については、検索方法をご覧ください。
組織のメンバーがタグを使用して追加のビジネスメタデータでデータを拡充できるようになります。詳細については、タグとタグテンプレートをご覧ください。

Google Cloud ソースとの統合は自動で行われますが、組織で使用するカスタムオンプレミスソースとの統合には、次のいずれかを行います。

コミュニティから提供された対応コネクタをセットアップして実行します。
カスタムエントリ用の Data Catalog API を使用します。

始める前に

Data Catalog をすでに使用している場合は、Data Catalog API が有効になっているプロジェクトがすでに存在している必要があります。Data Catalog で複数のプロジェクトを使用する場合の推奨方法については、複数のプロジェクトでタグテンプレートを使用するをご覧ください。

Data Catalog を初めて操作する場合は、次のことを行います。

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Data Catalog API.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Data Catalog API.

Enable the API

Google Cloud データソースを統合する

Analytics Hub

Analytics Hub のリスティングに登録すると、リンクされたデータセットがプロジェクトに作成されます。Data Catalog は、リンクされたデータセットとそれに含まれるすべてのテーブルのメタデータエントリを自動的に生成します。リンクされたデータセットや Analytics Hub のその他の機能について詳しくは、Analytics Hub の概要をご覧ください。

Data Catalog 検索では、リンクされたデータセットは標準の BigQuery データセットとして表示されますが、type=dataset.linked 述語を使用してフィルタリングできます。詳細については、データアセットを検索するをご覧ください。

BigQuery と Pub/Sub

組織ですでに BigQuery と Pub/Sub を使用している場合は、権限に応じて、直ちにそれらのソースからメタデータを検索できます。対応するエントリが検索結果で表示されない場合は、Identity and Access Management で、自分やプロジェクトユーザーに必要な IAM ロールを確認してください。

Bigtable

Bigtable にデータを保存すると、次の Bigtable リソースのメタデータが自動的に Data Catalog に同期されます。

インスタンス
テーブル（列ファミリーの詳細を含む）

データの検出とタグ付けに Data Catalog を使用する方法については、Bigtable ドキュメントの Data Catalog を使用してデータアセットを管理するをご覧ください。

Cloud SQL

Cloud SQL は Data Catalog と統合されませんが、Dataplex Catalog と統合されます。詳細については、データソースを Dataplex Catalog と統合するをご覧ください。

Dataproc Metastore

Dataproc Metastore と統合するには、Data Catalog 同期を有効にするの説明に従って、新しいサービスまたは既存のサービスに対する Data Catalog への同期を有効にします。

Sensitive Data Protection

さらに、Data Catalog はセンシティブデータの保護と統合されているため、特定の Google Cloud リソースに含まれるセンシティブデータをスキャンし、タグの形式で Data Catalog に結果を送信できます。

詳細については、機密データの保護のスキャン結果を Data Catalog に送信するをご覧ください。

Spanner

Spanner にデータを保存すると、次の Spanner リソースのメタデータが Data Catalog に同期されます。

インスタンス
データベース
列スキーマを含むテーブルとビュー

データの検出とタグ付けに Data Catalog を使用する方法については、Data Catalog を使用してデータアセットを管理するをご覧ください。

Vertex AI

Vertex AI は、次のリソースのメタデータを Data Catalog に同期します。

オンプレミスのデータソースを統合する

オンプレミスデータソースを統合するには、コミュニティから提供された Python 対応コネクタを使用します。

次の表でデータソースを探してください。
GitHub リポジトリを開きます。
readme ファイルの設定手順に従ってください。

カテゴリ	コンポーネント	説明	リポジトリ
RDBMS	mysql-connector	MySQL データソースのサンプルコード。	google-datacatalog-mysql-connector
	postgresql-connector	PostgreSQL データソースのサンプルコード。	google-datacatalog-postgresql-connector
	sqlserver-connector	SQLServer データソースのサンプルコード。	google-datacatalog-sqlserver-connector
	redshift-connector	Redshift データソースのサンプルコード。	google-datacatalog-redshift-connector
	oracle-connector	Oracle データソースのサンプルコード。	google-datacatalog-oracle-connector
	teradata-connector	Teradata データソースのサンプルコード。	google-datacatalog-teradata-connector
	vertica-connector	Vertica データソースのサンプルコード。	google-datacatalog-vertica-connector
	greenplum-connector	Greenplum データソースのサンプルコード。	google-datacatalog-greenplum-connector
	rdbmscsv-connector	一般的な RDBMS CSV 取り込みのサンプルコード。	google-datacatalog-rdbmscsv-connector
	saphana-connector	Sap Hana データソースのサンプルコード。	google-datacatalog-saphana-connector
BI	looker-connector	Looker データソースのサンプルコード。	google-datacatalog-looker-connector
	qlik-connector	Qlik Sense データソースのサンプルコード。	google-datacatalog-qlik-connector
	tableau-connector	Tableau データソースのサンプルコード。	google-datacatalog-tableau-connector
Hive	hive-connector	Hive データソースのサンプルコード。	google-datacatalog-hive-connector
Hive	apache-atlas-connector	Apache Atlas データソースのサンプルコード。	google-datacatalog-apache-atlas-connector

サポートされていないデータソースを統合する

データソースのコネクタが見つからなくても、エントリグループとカスタムエントリを作成して手動で統合できます。その方法は次のとおりです。

C#、Go、Java、Node.js、PHP、Python、Ruby のいずれかの言語で、Data Catalog クライアントライブラリのいずれかを使用します。
または、Data Catalog API で手動で構築します。

ソースを統合するには、まずエントリとエントリグループを学習してから、データソースにカスタム Data Catalog エントリを作成するの手順に従います。

次のステップ

Identity and Access Management の詳細を確認する。
検索方法をご覧ください。
テーブルへのタグ付けのクイックスタートをご覧ください。