Google Cloud システムでデータリネージを使用する

Google Cloud プロジェクトでデータリネージを有効にして、サポートされているシステムのリネージ情報の自動トラッキングを開始します。

ロールと権限

Data Catalog は、Data Lineage API を有効にするとリネージ情報を自動的に追跡します。データアセットのリネージをキャプチャして Google Cloud コンソールでリネージにアクセスするために管理者または編集者のロールは必要ありません。Identity and Access Management セクションで説明されている標準の閲覧者のロールで十分です。ロールの付与の詳細については、アクセスの管理をご覧ください。より上位のフォルダレベルまたは組織レベルでロールを割り当てることができます(単一ロールの付与または取り消しをご覧ください)。

データ系列を有効にする

  1. Google Cloud コンソールの [プロジェクト セレクタ] ページで、リネージを追跡するリソースを含むプロジェクトを選択します。

    プロジェクト セレクタに移動

  2. Data Lineage API と Data Catalog API を有効にします。

    API を有効にする

Dataplex UI でリネージグラフを表示する

リネージの可視化グラフには、プロジェクト リソースとそれらを作成したプロセスの関係が表示されます。データリネージ情報は、Google Cloud コンソールでグラフの可視化の形式で、または JSON データの形式で Data Lineage API から取得できます。

  1. Dataplex の検索ページを開き、リネージ情報を表示するアセットを見つけます。

    Dataplex の検索ページを開く

    詳細については、データアセットを検索する方法をご覧ください。

  2. エントリの詳細ページで、[リネージ] タブを選択します。

サンプルグラフには、変換後にマージされる 2 つのテーブルのデータが表示されます。
図 1. Dataplex UI のリネージ可視化グラフの例。

プロセスまたはデータソースのボタンを選択して、詳細パネルを表示します。

BigQuery UI でリネージグラフを表示する

BigQuery UI でリネージグラフを直接表示できます。

  1. Google Cloud コンソールで [BigQuery] ページに移動します。

    [BigQuery] ページを開く

  2. データリネージを表示するテーブルを開きます。
  3. [リネージ] タブをクリックします。
  4. プロセスまたはデータソースのボタンを選択して、詳細パネルを表示します。

Vertex AI UI でリネージグラフを表示する

Vertex AI Pipelines などのシステムでは、Vertex AI のモデルとデータセットのリネージデータが生成されます。リネージグラフは、Vertex AI UI に直接表示できます。

Vertex AI でマネージド データセットのリネージグラフを表示する

データセットのリネージグラフを表示するには、次の手順に沿って操作します。

  1. Google Cloud コンソールで、[データセット] ページに移動します。

    [データセット] ページを開く

  2. データリネージを表示するデータセットをクリックします。
  3. [リネージ] タブをクリックします。
  4. プロセスまたはデータソースのボタンを選択して、詳細パネルを表示します。

Vertex AI でモデルのリネージグラフを表示する

モデルのリネージグラフを表示するには、次の手順に沿って操作します。

  1. Google Cloud コンソールの [Model Registry] ページに移動します。

    [Model Registry] ページを開く

  2. データリネージを表示するモデルをクリックします。
  3. [リネージ] タブをクリックします。
  4. プロセスまたはデータソースのボタンを選択して、詳細パネルを表示します。

次のステップ