Google Cloud システムでデータリネージを使用する

データリネージには、プロジェクトのリソースとそれらを作成したプロセスの関係が表示されます。

データリネージ情報は、Google Cloud コンソールで次の形式で表示できます。

  • リネージグラフ: 単一のルートエントリのアップストリームまたはダウンストリームのリネージが表示されます。詳細については、リネージ グラフをご覧ください。
  • リネージパスの可視化プレビュー): 選択した 2 つのリソース間のリネージリンクが表示されます。詳細については、リネージパスの可視化をご覧ください。
  • リネージのリスト表示プレビュー): リソースの詳細なリネージ情報が 1 つのテーブルに表示されます。このテーブルには、多くの接続を持つリソースのリネージ情報も含まれます。詳細については、リネージのリストビューをご覧ください。

Data Lineage API からリネージ情報を JSON データの形式で取得することもできます。

リネージはプロジェクト間でキャプチャされます。複数のプロジェクトから生成されたリネージを表示する場合は、関連する任意のプロジェクトで集約されたリネージ情報を表示できます。

ロールと権限

リネージ情報を表示するには、データリネージの事前定義ロールで説明されているように、閲覧者ロールを付与するよう管理者に依頼してください。リネージを表示するプロジェクトと、リネージが記録されているプロジェクトの両方にアクセスできる必要があります。

Data Lineage API を有効にすると、Dataplex はリネージ情報を自動的に追跡します。データアセットのリネージをキャプチャするために管理者または編集者のロールは必要ありません。

ロールの付与の詳細については、アクセスの管理をご覧ください。より上位のフォルダレベルまたは組織レベルでロールを割り当てることができます(単一ロールの付与または取り消しをご覧ください)。

データ系列を有効にする

データリネージを有効にして、サポートされているシステムのリネージ情報の自動での追跡を開始します。リネージを表示するプロジェクトと、リネージが記録されているプロジェクトの両方で Data Lineage API を有効にする必要があります。詳細については、プロジェクトの種類をご覧ください。

  1. リネージ情報をキャプチャする手順は次のとおりです。

    1. Google Cloud コンソールの [プロジェクト セレクタ] ページで、リネージを記録するプロジェクトを選択します。

      プロジェクト セレクタに移動

    2. Data Lineage API を有効にします。

      Data Lineage API を有効にする

    3. リネージを記録するプロジェクトごとに、上記の手順を繰り返します。
  2. リネージを表示するプロジェクトで、Data Lineage API と Dataplex API を有効にします。

    API を有効にする

Dataplex でリネージを表示する

データリネージ情報は、Dataplex ウェブ インターフェースで確認できます。

リネージを表示する手順は次のとおりです。

  1. Dataplex Catalog の検索ページを開き、リネージ情報を表示するアセットを見つけます。

    検索に移動

    詳細については、Dataplex Catalog でリソースを検索するをご覧ください。

  2. エントリの詳細ページで、[リネージ] タブを選択します。

  3. リネージグラフを表示するには、[グラフ] をクリックします。

    • プロセスまたはデータソースのボタンを選択して、詳細パネルを表示します。

    • リソースのアップストリームまたはダウンストリームのリネージ情報を表示するには、 [展開] をクリックします。

  4. リネージをリスト表示で表示するには、[リスト] をクリックします。

  5. リネージパスの可視化を表示するには、[リスト] をクリックし、結果の表でターゲット リソースを選択します。詳細パネルで [ターゲット]、[リネージを可視化] の順にクリックします。

BigQuery でリネージを表示する

データリネージ情報は BigQuery ウェブ インターフェースで確認できます。

リネージを表示する手順は次のとおりです。

  1. Google Cloud コンソールで BigQuery ページに移動します。

    [BigQuery] ページを開く

  2. データリネージを表示するテーブルを開きます。

  3. [リネージ] タブをクリックします。

  4. リネージグラフを表示するには、[グラフ] をクリックします。

    • プロセスまたはデータソースのボタンを選択して、詳細パネルを表示します。

    • リソースのアップストリームまたはダウンストリームのリネージ情報を表示するには、 [展開] をクリックします。

  5. リネージをリスト表示で表示するには、[リスト] をクリックします。

  6. リネージパスの可視化を表示するには、[リスト] をクリックし、結果の表でターゲット リソースを選択します。詳細パネルで [ターゲット]、[リネージを可視化] の順にクリックします。

Vertex AI でリネージを表示する

Vertex AI Pipelines などのシステムは、Vertex AI モデルとデータセットのリネージデータを生成します。データリネージ情報は、Vertex AI UI ウェブ インターフェースで確認できます。

Vertex AI でマネージド データセットのリネージを表示する

データセットのリネージを表示する手順は次のとおりです。

  1. Google Cloud コンソールで、[データセット] ページに移動します。

    [データセット] ページを開く

  2. データリネージを表示するデータセットをクリックします。

  3. [リネージ] タブをクリックします。

  4. リネージグラフを表示するには、[グラフ] をクリックします。

    • プロセスまたはデータソースのボタンを選択して、詳細パネルを表示します。

    • リソースのアップストリームまたはダウンストリームのリネージ情報を表示するには、 [展開] をクリックします。

  5. リネージをリスト表示で表示するには、[リスト] をクリックします。

  6. リネージパスの可視化を表示するには、[リスト] をクリックし、結果の表でターゲット リソースを選択します。詳細パネルで [ターゲット]、[リネージを可視化] の順にクリックします。

Vertex AI でモデルのリネージを表示する

モデルのリネージを表示する手順は次のとおりです。

  1. Google Cloud コンソールの [Model Registry] ページに移動します。

    [Model Registry] ページを開く

  2. データリネージを表示するモデルをクリックします。

  3. [リネージ] タブをクリックします。

  4. リネージグラフを表示するには、[グラフ] をクリックします。

    • プロセスまたはデータソースのボタンを選択して、詳細パネルを表示します。

    • リソースのアップストリームまたはダウンストリームのリネージ情報を表示するには、 [展開] をクリックします。

  5. リネージをリスト表示で表示するには、[リスト] をクリックします。

  6. リネージパスの可視化を表示するには、[リスト] をクリックし、結果の表でターゲット リソースを選択します。詳細パネルで [ターゲット]、[リネージを可視化] の順にクリックします。

次のステップ