在 Google Cloud 系統中使用資料系譜

資料沿襲會顯示專案資源之間的關係,以及建立這些資源的程序。

您可以在 Google Cloud 控制台中查看資料沿革詳細資料,也可以使用 Data Lineage API 擷取這些資料。

視處理的資料量而定,資料沿襲需要一段時間才能顯示圖表。大多數工作需要 3 小時,部分工作則可能需要 24 小時。

系統會擷取跨專案的沿襲。查看從多個專案產生的沿襲時,您可以在任何相關專案中查看匯總沿襲資訊。

角色和權限

如要查看資料沿襲,您需要特定的 Identity and Access Management (IAM) 權限。系統會擷取多個專案的沿襲資訊,因此您需要多個專案的權限。

  • 在 Dataplex Universal Catalog、BigQuery 或 Vertex AI 中查看歷程時,您必須具備相關權限,才能在查看歷程的專案中查看歷程資訊。

  • 查看其他專案中記錄的沿襲時:您需要有權限,才能查看記錄沿襲資訊的專案。

如要查看資料沿襲,您必須具備下列角色或權限。 在相關資源 (例如專案或 BigQuery 表格) 上,將這些角色授予主體 (例如使用者或服務帳戶)。

  • 資料歷程檢視者 (roles/datalineage.viewer):授予在 Google Cloud 控制台中查看歷程,以及使用 Data Lineage API 的權限。您必須在記錄沿襲的專案和查看沿襲的專案中套用這個角色。詳情請參閱「專案類型」。

  • Dataplex Universal Catalog 檢視者 (roles/dataplex.catalogViewer):授予權限,可查看 Dataplex Universal Catalog 中編目的資產中繼資料。在儲存目錄項目的專案中授予這個角色,讓使用者在沿襲圖中查看項目詳細資料。或者,您也可以在來源系統中授予檢視者角色。詳情請參閱「使用 Dataplex Universal Catalog 搜尋資料資產」。

  • 其他 BigQuery 權限

    • 如要在沿襲圖中查看 BigQuery 資產的詳細資料,例如資料表定義或檢視查詢,請授予 BigQuery 資料檢視者 (roles/bigquery.dataViewer) 角色。
    • 如要查看產生沿襲的 BigQuery 工作的 SQL 查詢,請授予 bigquery.jobs.get 權限。這項權限包含在「BigQuery 管理員」 (roles/bigquery.admin) 角色和「BigQuery 資源檢視者」 (roles/bigquery.resourceViewer) 角色中。

啟用 Data Lineage API 後,資料歷程功能會自動追蹤歷程資訊。您不需要任何管理員或編輯者角色,即可擷取資料資產的沿襲。

如要進一步瞭解如何授予角色,請參閱管理存取權。您可以在較高的資料夾或機構層級指派角色,詳情請參閱授予或撤銷單一角色

資料歷程檢視畫面類型

您可以透過圖表或清單查看沿革資訊。 系統預設會顯示資料表層級的沿襲圖。如果是 BigQuery 工作,您可以在圖表和清單檢視畫面中查看資料欄層級的歷程。

可用的檢視畫面類型如下:

  • 圖表檢視畫面:以互動式圖表顯示沿襲,展開節點即可探索資料資產和資料欄之間的關係。

  • 清單檢視畫面:以表格格式顯示沿襲,提供資料表和資料欄層級沿襲的簡化和詳細表示法。您可以在這個檢視畫面中自訂欄,並匯出沿襲資料。

圖中的主要元素說明如下:

  • 節點:代表資料實體。在表格層級檢視中,節點會顯示表格名稱和資料欄。在資料欄層級的檢視畫面中,每個節點代表特定資料表及其具有沿襲的資料欄。

  • 邊緣:連接節點的線條,代表節點之間發生的程序。邊緣可以顯示圖示或標籤,提供轉換的更多資訊:

    • Icons:在表格層級檢視畫面中,邊緣會顯示圖示,代表轉換程序。手動探索圖表時,邊緣上的圖示代表程序的來源系統 (例如 BigQuery 或 Vertex AI)。如果涉及多個程序,系統會顯示「多個程序」圖示。如果流程來源系統不明,則會使用齒輪圖示。套用篩選條件時,所有程序都會使用齒輪圖示。
    • 標籤:在資料欄層級檢視畫面中,邊緣會加上標籤,說明資料欄之間的依附元件類型,例如 Exact copyOther

啟用資料歷程

啟用資料歷程,即可開始自動追蹤支援系統的歷程資訊。您必須在查看歷程的專案,以及記錄歷程的專案中,啟用 Data Lineage API。詳情請參閱「專案類型」。

  1. 如要擷取沿襲資訊,請完成下列步驟:
    1. 在 Google Cloud 控制台的「專案選取器」頁面中,選取要記錄沿襲的專案。

      前往專案選取器

    2. 啟用 Data Lineage API。

      啟用 Data Lineage API

    3. 針對要記錄沿襲的每個專案,重複上述步驟。
  2. 在您查看歷程的專案中,啟用 Data Lineage API 和 Dataplex API。

    啟用 API

在 Dataplex Universal Catalog 中查看歷程

您可以在 Dataplex Universal Catalog 網頁介面中查看資料歷程資訊。

如要查看沿襲,請按照下列操作說明進行:

  1. 在 Google Cloud 控制台,前往 Dataplex Universal Catalog 的「Search」(搜尋) 頁面。

    前往「Search」(搜尋) 頁面

  2. 選取「Dataplex Universal Catalog」做為搜尋模式。

  3. 搜尋並點選要查看的項目。詳情請參閱「在 Dataplex Universal Catalog 中搜尋資源」。

  4. 按一下「沿革」分頁標籤。

    系統會開啟預設的「圖表」檢視畫面,顯示跨系統和區域的資料表層級沿襲。詳情請參閱「沿襲圖表檢視畫面」。

  5. 如要手動探索沿襲圖,請按一下節點旁邊的「展開」,一次載入五個節點。

    詳情請參閱「手動探索沿襲圖」。

  6. 在「圖表」檢視畫面中,按一下節點。

    「詳細資料」面板隨即開啟,顯示資產資訊,例如完整名稱和類型。詳情請參閱「節點詳細資料」。

  7. 在「圖表」檢視畫面中,按一下含有程序圖示的邊緣。

    「查詢」面板隨即開啟。詳情請參閱「檢查轉換邏輯」和「稽核及執行記錄」。

    • 如要檢查轉換邏輯,請按一下「詳細資料」分頁標籤。

    • 如要查看稽核記錄和執行作業記錄,請按一下「執行作業」分頁標籤。

  8. 在「沿襲關係探索器」面板中,選取篩選條件 (例如「方向」、「依附元件類型」或「時間範圍」),然後按一下「套用」

    這會在特定區域 (預覽) 中開啟焦點檢視畫面。這個檢視畫面會自動展開圖表,最多顯示三層節點。詳情請參閱「套用篩選器,取得焦點式沿襲檢視畫面」。

  9. 在聚焦的「圖表」檢視畫面中,選取節點,然後在節點的詳細資料面板中,按一下「顯示路徑」,即可顯示從所選節點返回根項目的沿襲路徑 (僅限聚焦檢視畫面)。

    詳情請參閱「沿襲路徑視覺化」。

  10. 如要查看資料欄層級的沿襲 (僅適用於 BigQuery 作業,目前為預先發布版),請執行下列其中一項操作:

    • 在聚焦的「圖表」檢視畫面中,按一下表格中的欄圖示。
      用於切換至資料欄層級歷程的圖示。
      欄圖示
    • 在「歷程探索工具」面板中,依資料欄名稱篩選,然後按一下「套用」

    詳情請參閱資料欄層級歷程

  11. 按一下「重設」

    這項操作會移除所有已套用的篩選器,並將您帶往圖表檢視畫面的開頭。

  12. 按一下「清單」即可切換至清單檢視。

    清單檢視畫面提供簡化且詳細的歷程表格表示法,適用於資料表和資料欄層級的歷程 (預覽版),並與圖表檢視畫面同步。根據預設,系統會顯示簡易清單檢視畫面,您可以切換至詳細清單檢視畫面,分析個別來源與目標之間的關係。您可以設定要顯示的資料欄,並匯出沿襲資料。詳情請參閱「沿革清單檢視畫面」。

在 BigQuery 中查看沿襲

您可以在 BigQuery 網頁介面中查看資料沿襲資訊。

如要查看沿襲,請按照下列操作說明進行:

  1. 前往 Google Cloud 控制台的「BigQuery」頁面。BigQuery

    開啟 BigQuery 頁面

  2. 開啟要查看資料沿襲的資料表。

  3. 按一下「沿革」分頁標籤。

    系統會開啟預設的「圖表」檢視畫面,顯示跨系統和區域的資料表層級沿襲。詳情請參閱「沿襲圖表檢視畫面」。

  4. 如要手動探索沿襲圖,請按一下節點旁邊的「展開」,一次載入五個節點。

    詳情請參閱「手動探索沿襲圖」。

  5. 在「圖表」檢視畫面中,按一下節點。

    「詳細資料」面板隨即開啟,顯示資產資訊,例如完整名稱和類型。詳情請參閱「節點詳細資料」。

  6. 在「圖表」檢視畫面中,按一下含有程序圖示的邊緣。

    「查詢」面板隨即開啟。詳情請參閱「檢查轉換邏輯」和「稽核及執行記錄」。

    • 如要檢查轉換邏輯,請按一下「詳細資料」分頁標籤。

    • 如要查看稽核記錄和執行作業記錄,請按一下「執行作業」分頁標籤。

  7. 在「沿襲關係探索器」面板中,選取篩選條件 (例如「方向」、「依附元件類型」或「時間範圍」),然後按一下「套用」

    這會在特定區域 (預覽) 中開啟焦點檢視畫面。這個檢視畫面會自動展開圖表,最多顯示三層節點。詳情請參閱「套用篩選器,取得焦點式沿襲檢視畫面」。

  8. 在聚焦的「圖表」檢視畫面中,選取節點,然後在節點的詳細資料面板中,按一下「顯示路徑」,即可顯示從所選節點返回根項目的沿襲路徑 (僅限聚焦檢視畫面)。

    詳情請參閱「沿襲路徑視覺化」。

  9. 如要查看資料欄層級的沿襲 (僅適用於 BigQuery 作業,目前為預先發布版),請執行下列其中一項操作:

    • 在聚焦的「圖表」檢視畫面中,按一下表格中的欄圖示。
      用於切換至資料欄層級歷程的圖示。
      欄圖示
    • 在「歷程探索工具」面板中,依資料欄名稱篩選,然後按一下「套用」

    詳情請參閱資料欄層級歷程

  10. 按一下「重設」

    這項操作會移除所有已套用的篩選器,並將您帶往圖表檢視畫面的開頭。

  11. 按一下「清單」即可切換至清單檢視。

    清單檢視畫面提供簡化且詳細的歷程表格表示法,適用於資料表和資料欄層級的歷程 (預覽版),並與圖表檢視畫面同步。根據預設,系統會顯示簡易清單檢視畫面,您可以切換至詳細清單檢視畫面,分析個別來源與目標之間的關係。您可以設定要顯示的資料欄,並匯出沿襲資料。詳情請參閱「沿革清單檢視畫面」。

在 Vertex AI 中查看沿襲

Vertex AI Pipelines 等系統會為 Vertex AI 模型和資料集產生沿襲資料。您可以在 Vertex AI 網頁介面中查看資料沿襲資訊。

查看 Vertex AI 中代管資料集的沿襲

如要查看資料集的沿襲,請按照下列操作說明進行:

  1. 在 Google Cloud 控制台中,前往「Datasets」(資料集) 頁面。

    開啟「資料集」頁面

  2. 按一下要查看資料沿革的資料集。

  3. 按一下「沿革」分頁標籤。

    系統會開啟預設的「圖表」檢視畫面,顯示跨系統和區域的資料表層級沿襲。詳情請參閱「沿襲圖表檢視畫面」。

  4. 如要手動探索沿襲圖,請按一下節點旁邊的「展開」,一次載入五個節點。

    詳情請參閱「手動探索沿襲圖」。

  5. 在「圖表」檢視畫面中,按一下節點。

    「詳細資料」面板隨即開啟,顯示資產資訊,例如完整名稱和類型。詳情請參閱「節點詳細資料」。

  6. 在「圖表」檢視畫面中,按一下含有程序圖示的邊緣。

    「查詢」面板隨即開啟。詳情請參閱「檢查轉換邏輯」和「稽核及執行記錄」。

    • 如要檢查轉換邏輯,請按一下「詳細資料」分頁標籤。

    • 如要查看稽核記錄和執行作業記錄,請按一下「執行作業」分頁標籤。

  7. 在「沿襲關係探索器」面板中,選取篩選條件 (例如「方向」、「依附元件類型」或「時間範圍」),然後按一下「套用」

    這會在特定區域 (預覽) 中開啟焦點檢視畫面。這個檢視畫面會自動展開圖表,最多顯示三層節點。詳情請參閱「套用篩選器,取得焦點式沿襲檢視畫面」。

  8. 在聚焦的「圖表」檢視畫面中,選取節點,然後在節點的詳細資料面板中,按一下「顯示路徑」,即可顯示從所選節點返回根項目的沿襲路徑 (僅限聚焦檢視畫面)。

    詳情請參閱「沿襲路徑視覺化」。

  9. 如要查看資料欄層級的沿襲 (僅適用於 BigQuery 作業,目前為預先發布版),請執行下列其中一項操作:

    • 在聚焦的「圖表」檢視畫面中,按一下表格中的欄圖示。
      用於切換至資料欄層級歷程的圖示。
      欄圖示
    • 在「歷程探索工具」面板中,依資料欄名稱篩選,然後按一下「套用」

    詳情請參閱資料欄層級歷程

  10. 按一下「重設」

    這項操作會移除所有已套用的篩選器,並將您帶往圖表檢視畫面的開頭。

  11. 按一下「清單」即可切換至清單檢視。

    清單檢視畫面提供簡化且詳細的歷程表格表示法,適用於資料表和資料欄層級的歷程 (預覽版),並與圖表檢視畫面同步。根據預設,系統會顯示簡易清單檢視畫面,您可以切換至詳細清單檢視畫面,分析個別來源與目標之間的關係。您可以設定要顯示的資料欄,並匯出沿襲資料。詳情請參閱「沿革清單檢視畫面」。

查看 Vertex AI 中模型的沿襲

如要查看模型的沿襲,請按照下列指示操作:

  1. 前往 Google Cloud 控制台的「Model Registry」頁面。

    開啟「Model Registry」(模型登錄) 頁面

  2. 按一下要查看資料沿襲的模型。

  3. 按一下「沿革」分頁標籤。

    系統會開啟預設的「圖表」檢視畫面,顯示跨系統和區域的資料表層級沿襲。詳情請參閱「沿襲圖表檢視畫面」。

  4. 如要手動探索沿襲圖,請按一下節點旁邊的「展開」,一次載入五個節點。

    詳情請參閱「手動探索沿襲圖」。

  5. 在「圖表」檢視畫面中,按一下節點。

    「詳細資料」面板隨即開啟,顯示資產資訊,例如完整名稱和類型。詳情請參閱「節點詳細資料」。

  6. 在「圖表」檢視畫面中,按一下含有程序圖示的邊緣。

    「查詢」面板隨即開啟。詳情請參閱「檢查轉換邏輯」和「稽核及執行記錄」。

    • 如要檢查轉換邏輯,請按一下「詳細資料」分頁標籤。

    • 如要查看稽核記錄和執行作業記錄,請按一下「執行作業」分頁標籤。

  7. 在「沿襲關係探索器」面板中,選取篩選條件 (例如「方向」、「依附元件類型」或「時間範圍」),然後按一下「套用」

    這會在特定區域 (預覽) 中開啟焦點檢視畫面。這個檢視畫面會自動展開圖表,最多顯示三層節點。詳情請參閱「套用篩選器,取得焦點式沿襲檢視畫面」。

  8. 在聚焦的「圖表」檢視畫面中,選取節點,然後在節點的詳細資料面板中,按一下「顯示路徑」,即可顯示從所選節點返回根項目的沿襲路徑 (僅限聚焦檢視畫面)。

    詳情請參閱「沿襲路徑視覺化」。

  9. 如要查看資料欄層級的沿襲 (僅適用於 BigQuery 作業,目前為預先發布版),請執行下列其中一項操作:

    • 在聚焦的「圖表」檢視畫面中,按一下表格中的欄圖示。
      用於切換至資料欄層級歷程的圖示。
      欄圖示
    • 在「歷程探索工具」面板中,依資料欄名稱篩選,然後按一下「套用」

    詳情請參閱資料欄層級歷程

  10. 按一下「重設」

    這項操作會移除所有已套用的篩選器,並將您帶往圖表檢視畫面的開頭。

  11. 按一下「清單」即可切換至清單檢視。

    清單檢視畫面提供簡化且詳細的歷程表格表示法,適用於資料表和資料欄層級的歷程 (預覽版),並與圖表檢視畫面同步。根據預設,系統會顯示簡易清單檢視畫面,您可以切換至詳細清單檢視畫面,分析個別來源與目標之間的關係。您可以設定要顯示的資料欄,並匯出沿襲資料。詳情請參閱「沿革清單檢視畫面」。

後續步驟