Vertex AI Pipelines를 사용하여 생성된 각 파이프라인 실행에는 모델, 데이터 세트, 파이프라인 템플릿, 구성요소와 같은 여러 연관된 아티팩트 및 매개변수가 포함됩니다. 파이프라인 아티팩트 계보에는 아티팩트 생성에 영향을 준 요소뿐 아니라 아티팩트에서 파생된 아티팩트와 메타데이터도 포함됩니다. 예를 들어 모델의 계보에 다음이 포함될 수 있습니다.
모델을 만들 때 사용되는 학습, 테스트, 평가 데이터
모델 학습 중에 사용되는 초매개변수
모델의 정확성과 같은 학습 및 평가 프로세스에서 기록된 메타데이터
일괄 예측 결과 등 이 모델에서 비롯된 아티팩트
이 메타데이터를 사용하면 다음과 같은 질문에 대한 답을 얻을 수 있습니다.
특정 파이프라인에서 특히 정확한 모델이 생성된 이유는 무엇인가요?
가장 정확한 모델이 생성된 파이프라인 실행은 언제이며 이때 모델 학습에 사용된 초매개변수는 무엇인가요?
파이프라인의 단계에 따라 시스템 거버넌스 질문에 대한 답을 얻을 수 있습니다. 예를 들어 메타데이터를 사용하여 특정 시점에 어떤 버전의 모델이 프로덕션 단계에 있었는지 파악할 수 있습니다.
파이프라인 아티팩트 계보를 보고 분석하려면 Vertex ML Metadata 또는 Dataplex Universal Catalog를 사용하면 됩니다.
다음 표에서는 Vertex ML Metadata와 Dataplex Universal Catalog의 차이점을 간략하게 설명합니다.
기능
Vertex ML Metadata
Dataplex 범용 카탈로그
캡처된 파이프라인 메타데이터 유형
파이프라인 실행으로 생성되는 모든 입력 및 출력 아티팩트입니다.
일반적으로 Google Cloud 파이프라인 구성요소를 사용하여 Dataplex Universal Catalog에서 지원하는 정규화된 이름(FQN)에 매핑할 수 있는 입력 및 출력 아티팩트입니다.
지역
단일 리전 읽기
전역 읽기(즉, 여러 리전 간 읽기)
프로젝트
단일 프로젝트 읽기
여러 프로젝트에 걸쳐 조직 전체 읽기
통합 서비스
Vertex AI Pipelines, Vertex AI Experiments, Vertex AI Model Registry, 데이터 세트와 통합
Vertex AI, BigQuery, Cloud Composer, Dataproc과 같은 여러 Google Cloud 제품과 통합
선택 가능?
아니요, 상시 사용 설정
Data Lineage API를 사용 설정하여 프로젝트별로 선택합니다.
Vertex ML Metadata 아티팩트를 Dataplex Universal Catalog에 매핑
Vertex ML Metadata 아티팩트를 Dataplex Universal Catalog의 FQN에 매핑하려면 다음을 수행해야 합니다.
Vertex AI 모델과 관리형 데이터 세트를 만드는 동안 Google Cloud 파이프라인 구성요소를 사용합니다.
다음 샘플에 표시된 것처럼 metadata 필드에 모델 또는 관리형 데이터 세트 리소스 이름을 지정하면서 커스텀 스키마 제목(google.VertexDataset 또는 google.VertexModel)을 사용합니다.
Vertex AI Pipelines를 사용하여 파이프라인을 실행하면 파이프라인 실행의 아티팩트와 매개변수가 Vertex ML Metadata를 사용하여 저장됩니다.
Vertex ML Metadata를 사용하면 파이프라인의 메타데이터 추적의 어려움이 해소되어 파이프라인 아티팩트의 계보를 더 쉽게 분석할 수 있습니다.
Dataplex Universal Catalog는 Vertex AI 모델, 관리형 데이터 세트, Dataplex Universal Catalog에서 검색 가능한 기타Google Cloud 리소스와 같은 Vertex AI Pipelines 아티팩트가 포함된Google Cloud 리소스에서 메타데이터를 검색합니다. Dataplex Universal Catalog의 메타데이터 검색 기능을 사용하여 이러한 아티팩트를 검색하고 계보 그래프를 볼 수 있습니다.
Vertex AI Pipelines가 지원되는 모든 리전에서 Dataplex Universal Catalog를 사용할 수 있는 것은 아닙니다. Dataplex Universal Catalog가 리전에서 지원되지 않으면 Vertex ML Metadata를 사용합니다.
Dataplex Universal Catalog에 지원되는 리전 목록을 봅니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-08-05(UTC)"],[],[],null,["# Track the lineage of pipeline artifacts\n\nEach pipeline run created using Vertex AI Pipelines has several associated\nartifacts and parameters, such as models, datasets, pipeline templates, and\ncomponents. The lineage of a pipeline artifact includes the factors that\ncontributed to its creation, as well as artifacts and metadata derived from\nthe artifact. For example, a model's lineage can include the following:\n\n- The training, test, and evaluation data used to create the model.\n\n- The hyperparameters used during model training.\n\n- Metadata recorded from the training and evaluation process, such as the model's accuracy.\n\n- Artifacts that descend from this model, such as the results of batch predictions.\n\nYou can use this metadata to help answer questions like the following:\n\n- Why did a certain pipeline run produce an especially accurate model?\n\n- Which pipeline run produced the most accurate model, and what hyperparameters were used to train the model?\n\n- Depending on the steps in your pipeline, you might be able to answer system\n governance questions. For example, you could use metadata to determine which\n version of your model was in production at a given point in time.\n\nTo view and analyze the pipeline artifact lineage, you can use either Vertex ML Metadata or Dataplex Universal Catalog.\n\nThe following table outlines the differences between Vertex ML Metadata and Dataplex Universal Catalog:\n\nMap Vertex ML Metadata artifacts to Dataplex Universal Catalog\n--------------------------------------------------------------\n\nTo map Vertex ML Metadata artifacts to FQNs in Dataplex Universal Catalog,\nyou need to do the following:\n\n- Use Google Cloud Pipeline Components while creating Vertex AI models and\n managed datasets.\n\n- Use custom schema titles (`google.VertexDataset` or `google.VertexModel`)\n while specifying the model or managed dataset resource name in the `metadata`\n field, as illustrated in the following sample:\n\n {\n \"name\": \"projects/example-project/locations/us-central1/metadataStores/default/artifacts/example-artifact\",\n \"displayName\": \"My dataset\",\n \"uri\": \"https://us-central1-aiplatform.googleapis.com/v1/projects/example-project/locations/us-central1/datasets/example-dataset\",\n ...\n \"schemaTitle\": \"google.VertexDataset\",\n \"schemaVersion\": \"0.0.1\",\n \"metadata\": {\n \"resourceName\": \"projects/example-project/locations/us-central1/datasets/example-dataset\"\n }\n }\n\nAnalyze the lineage of pipeline artifacts using Vertex ML Metadata\n------------------------------------------------------------------\n\nWhen you run a pipeline using Vertex AI Pipelines, the artifacts and\nparameters of your pipeline run are stored using Vertex ML Metadata.\nVertex ML Metadata makes it easier to analyze the *lineage* of your\npipeline's artifacts, by saving you the difficulty of keeping track of your\npipeline's metadata.\n\nIf you're new to Vertex ML Metadata, read the [introduction to\nVertex ML Metadata](/vertex-ai/docs/ml-metadata/introduction).\n| For a step-by-step tutorial on analyzing artifacts and metadata generated across your Vertex AI Pipelines executions, see the [Using Vertex ML Metadata with Vertex AI Pipelines](https://codelabs.developers.google.com/vertex-mlmd-pipelines#0) codelab.\n\nFollow these instructions to view the lineage graph for a pipeline\nartifact using Vertex ML Metadata:\n\n1. In the Google Cloud console, in the Vertex AI section, go\n to the **Metadata** page.\n\n [Go to Metadata](https://console.cloud.google.com/vertex-ai/metadata)\n\n The Metadata page lists the artifacts that have been created in the\n **default** metadata store.\n2. In the **Region** drop-down list, select the region that your run was\n created in.\n\n3. Click the **Display name** of an artifact to see its lineage graph.\n\n A static graph showing the artifacts and executions that are a part of this\n lineage graph appears.\n4. Click an artifact or execution to learn more about it.\n\nAnalyze the lineage of pipeline artifacts using Dataplex Universal Catalog\n--------------------------------------------------------------------------\n\nDataplex Universal Catalog discovers metadata from\nGoogle Cloud resources, which include Vertex AI Pipelines\nartifacts like Vertex AI models, managed datasets, and other\nGoogle Cloud resources discoverable in Dataplex Universal Catalog. You can\ndiscover these artifacts using the metadata search capability of\nDataplex Universal Catalog and view their lineage graphs.\n\nFor more information about the Dataplex Universal Catalog metadata search capability,\nsee [Search for resources in Dataplex Universal Catalog](/dataplex/docs/search-assets).\n\nNote that Dataplex Universal Catalog might not be available in all regions where\nVertex AI Pipelines is supported. If Dataplex Universal Catalog is\nunsupported in your region, use Vertex ML Metadata.\n[View the list of supported regions for Dataplex Universal Catalog.](/dataplex/docs/locations)\n\nFollow these instructions to view the lineage graph for a pipeline artifact\non Dataplex Universal Catalog:\n\n1. To launch a Dataplex Universal Catalog search query in the Google Cloud console,\n go to the Dataplex Universal Catalog **Search** page.\n\n [Go to Search](https://console.cloud.google.com/dataplex/dp-search)\n2. Select **Dataplex Universal Catalog** as the search mode.\n\n3. Use the filters to search for the artifacts. For example, you can use the\n **Data types** filter to specify the type of artifact, such as model, dataset,\n or BigQuery table. For more information,\n see [Search for resources in Dataplex Universal Catalog](/dataplex/docs/search-assets).\n\n You can also [define your query in the search field](/dataplex/docs/search-syntax).\n4. To view the lineage of an artifact, click the name of the artifact, and then click the **Lineage** tab.\n\n On the lineage graph, Vertex AI processes are preceded by\n .\n These include pipeline artifacts, pipeline components, and pipeline templates.\n - To view the details of a process, click the process in the lineage graph.\n\n | **Note:** The process details are available only if the process has been catalogued in Dataplex Universal Catalog using a fully qualified name (FQN).\n - For processes based on pipeline tasks from pipeline runs, you can do the following:\n\n - View the pipeline run in Vertex AI by clicking **Open in Vertex AI** in the **Details tab** . To view the runtime details of a pipeline run, such as states, timestamps, and attributes, click **More** . To view the pipeline run in Vertex AI, click **Open in Vertex AI**.\n - For processes based on a pipeline template, you can do the following:\n\n - View the template details in Vertex AI by clicking **Open in Vertex AI** in the **Details tab**.\n\n - View the list of pipeline tasks created in pipeline runs in the\n **Runs** tab. To view the details of the pipeline template in\n Vertex AI, click **More** , and then click\n **Open in Vertex AI**.\n\nWhat's next\n-----------\n\n- Learn how to [run a pipeline](/vertex-ai/docs/pipelines/run-pipeline).\n- Get started [visualizing and analyzing pipeline\n results](/vertex-ai/docs/pipelines/visualize-pipeline).\n- Learn how to [build a machine learning pipeline](/vertex-ai/docs/pipelines/build-pipeline)."]]