Google Cloud 시스템에서 데이터 계보 사용

Google Cloud 프로젝트에서 데이터 계보를 사용 설정하여 지원되는 시스템의 계보 정보를 자동으로 추적합니다.

역할 및 권한

Data Lineage API를 사용 설정하면 Data Catalog는 계보 정보를 자동으로 추적합니다. 데이터 애셋의 계보를 캡처하고 Google Cloud console에서 계보에 액세스하는 데 관리자 또는 편집자 역할이 필요하지 않습니다. Identity and Access Management 섹션에 설명된 표준 뷰어 역할이면 충분합니다. 역할 부여에 대한 자세한 내용은 액세스 관리를 참조하세요. 상위 폴더 또는 조직 수준에서 역할을 할당할 수 있습니다(단일 역할 부여 또는 취소 참조).

데이터 계보 사용 설정

  1. Google Cloud 콘솔의 프로젝트 선택기 페이지에서 계보를 추적할 리소스가 포함된 프로젝트를 선택합니다.

    프로젝트 선택자로 이동

  2. Data Lineage API 및 Data Catalog API를 사용 설정합니다.

    API 사용 설정

Dataplex UI에서 계보 그래프 보기

계보 시각화 그래프에는 프로젝트 리소스와 리소스를 만든 프로세스 간의 관계가 표시됩니다. Google Cloud 콘솔에서 그래프 시각화 형식으로 데이터 계보 정보를 보거나 JSON 데이터 형식으로 Data Lineage API에서 검색할 수 있습니다.

  1. Dataplex 검색 페이지를 열고 계보 정보를 보려는 애셋을 찾습니다.

    Dataplex 검색 페이지 열기

    자세한 내용은 데이터 애셋 검색 방법을 참조하세요.

  2. 항목 세부정보 페이지에서 계보 탭을 선택합니다.

샘플 그래프는 변환하여 병합한 두 테이블의 데이터를 보여줍니다.
그림 1. Dataplex UI의 계보 시각화 그래프 예시

프로세스 또는 데이터 소스 버튼을 선택하여 세부정보 패널을 표시합니다.

BigQuery UI에서 계보 그래프 보기

BigQuery UI에서 직접 계보 그래프를 볼 수 있습니다.

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery 페이지 열기

  2. 데이터 계보를 보려는 테이블을 엽니다.
  3. 계보 탭을 클릭합니다.
  4. 프로세스 또는 데이터 소스 버튼을 선택하여 세부정보 패널을 표시합니다.

Vertex AI UI에서 계보 그래프 보기

Vertex AI Pipelines와 같은 시스템에서 Vertex AI 모델 및 데이터 세트의 계보 데이터를 생성합니다. Vertex AI UI에서 직접 계보 그래프를 볼 수 있습니다.

Vertex AI에서 관리형 데이터 세트의 계보 그래프 보기

데이터 세트의 계보 그래프를 보려면 다음 안내를 따르세요.

  1. Google Cloud 콘솔에서 데이터 세트 페이지로 이동합니다.

    데이터 세트 페이지 열기

  2. 데이터 계보를 보려는 데이터 세트를 클릭합니다.
  3. 계보 탭을 클릭합니다.
  4. 프로세스 또는 데이터 소스 버튼을 선택하여 세부정보 패널을 표시합니다.

Vertex AI에서 모델의 계보 그래프 보기

모델의 계보 그래프를 보려면 다음 안내를 따르세요.

  1. Google Cloud 콘솔에서 Model Registry 페이지로 이동합니다.

    Model Registry 페이지 열기

  2. 데이터 계보를 보려는 모델을 클릭합니다.
  3. 계보 탭을 클릭합니다.
  4. 프로세스 또는 데이터 소스 버튼을 선택하여 세부정보 패널을 표시합니다.

다음 단계