데이터 계보 고려사항

데이터 계보는 프로젝트 단위별로 사용 설정됩니다. 즉, Data Lineage API를 사용 설정하면 제품 수준 계보 제어에 따라 여러 시스템에 계보 정보가 자동으로 보고될 수 있습니다.

자동 계보 추적은 다음 시스템에 지원됩니다.

Google Cloud 지원 시스템의 제품 수준 계보 제어
시스템 사용 가능한 계보 제어
BigQuery,
Cloud Data Fusion
프로젝트에서 Data Lineage API가 사용 설정된 경우 계보 추적을 Cloud Data Fusion 또는 BigQuery로만 제한할 수 있는 구성 가능성이 없습니다.
Cloud Composer Cloud Composer는 환경 수준 데이터 계보 통합 제어를 사용합니다. 요구사항을 충족하는 경우 모든 새 Cloud Composer 환경에 데이터 계보가 자동으로 사용 설정됩니다. 자세한 내용은 Dataplex를 사용한 데이터 계보를 참조하세요. 기존 환경의 경우 환경 설정에서 데이터 계보 통합을 사용 설정하거나 중지할 수 있습니다.
Dataproc Dataproc Spark 작업은 계보 이벤트를 캡처하여 Data Lineage API에 게시할 수 있습니다. 자세한 내용은 데이터 계보 Dataproc 통합을 참조하세요.
Vertex AI 데이터 계보는 모델, 데이터 세트, 파이프라인 템플릿, 구성요소와 같은 Vertex AI 아티팩트와 매개변수에 자동으로 사용 설정됩니다. 파이프라인 계보에는 생성에 영향을 준 요소뿐만 아니라 이후에 파생되는 아티팩트와 메타데이터도 포함됩니다. 자세한 내용은 파이프라인 아티팩트 계보 추적을 참조하세요.

결제 영향

Data Lineage API는 프로젝트별로 사용 설정되므로 프로젝트에서 Data Lineage API를 사용 설정할 때 청구액에 미치는 영향을 검토합니다(자세한 내용은 이전 섹션 참조).

유럽 연합(eu), 아시아(asia), 미국(us)과 같은 멀티 리전과 BigQuery Omni의 경우 계보 처리가 특정 리전에 분산되며 비용은 처리 과정이 수행되는 리전에 따라 달라집니다(Data Catalog 가격 책정 예시 참조).

데이터 계보 규정 준수

  • 데이터 계보는 데이터 이동에 대한 메타데이터를 기록하지만 데이터 자체를 캡처하지는 않습니다. 메타데이터에 포함된 필드에 대한 자세한 내용은 데이터 계보 정보 모델Data Lineage API 참조를 확인하세요.
  • Dataplex의 일부인 데이터 계보는 VPC-SC 지원을 제공합니다.
  • 현재 Dataplex는 고객 관리 암호화 키를 사용하여 수집된 계보 메타데이터를 보호하는 기능을 제공하지 않습니다.

데이터 계보 제한사항

계보 그래프에서 노드를 선택하면 다음과 같은 경우에 노드 세부정보 측면 패널이 비어 있게 됩니다.

  1. 리소스가 다른 조직에 있는 경우 또는
  2. 사용자가 리소스를 호스팅하는 조직의 구성원이 아닙니다.