이 문서에서는 데이터 라인 계보 규정 준수 및 제한사항에 관한 정보를 제공합니다. 데이터 계보는 시스템 단위가 아닌 프로젝트 단위별로 사용 설정됩니다. 즉, Data Lineage API를 사용 설정하면 각 시스템의 제품 수준 계보 제어에 따라 프로젝트의 여러 시스템에 계보 정보가 자동으로 보고될 수 있습니다.
자동 계보 추적은 다음 시스템에 지원됩니다.
Google Cloud시스템 | 사용 가능한 계보 제어 |
---|---|
BigQuery, Cloud Data Fusion |
프로젝트에서 Data Lineage API가 사용 설정된 경우 계보 추적을 Cloud Data Fusion 또는 BigQuery로만 제한할 수 있는 구성 가능성이 없습니다. |
Cloud Composer | Cloud Composer는 환경 수준 데이터 계보 통합 제어를 사용합니다. 요구사항을 충족하는 경우 모든 새 Cloud Composer 환경에 데이터 계보가 자동으로 사용 설정됩니다. 자세한 내용은 Dataplex를 사용한 데이터 계보를 참조하세요. 기존 환경의 경우 환경 설정에서 데이터 계보 통합을 사용 설정하거나 중지할 수 있습니다. |
Dataproc | Dataproc Spark 작업은 계보 이벤트를 캡처하여 Data Lineage API에 게시할 수 있습니다. 자세한 내용은 데이터 계보 Dataproc 통합을 참조하세요. |
Vertex AI | 데이터 계보는 모델, 데이터 세트, 파이프라인 템플릿, 구성요소와 같은 Vertex AI 아티팩트와 매개변수에 자동으로 사용 설정됩니다. 파이프라인 계보에는 생성에 영향을 준 요소뿐만 아니라 이후에 파생되는 아티팩트와 메타데이터도 포함됩니다. 자세한 내용은 파이프라인 아티팩트 계보 추적을 참조하세요. |
결제 영향
Data Lineage API는 프로젝트별로 사용 설정되므로 프로젝트에서 Data Lineage API를 사용 설정할 때 청구액에 미치는 영향을 검토합니다(자세한 내용은 이전 섹션 참조).
BigQuery Omni의 경우 계보 처리가 특정 리전에 분산되며 비용은 처리 과정이 수행되는 리전에 따라 달라집니다.
데이터 계보 규정 준수
- 데이터 계보는 데이터 이동에 대한 메타데이터를 기록하지만 데이터 자체를 캡처하지는 않습니다. 메타데이터에 포함된 필드에 대한 자세한 내용은 데이터 계보 정보 모델 및 Data Lineage API 참조를 확인하세요.
- Dataplex의 일부인 데이터 계보는 VPC-SC 지원을 제공합니다.
- Dataplex는 고객 관리 암호화 키를 사용하여 수집된 계보 메타데이터를 보호하는 기능을 제공하지 않습니다.
데이터 계보 제한사항
계보 그래프에서 노드를 선택하면 다음과 같은 경우 노드 세부정보 측면 패널이 비어 있습니다.
- 리소스가 다른 조직에 있음 또는
- 사용자가 리소스를 호스팅하는 조직의 구성원이 아닙니다.