En este documento, se proporciona información sobre el cumplimiento y las limitaciones del linaje de datos. El linaje de datos se habilita por proyecto, no por sistema. Esto significa que, después de habilitar la API de Data Lineage, la información del linaje se puede informar automáticamente para varios sistemas del proyecto, según el control de linaje a nivel del producto de cada sistema.
El seguimiento automático de linaje es compatible con los siguientes sistemas:
Sistema | Controles de linaje disponibles |
---|---|
BigQuery y Cloud Data Fusion |
No hay parámetros de configuración para restringir el seguimiento del linaje solo a Cloud Data Fusion o BigQuery cuando la API de Data Lineage está habilitada en un proyecto. |
Cloud Composer | Cloud Composer usa el control de integración de linaje de datos a nivel del entorno. El linaje de datos se habilita automáticamente para todos los entornos nuevos de Cloud Composer, siempre que cumplan con los requisitos. Consulta Linaje de datos con Dataplex para obtener más información. En el caso de los entornos existentes, puedes habilitar o inhabilitar la integración del linaje de datos en la configuración del entorno. |
Dataproc | Los trabajos de Spark de Dataproc pueden capturar eventos de linaje y publicarlos en la API de Data Lineage. Consulta Integración de Dataproc con el linaje de datos para obtener más información. |
Vertex AI | El linaje de datos se habilita automáticamente para los artefactos y parámetros de Vertex AI, como modelos, conjuntos de datos, plantillas de canalización y componentes. El linaje de una canalización incluye factores que contribuyeron a su creación, así como artefactos y metadatos derivados posteriormente. Consulta Realiza un seguimiento del linaje de artefactos de canalización para obtener más información. |
Impacto en la facturación
Cuando habilites la API de Data Lineage en un proyecto, revisa el impacto en tus cargos de facturación, ya que la API de Data Lineage se habilita por proyecto (consulta la sección anterior para obtener más información).
En el caso de las multirregiones, como la Unión Europea (eu), Asia (asia) y Estados Unidos (us), y para BigQuery Omni, el procesamiento del linaje se distribuye a regiones específicas, y los costos dependen de las regiones en las que se realiza el procesamiento (consulta los ejemplos de precios del Catálogo de datos).
Cumplimiento del linaje de datos
- El linaje de datos registra metadatos sobre el movimiento de los datos, pero no captura los datos en sí. Consulta el modelo de información de linaje de datos y la referencia de la API de Data Lineage para obtener detalles sobre los campos que se incluyen en los metadatos.
- El linaje de datos como parte de Dataplex ofrece compatibilidad con VPC-SC.
- Dataplex no ofrece la capacidad de usar claves de encriptación administradas por el cliente para proteger los metadatos de linaje recopilados.
Limitaciones del linaje de datos
Cuando selecciones un nodo en el gráfico de linaje, el panel lateral de detalles del nodo estará vacío en los siguientes casos:
- los recursos se encuentran en otra organización
- El usuario no es miembro de la organización que aloja el recurso.