Consideraciones del linaje de datos

El linaje de datos se habilita por proyecto. Esto significa que, una vez que habilites la API de Data Lineage, la información del linaje se puede informar automáticamente para varios sistemas según su control de linaje a nivel de producto.

El seguimiento automático del linaje es compatible con los siguientes sistemas:

Controles de linaje a nivel de producto en sistemas compatibles con Google Cloud
Sistema Controles de linaje disponibles
BigQuery,
Cloud Data Fusion
No hay configuración para restringir el seguimiento de linaje a solo Cloud Data Fusion o BigQuery cuando la API de Data Lineage está habilitada en un proyecto.
Cloud Composer Cloud Composer usa el control de integración del linaje de datos a nivel del entorno. El linaje de datos se habilita de forma automática para todos los entornos nuevos de Cloud Composer, siempre que cumplan con los requisitos. Consulta Linaje de datos con Dataplex para obtener más información. Para los entornos existentes, puedes habilitar o inhabilitar la integración del linaje de datos en la configuración del entorno.
Dataproc Los trabajos de Spark de Dataproc pueden capturar eventos de linaje y publicarlos en la API de Data Lineage. Consulta Integración de Dataproc del linaje de datos para obtener más información.
Vertex AI El linaje de datos se habilita automáticamente para los artefactos y parámetros de Vertex AI, como modelos, conjuntos de datos, plantillas de canalizaciones y componentes. En el linaje de una canalización se incluyen factores que contribuyeron a su creación, así como artefactos y metadatos derivados posteriormente. Para obtener más información, consulta Haz un seguimiento del linaje de artefactos de canalización.

Impacto en la facturación

Cuando habilites la API de Data Lineage en un proyecto, revisa el impacto en tus cargos de facturación, ya que la API de Data Lineage está habilitada por proyecto (consulta la sección anterior para obtener más detalles).

Para las multirregiones, como la Unión Europea (UE), Asia (asia) y Estados Unidos (EE.UU.), y para BigQuery Omni, el procesamiento de linaje se distribuye a regiones específicas, y los costos dependen de las regiones en las que se realiza (consulta ejemplos de precios de Data Catalog).

Cumplimiento del linaje de datos

  • El linaje de datos registra metadatos sobre movimiento de datos, pero no los captura. Consulta el modelo de información del linaje de datos y la referencia de la API de Data Lineage para obtener detalles sobre los campos que se incluyen en los metadatos.
  • El linaje de datos como parte de Dataplex ofrece compatibilidad con VPC-SC.
  • En la actualidad, Dataplex no ofrece la capacidad de usar claves de encriptación administradas por el cliente para proteger los metadatos del linaje recopilado.

Limitaciones del linaje de datos

Cuando seleccionas un nodo en el gráfico de linaje, el panel lateral de los detalles del nodo estará vacío en los siguientes casos:

  1. Si los recursos están ubicados en otra organización
  2. el usuario no es miembro de la organización que aloja el recurso.