Usa el linaje de datos con sistemas de Google Cloud

Habilitar el linaje de datos en un proyecto de Google Cloud para comenzar a hacer un seguimiento automático de la información del linaje para los sistemas compatibles

Funciones y permisos

Data Catalog hace un seguimiento de la información del linaje automáticamente cuando habilitas la API de Data Lineage. No necesitas ningún rol de administrador o editor para capturar el linaje de tus recursos de datos y acceder a él en la consola de Google Cloud. Son suficientes las funciones de visualizador estándar, como se describe en la sección Administración de identidades y accesos. Para obtener más información sobre cómo otorgar funciones, consulta Administra el acceso. Puedes asignar una función en un nivel superior de organización o carpeta (consulta Otorga o revoca una sola función).

Habilita el linaje de datos

  1. En la consola de Google Cloud, en la página del selector de proyectos, elige el proyecto que contiene los recursos para los que deseas realizar un seguimiento del linaje.

    Ir al selector de proyectos

  2. Habilitar la API de Data Lineage y la API de Data Catalog

    Habilita las APIs

Ver gráficos de linaje en la IU de Dataplex

El gráfico de visualización del linaje muestra las relaciones entre los recursos de tu proyecto y los procesos que los crearon. Puedes ver la información del linaje de datos en forma de visualización gráfica en la consola de Google Cloud o recuperarla desde la API de Data Lineage en forma de datos JSON.

  1. Abre la página de búsqueda de Dataplex y busca el recurso para el que quieres ver la información del linaje.

    Abrir la página de búsqueda de Dataplex

    Para obtener más información, consulta Cómo buscar recursos de datos.

  2. En la página de detalles de entrada, selecciona la pestaña Linaje.

Un gráfico de muestra en el que se muestran datos de dos tablas que se transforman y, luego, se combinan.
Figura 1: Ejemplo de un gráfico de visualización de linaje en la IU de Dataplex.

Selecciona los botones del proceso o de la fuente de datos para mostrar el panel de detalles.

Visualiza gráficos de linaje en la IU de BigQuery

Puedes ver el gráfico de linaje directamente en la IU de BigQuery.

  1. En la consola de Google Cloud, ve a la página de BigQuery.

    Abrir la página de BigQuery

  2. Abre la tabla en la que deseas ver el linaje de datos.
  3. Haz clic en la pestaña Linaje.
  4. Selecciona los botones del proceso o de la fuente de datos para mostrar el panel de detalles.

Visualiza gráficos de linaje en la IU de Vertex AI

Los sistemas como Vertex AI Pipelines generan datos de linaje para los modelos y conjuntos de datos de Vertex AI. Puedes ver el gráfico de linaje directamente en la IU de Vertex AI.

Visualiza gráficos de linaje para un conjunto de datos administrado en Vertex AI

Para ver el gráfico de linaje de un conjunto de datos, sigue estas instrucciones:

  1. En la consola de Google Cloud, ve a la página Conjuntos de datos.

    Abrir la página Conjuntos de datos

  2. Haz clic en el conjunto de datos del que quieres ver el linaje de datos.
  3. Haz clic en la pestaña Linaje.
  4. Selecciona los botones del proceso o de la fuente de datos para mostrar el panel de detalles.

Visualiza gráficos de linaje de un modelo en Vertex AI

Para ver el gráfico de linaje de un modelo, sigue estas instrucciones:

  1. En la consola de Google Cloud, ve a la página Model Registry.

    Abrir la página Registro de modelos

  2. Haz clic en el modelo del que deseas ver el linaje de datos.
  3. Haz clic en la pestaña Linaje.
  4. Selecciona los botones del proceso o de la fuente de datos para mostrar el panel de detalles.

¿Qué sigue?