Usar a linhagem de dados com os sistemas do Google Cloud

Ative a linhagem de dados em um projeto do Google Cloud para começar a rastrear automaticamente as informações da linhagem de sistemas com suporte.

Papéis e permissões

O Data Catalog rastreia informações de linhagem automaticamente quando você ativa a API Data Lineage. Você não precisa de papéis de administrador ou editor para capturar a linhagem dos recursos de dados e acessá-la no console do Google Cloud. Os papéis padrão de leitor, conforme descrito na seção Identity and Access Management, são suficientes. Para mais informações sobre como conceder papéis, consulte Gerenciar acesso. É possível atribuir um papel em um nível de pasta ou organização superior. Consulte Conceder ou revogar um único papel.

Ativar a linhagem de dados

  1. No console do Google Cloud, na página do seletor de projetos, selecione o projeto que contém os recursos com a linhagem que você quer rastrear.

    Acessar o seletor de projetos

  2. Ativar as APIs Data Lineage e Data Catalog.

    Ativar as APIs

Confira gráficos de linhagem na interface do Dataplex

O gráfico de visualização de linhagem exibe as relações entre os recursos do projeto e os processos que os criaram. É possível consultar informações de linhagem de dados na forma de uma visualização de gráfico no console do Google Cloud ou recuperá-las da API Data Lineage na forma de dados JSON.

  1. Abra a página de pesquisa do Dataplex e encontre o recurso com as informações de linhagem que você quer visualizar.

    Abrir a página de pesquisa do Dataplex

    Para mais informações, consulte Como pesquisar recursos de dados.

  2. Na página de detalhes da entrada, selecione a guia Linhagem.

Um gráfico de amostra mostra dados de duas tabelas sendo transformadas e mescladas.
Figura 1. Exemplo de um gráfico de visualização de linhagem na interface do Dataplex.

Selecione os botões do processo ou da fonte de dados para exibir o painel de detalhes.

Confira os gráficos de linhagem na interface do BigQuery

É possível conferir o gráfico de linhagem diretamente na interface do BigQuery.

  1. No Console do Google Cloud, acesse a página BigQuery.

    Abrir a página do BigQuery

  2. Abra a tabela para consultar a linhagem de dados.
  3. Clique na guia Linhagem.
  4. Selecione os botões do processo ou da fonte de dados para exibir o painel de detalhes.

Confira os gráficos de linhagem na interface da Vertex AI

Sistemas como o Vertex AI Pipelines geram dados de linhagem para modelos e conjuntos de dados da Vertex AI. É possível conferir o gráfico de linhagem diretamente na interface da Vertex AI.

Acessar gráficos de linhagem de um conjunto de dados gerenciado na Vertex AI

Para visualizar o gráfico de linhagem de um conjunto de dados, siga estas instruções:

  1. No console do Google Cloud, acesse a página Conjuntos de dados.

    Abrir a página "Conjuntos de dados"

  2. Clique no conjunto de dados para o qual você quer ver a linhagem de dados.
  3. Clique na guia Linhagem.
  4. Selecione os botões do processo ou da fonte de dados para exibir o painel de detalhes.

Conferir gráficos de linhagem de um modelo na Vertex AI

Para visualizar o gráfico de linhagem de um modelo, siga estas instruções:

  1. No Console do Google Cloud, acesse a página Registro do modelo..

    Abrir a página do Model Registry

  2. Clique no modelo que tem a linhagem de dados que você quer ver.
  3. Clique na guia Linhagem.
  4. Selecione os botões do processo ou da fonte de dados para exibir o painel de detalhes.

A seguir