Usar a linhagem de dados com os sistemas do Google Cloud

Ative a linhagem de dados em um projeto do Google Cloud para começar a rastrear automaticamente as informações de linhagem dos sistemas com suporte.

Papéis e permissões

O Data Catalog rastreia informações de linhagem automaticamente quando você ativa a API Data Lineage. Você não precisa de papéis de administrador ou editor para capturar a linhagem dos recursos de dados e acessá-la no console do Google Cloud. Os papéis padrão de leitor, conforme descrito na seção Identity and Access Management, são suficientes. Para mais informações sobre como conceder papéis, consulte Gerenciar acesso. É possível atribuir um papel em um nível superior de pasta ou organização. Consulte Conceder ou revogar um único papel.

Ativar a linhagem de dados

  1. No console do Google Cloud, na página do seletor de projetos, selecione o projeto que contém os recursos com os quais você quer acompanhar a linhagem.

    Acessar o seletor de projetos

  2. Ativar a API Data Lineage e a API Data Catalog.

    Ativar as APIs

Conferir gráficos de linhagem na interface do Dataplex

O gráfico de visualização da linhagem mostra as relações entre os recursos do projeto e os processos que os criaram. É possível ver informações da linhagem de dados como uma visualização gráfica no console do Google Cloud ou recuperá-las da API Data Lineage na forma de dados JSON.

  1. Abra a página de pesquisa do Dataplex e encontre o recurso com as informações de linhagem que você quer conferir.

    Abrir a página de pesquisa do Dataplex

    Para mais informações, consulte Como pesquisar recursos de dados.

  2. Na página de detalhes da entrada, selecione a guia Linhagem.

Um exemplo de gráfico mostra dados de duas tabelas sendo transformadas e depois mescladas.
Figura 1. Exemplo de um gráfico de visualização de linhagem na interface do Dataplex.

Selecione os botões do processo ou da fonte de dados para mostrar o painel de detalhes.

Conferir gráficos de linhagem na interface do BigQuery

É possível visualizar o gráfico de linhagem diretamente na interface do BigQuery.

  1. No Console do Google Cloud, acesse a página BigQuery.

    Abrir a página do BigQuery

  2. Abra a tabela que contém a linhagem de dados que você quer conferir.
  3. Clique na guia Linhagem.
  4. Selecione os botões do processo ou da fonte de dados para mostrar o painel de detalhes.

Conferir gráficos de linhagem na interface da Vertex AI

Sistemas como Vertex AI Pipelines geram dados de linhagem para modelos e conjuntos de dados da Vertex AI. É possível conferir o gráfico de linhagem diretamente na interface da Vertex AI.

Conferir gráficos de linhagem de um conjunto de dados gerenciado na Vertex AI

Para conferir o gráfico de linhagem de um conjunto de dados, siga estas instruções:

  1. No console do Google Cloud, acesse a página Conjuntos de dados.

    Abrir a página "Conjuntos de dados"

  2. Clique no conjunto de dados que contém a linhagem de dados que você quer conferir.
  3. Clique na guia Linhagem.
  4. Selecione os botões do processo ou da fonte de dados para mostrar o painel de detalhes.

Acessar gráficos de linhagem de um modelo na Vertex AI

Para conferir o gráfico de linhagem de um modelo, siga estas instruções:

  1. No Console do Google Cloud, acesse a página Registro do modelo..

    Abrir a página Model Registry

  2. Clique no modelo com a linhagem de dados que você quer conferir.
  3. Clique na guia Linhagem.
  4. Selecione os botões do processo ou da fonte de dados para mostrar o painel de detalhes.

A seguir