A linhagem de dados mostra as relações entre os recursos do seu projeto e os processos que os criaram.
É possível conferir as informações de linhagem de dados no console do Google Cloud nos seguintes formatos:
- Gráfico de linhagem: mostra a linhagem upstream ou downstream de uma única entrada raiz. Para mais informações, consulte Gráfico de linhagem.
- Visualização do caminho de linhagem (pré-lançamento): mostra os links de linhagem entre dois recursos selecionados. Para mais informações, consulte Visualização do caminho de linhagem.
- Visualização de lista de linhagens (pré-lançamento): mostra informações detalhadas de linhagem para recursos em uma única tabela que inclui informações de linhagem para recursos com muitas conexões. Para mais informações, consulte Visualização de lista de linhagem.
Também é possível recuperar informações de linhagem da API Data Lineage na forma de dados JSON.
A linhagem é capturada em vários projetos. Quando você consulta a linhagem gerada em vários projetos, é possível conferir as informações agregadas em qualquer um dos projetos relevantes.
Papéis e permissões
Para conferir as informações de linhagem, peça ao administrador para conceder a você as funções de leitor, conforme descrito em Funções predefinidas para a linhagem de dados. Você precisa ter acesso ao projeto em que você visualiza a linhagem e aos projetos em que a linhagem é gravada.
O Dataplex rastreia as informações de linhagem automaticamente quando você ativa a API Data Lineage. Você não precisa de funções de administrador ou editor para capturar a linhagem dos seus recursos de dados.
Para mais informações sobre como conceder papéis, consulte Gerenciar acesso. É possível atribuir um papel em um nível mais alto de pasta ou organização (consulte Conceder ou revogar um único papel).
Ativar a linhagem de dados
Ative a linhagem de dados para começar a rastrear automaticamente as informações de linhagem para sistemas com suporte. É necessário ativar a API Data Lineage no projeto em que você visualiza a linhagem e nos projetos em que a linhagem é gravada. Para mais informações, consulte Tipos de projeto.
Para capturar informações de linhagem, faça o seguinte:
-
No console do Google Cloud, na página Seletor de projetos, selecione o projeto em que você quer registrar a linhagem.
Ative a API Data Lineage.
- Repita as etapas anteriores para cada projeto em que você quer registrar a linhagem.
-
No projeto em que você visualiza a linhagem, ative a API Data Lineage e a API Dataplex.
Visualizar a linhagem no Dataplex
É possível conferir informações sobre a linhagem de dados na interface da Web do Dataplex.
Para conferir a linhagem, siga estas instruções:
Abra a página de pesquisa do Dataplex Catalog e encontre o recurso para o qual você quer ver as informações de linhagem.
Para mais informações, consulte Pesquisar recursos no Dataplex Catalog.Na página de detalhes da entrada, selecione a guia Linhagem.
Para conferir o gráfico de linhagem, clique em Graph.
Selecione os botões de processo ou de fonte de dados para mostrar o painel de detalhes.
Para conferir informações de linhagem upstream ou downstream de um recurso, clique em
Expandir.
Para conferir a linhagem na visualização em lista, clique em List.
Para conferir a visualização do caminho de linhagem, clique em Listar e selecione o recurso de destino na tabela de resultados. No painel de detalhes, clique em Alvo e em Visualizar linhagem.
Conferir a linhagem no BigQuery
É possível conferir informações sobre a linhagem de dados na interface da Web do BigQuery.
Para conferir a linhagem, siga estas instruções:
- No Console do Google Cloud, acesse a página BigQuery.
Abra a tabela para a qual você quer conferir a linhagem de dados.
Clique na guia Linhagem.
Para conferir o gráfico de linhagem, clique em Graph.
Selecione os botões de processo ou de fonte de dados para mostrar o painel de detalhes.
Para conferir informações de linhagem upstream ou downstream de um recurso, clique em
Expandir.
Para conferir a linhagem na visualização em lista, clique em List.
Para conferir a visualização do caminho de linhagem, clique em Listar e selecione o recurso de destino na tabela de resultados. No painel de detalhes, clique em Alvo e em Visualizar linhagem.
Conferir a linhagem na Vertex AI
Sistemas como o Vertex AI Pipelines geram dados de linhagem para modelos e conjuntos de dados da Vertex AI. É possível conferir informações de linhagem de dados na interface da Web da interface da Vertex AI.
Conferir a linhagem de um conjunto de dados gerenciado na Vertex AI
Para conferir a linhagem de um conjunto de dados, siga estas instruções:
- No console do Google Cloud, acesse a página Conjuntos de dados.
Clique no conjunto de dados para ver a linhagem de dados.
Clique na guia Linhagem.
Para conferir o gráfico de linhagem, clique em Graph.
Selecione os botões de processo ou de fonte de dados para mostrar o painel de detalhes.
Para conferir informações de linhagem upstream ou downstream de um recurso, clique em
Expandir.
Para conferir a linhagem na visualização em lista, clique em List.
Para conferir a visualização do caminho de linhagem, clique em Listar e selecione o recurso de destino na tabela de resultados. No painel de detalhes, clique em Alvo e em Visualizar linhagem.
Conferir a linhagem de um modelo na Vertex AI
Para conferir a linhagem de um modelo, siga estas instruções:
No Console do Google Cloud, acesse a página Registro do modelo..
Clique no modelo para ver a linhagem de dados.
Clique na guia Linhagem.
Para conferir o gráfico de linhagem, clique em Graph.
Selecione os botões de processo ou de fonte de dados para mostrar o painel de detalhes.
Para conferir informações de linhagem upstream ou downstream de um recurso, clique em
Expandir.
Para conferir a linhagem na visualização em lista, clique em List.
Para conferir a visualização do caminho de linhagem, clique em Listar e selecione o recurso de destino na tabela de resultados. No painel de detalhes, clique em Alvo e em Visualizar linhagem.
A seguir
Rastrear a linhagem de dados de um job de cópia e consulta de tabelas do BigQuery.
Saiba mais sobre o modelo de informações de linhagem de dados.