Considerações da linhagem de dados

A linhagem de dados é ativada por projeto. Isso significa que, ao ativar a API Data Lineage, as informações de linhagem podem ser informadas automaticamente para vários sistemas, dependendo controle de linhagem em nível de produto.

O rastreamento automático de linhagem é compatível com os seguintes sistemas:

Controles de linhagem no nível do produto em sistemas com suporte do Google Cloud
Sistema Controles de linhagem disponíveis
BigQuery,
Cloud Data Fusion
Não há configuração para restringir o rastreamento de linhagem apenas ao Cloud Data Fusion ou o BigQuery quando a API Data Lineage está ativada em um projeto.
Cloud Composer O Cloud Composer usa a linhagem de dados no nível do ambiente controle de integração. A linhagem de dados é automaticamente ativados para todos os novos ambientes do Cloud Composer, desde que eles atendam aos requisitos e cumprimento de requisitos regulatórios. Consulte A linhagem de dados com o Dataplex (em inglês) para saber mais informações imprecisas ou inadequadas. Nos ambientes atuais, é possível ativar ou desativar a integração da linhagem de dados nas configurações do ambiente.
Dataproc Os jobs do Dataproc Spark podem capturar eventos de linhagem e publicá-los na API Data Lineage. Consulte Integração do Dataproc com a linhagem de dados para mais informações.
Vertex AI A linhagem de dados é ativada automaticamente para artefatos e parâmetros da Vertex AI, como modelos, conjuntos de dados, modelos de pipeline e componentes. A linhagem de um pipeline inclui fatores que contribuíram para sua criação, bem como artefatos e metadados derivados posteriormente. Consulte Rastrear a linhagem de artefatos de pipeline para mais informações.

Impacto no faturamento

Ao ativar a API Data Lineage em um projeto, revise o impacto em suas cobranças de faturamento, pois a API Data Lineage está ativada por projeto (consulte a seção anterior para mais detalhes).

Para multirregiões, como União Europeia (UE), Ásia (Ásia), e nos Estados Unidos (EUA), e, para o BigQuery Omni, o processamento de linhagem são distribuídos para regiões específicas, e os custos dependem das regiões onde o processamento é realizado (consulte exemplos de preços do Data Catalog).

Compliance com a linhagem de dados

  • A linhagem de dados registra metadados sobre a movimentação de dados, mas não captura os dados em si. Confira o modelo de informações da linhagem de dados e Referência da API Data Lineage para detalhes sobre quais campos estão incluídos nos metadados.
  • A linhagem de dados como parte do Dataplex oferece suporte ao VPC-SC.
  • No momento, o Dataplex não oferece a capacidade de usar Chaves de criptografia gerenciadas pelo cliente para proteger os metadados de linhagem coletados.

Limitações da linhagem de dados

Quando você seleciona um nó no gráfico de linhagem, o painel lateral de detalhes do nó estará vazio quando:

  1. os recursos estão em outra organização ou
  2. o usuário não é membro da organização que hospeda o recurso.