Entradas e grupos de entradas

Entradas e grupos de entradas são conceitos importantes no Data Catalog.

A ilustração a seguir mostra como as entradas e os grupos de entradas se encaixam Modelo de dados do Data Catalog.

Dentro de cada projeto existem locais, e dentro de cada local há entradas
  grupos que contêm entradas para diferentes fontes de dados e recursos.
Figura 1. Esses grupos organizam diferentes fontes de dados e recursos.

Entradas

As entradas do Data Catalog representam os recursos de dados:

  • recursos do Google Cloud, como um conjunto de dados do BigQuery ou ou tópico do Pub/Sub, por exemplo.
  • Recursos personalizados com tipos de dados personalizados.

Você pode criar, pesquisar e gerenciar suas entradas. Para mais informações, consulte Criar entradas personalizadas do Data Catalog para suas fontes de dados.

Grupos de entradas

As entradas estão contidas em um grupo de entradas. Um grupo de entradas é um conjunto de entradas logicamente relacionadas junto com as políticas de Gerenciamento de identidade e acesso que especificam os usuários que podem criar, editar e visualizar entradas em um grupo de entradas.

O Data Catalog cria grupos de entrada automaticamente para o Google Cloud recursos, como o BigQuery (@bigquery) e o Pub/Sub tópicos (@pubsub).

Os grupos de entradas do BigQuery e do Pub/Sub são exclusivos porque não é possível executar funções de API que normalmente funcionam em grupos de entradas personalizados. Algumas exemplos dessas funções são recuperar a lista de grupos de entradas em um projeto, recuperação de informações básicas sobre um grupo de entradas e criação ou exclusão de um tag.

Você cria seu próprio grupo de entradas para conter as entradas do conjunto de arquivos do Cloud Storage e as políticas do IAM associadas a essas entradas. Para mais informações, consulte Mostrar arquivos do Cloud Storage com entradas de conjunto de arquivos.

Os grupos de entradas, assim como as entradas, são pesquisáveis.

Mapear ativos de dados para entradas e grupos de entradas

Consulte as tabelas a seguir para ver como o Data Catalog mapeia recursos de dados de diferentes produtos do Google Cloud.

Mapear o metastore do Dataproc para o Data Catalog
Recurso do metastore do Dataproc Recurso do Data Catalog
Serviço Entrada e grupo de entrada
Banco de dados Entrada
Tabela Entrada
Mapear o Dataplex para o Data Catalog
Recurso do Dataplex Recurso do Data Catalog
Lake Entrada e grupo de entrada
Zona Entrada
Tabela Entrada
Conjunto de arquivos Entrada
Mapear o Pub/Sub para o Data Catalog
Recurso do Pub/Sub Recurso do Data Catalog
Tópico Entrada em um grupo de entradas do Pub/Sub
Mapear o Bigtable para o Data Catalog
Recurso do Bigtable Recurso do Data Catalog
Instância Entrada e grupo de entrada
Cluster Atributo dentro de uma entrada de instância
Tabela Entrada no grupo de entradas da instância
Grupos de colunas Atributo dentro de uma entrada da tabela
Mapear o BigQuery para o Data Catalog
Recurso do BigQuery Recurso do Data Catalog
Conjunto de dados Entrada em um grupo de entradas do BigQuery
Conjunto de dados vinculado Entrada em um grupo de entradas do BigQuery
Tabela Entrada em um grupo de entradas do BigQuery
Ver Entrada em um grupo de entradas do BigQuery
Modelo Entrada em um grupo de entradas do BigQuery
Rotina Entrada em um grupo de entradas do BigQuery
Conexão Entrada em um grupo de entradas do BigQuery
Mapear a Vertex AI para o Data Catalog
Recurso da Vertex AI Recurso do Data Catalog
Modelo Entrada em um grupo de entrada da Vertex AI
Conjunto de dados Entrada em um grupo de entrada da Vertex AI
FeatureGroup Entrada em um grupo de entrada da Vertex AI
FeatureOnlineStore Entrada em um grupo de entrada da Vertex AI
FeatureView Entrada em um grupo de entrada da Vertex AI