Entradas e grupos de entradas são conceitos importantes no Data Catalog. A ilustração a seguir descreve como eles se encaixam no modelo de dados do Data Catalog.
Entradas
As entradas do Data Catalog representam os recursos de dados:
- recursos do Google Cloud, como um conjunto de dados ou tabela do BigQuery ou um tópico do Pub/Sub, por exemplo.
- Recursos personalizados com tipos de dados personalizados.
Você pode criar, pesquisar e gerenciar suas entradas. Para mais informações, consulte Criar entradas personalizadas do Data Catalog para suas fontes de dados.
Grupos de entradas
As entradas estão contidas em um grupo de entradas. Um grupo de entradas é um conjunto de entradas logicamente relacionadas junto com as políticas de Gerenciamento de identidade e acesso que especificam os usuários que podem criar, editar e visualizar entradas em um grupo de entradas.
O Data Catalog cria automaticamente grupos de entradas para recursos do Google Cloud, como o BigQuery (@bigquery
) e tópicos do Pub/Sub (@pubsub
).
Os grupos de entradas do BigQuery e do Pub/Sub são exclusivos porque não é possível executar funções de API que normalmente funcionam em grupos de entradas personalizados. Alguns exemplos dessas funções são a recuperação da lista de grupos de entradas em um projeto, a recuperação de informações básicas sobre um grupo de entradas e a criação ou exclusão de uma tag.
Você cria seu próprio grupo de entradas para conter as entradas do conjunto de arquivos do Cloud Storage e as políticas do IAM associadas a essas entradas. Para mais informações, consulte Mostrar arquivos do Cloud Storage com entradas de conjunto de arquivos.
Assim como as entradas, os grupos de entradas são pesquisáveis.
Mapear recursos de dados para entradas e grupos de entradas
Consulte as tabelas a seguir para entender como o Data Catalog mapeia recursos de dados de diferentes produtos do Google Cloud.
Recurso metastore do Dataproc | Recurso do Data Catalog |
---|---|
Serviço | Entrada e grupo de entrada |
Banco de dados | Entrada |
Tabela | Entrada |
Recurso do Dataplex | Recurso do Data Catalog |
---|---|
Lake | Entrada e grupo de entrada |
Zona | Entrada |
Tabela | Entrada |
Conjunto de arquivos | Entrada |
Recurso do Pub/Sub | Recurso do Data Catalog |
---|---|
Tópico | Entrada dentro de um grupo de entradas do Pub/Sub |
Recurso do Bigtable | Recurso do Data Catalog |
---|---|
Instância | Entrada e grupo de entrada |
Cluster | Atributo dentro de uma entrada de instância |
Tabela | Entrada dentro do grupo de entradas da instância |
Grupos de colunas | Atributo dentro de uma entrada da tabela |
Recurso do BigQuery | Recurso do Data Catalog |
---|---|
Conjunto de dados | Entrada dentro de um grupo de entradas do BigQuery |
Conjunto de dados vinculado | Entrada dentro de um grupo de entradas do BigQuery |
Tabela | Entrada dentro de um grupo de entradas do BigQuery |
Mostrar | Entrada dentro de um grupo de entradas do BigQuery |
Disponibilização | Entrada dentro de um grupo de entradas do BigQuery |
Rotina | Entrada dentro de um grupo de entradas do BigQuery |
Conexão | Entrada dentro de um grupo de entradas do BigQuery |
Recurso da Vertex AI | Recurso do Data Catalog |
---|---|
Disponibilização | Entrada dentro de um grupo de entradas da Vertex AI |
Conjunto de dados | Entrada dentro de um grupo de entradas da Vertex AI |
FeatureGroup | Entrada dentro de um grupo de entradas da Vertex AI |
FeatureOnlineStore | Entrada dentro de um grupo de entradas da Vertex AI |
FeatureView | Entrada dentro de um grupo de entradas da Vertex AI |