Entradas y grupos de entrada

Las entradas y los grupos de entradas son conceptos clave en Data Catalog. En la siguiente ilustración, se muestra cómo encajan en el modelo de datos de Data Catalog.

Dentro de cada proyecto hay ubicaciones y, dentro de cada ubicación, hay grupos de entradas que contienen entradas para diferentes recursos y fuentes de datos.
Figure 1. Los grupos de entrada organizan diferentes fuentes de datos y recursos.

Entradas

Las entradas de Data Catalog representan recursos de datos:

  • Recursos de Google Cloud, como un conjunto de datos o una tabla de BigQuery o un tema de Pub/Sub
  • Recursos personalizados con tipos de datos personalizados.

Puedes crear, buscar y administrar tus entradas. Si deseas obtener más información, consulta Crea entradas personalizadas de Data Catalog para tus fuentes de datos.

Grupos de entrada

Las entradas se encuentran dentro de un grupo de entradas. Un grupo de entrada es un conjunto de entradas relacionadas de forma lógica junto con políticas de Identity and Access Management que especifican los usuarios que pueden crear, editar y ver entradas dentro de un grupo de entradas.

Data Catalog crea de forma automática grupos de entrada para los recursos de Google Cloud, como BigQuery (@bigquery) y los temas de Pub/Sub (@pubsub).

Los grupos de entradas de BigQuery y Pub/Sub son únicos porque no puedes ejecutar funciones de API que suelen trabajar en grupos de entrada personalizados. Algunos ejemplos de esas funciones son recuperar la lista de grupos de entrada de un proyecto, recuperar información básica sobre un grupo de entradas y crear o borrar una etiqueta.

Creas tu propio grupo de entrada para contener tus entradas de conjunto de archivos de Cloud Storage y las políticas de IAM asociadas con esas entradas. Si deseas obtener más información, consulta Archivos de superficie de Cloud  Storage con entradas de conjuntos de archivos.

Al igual que las entradas, se pueden buscar los grupos de entrada.

Asigna recursos de datos a entradas y grupos de entradas

Consulta las siguientes tablas para ver cómo Data Catalog asigna recursos de datos de diferentes productos de Google Cloud.

Asigna Dataproc Metastore a Data Catalog
Recurso de Dataproc Metastore Recurso de Data Catalog
Servicio Entrada y grupo de entradas
Base de datos Entrada
Tabla Entrada
Asigna Dataplex a Data Catalog
Recurso de Dataplex Recurso de Data Catalog
Lake Entrada y grupo de entradas
Zona Entrada
Tabla Entrada
Conjunto de archivos Entrada
Asigna Pub/Sub a Data Catalog
Recurso de Pub/Sub Recurso de Data Catalog
Tema Una entrada dentro de un grupo de entradas de Pub/Sub
Asigna Bigtable a Data Catalog
Recurso de Bigtable Recurso de Data Catalog
Instancia Entrada y grupo de entradas
Clúster Atributo dentro de una entrada de instancia
Tabla Entrada dentro del grupo de entrada de la instancia
Familias de columnas Atributo dentro de una entrada de tabla
Asigna BigQuery a Data Catalog
Recurso de BigQuery Recurso de Data Catalog
Conjunto de datos Una entrada dentro de un grupo de entradas de BigQuery
Conjunto de datos vinculado Una entrada dentro de un grupo de entradas de BigQuery
Tabla Una entrada dentro de un grupo de entradas de BigQuery
Ver Una entrada dentro de un grupo de entradas de BigQuery
Modelo Una entrada dentro de un grupo de entradas de BigQuery
Rutina Una entrada dentro de un grupo de entradas de BigQuery
Conexión Una entrada dentro de un grupo de entradas de BigQuery
Asigna Vertex AI a Data Catalog
Recurso de Vertex AI Recurso de Data Catalog
Modelo Una entrada dentro de un grupo de entradas de Vertex AI
Conjunto de datos Una entrada dentro de un grupo de entradas de Vertex AI
FeatureGroup Una entrada dentro de un grupo de entradas de Vertex AI
FeatureOnlineStore Una entrada dentro de un grupo de entradas de Vertex AI
FeatureView Una entrada dentro de un grupo de entradas de Vertex AI