Las entradas y los grupos de entradas son conceptos clave en Data Catalog.
En la siguiente ilustración, se muestra cómo se ajustan las entradas y los grupos de entradas en el modelo de datos de Data Catalog.
Entradas
Las entradas de Data Catalog representan recursos de datos:
- Recursos de Google Cloud, como un conjunto de datos o una tabla de BigQuery, un tema de Pub/Sub, por ejemplo
- Recursos personalizados con tipos de datos personalizados
Puedes crear, buscar y administrar tus entradas. Para obtener más información, consulta Crea entradas personalizadas de Data Catalog para tus fuentes de datos.
Grupos de entrada
Las entradas se incluyen en un grupo de entradas. Un grupo de entradas es un conjunto de entradas relacionadas de forma lógica con políticas de Identity and Access Management que especifican los usuarios que pueden crear, editar y ver entradas dentro de un grupo de entradas.
Data Catalog crea automáticamente grupos de entradas para recursos de Google Cloud, como BigQuery (@bigquery
) y temas de Pub/Sub (@pubsub
).
Los grupos de entradas de BigQuery y Pub/Sub son únicos porque no puedes ejecutar funciones de API que suelen funcionar en grupos de entradas personalizados. Algunos ejemplos de estas funciones son recuperar la lista de grupos de entrada en un proyecto, recuperar información básica sobre un grupo de entrada y crear o borrar una etiqueta.
Creas tu propio grupo de entrada para contener tus entradas de conjunto de archivos de Cloud Storage y las políticas de IAM asociadas con esas entradas. Si deseas obtener más información, consulta Archivos de superficie de Cloud Storage con entradas de conjuntos de archivos.
Los grupos de entrada, al igual que las entradas, se pueden buscar.
Asigna recursos de datos a entradas y grupos de entradas
Consulta las siguientes tablas para ver cómo Data Catalog asigna los recursos de datos de diferentes productos de Google Cloud.
Recurso de Dataproc Metastore | Recurso de Data Catalog |
---|---|
Servicio | Entrada y grupo de entrada |
Base de datos | Entrada |
Tabla | Entrada |
Recurso de Dataplex | Recurso de Data Catalog |
---|---|
Lake | Entrada y grupo de entrada |
Zona | Entrada |
Tabla | Entrada |
Conjunto de archivos | Entrada |
Recurso de Pub/Sub | Recurso de Data Catalog |
---|---|
Tema | Entrada dentro de un grupo de entradas de Pub/Sub |
Recurso de Bigtable | Recurso de Data Catalog |
---|---|
Instancia | Entrada y grupo de entrada |
Clúster | Atributo dentro de una entrada de instancia |
Tabla | Entrada dentro del grupo de entradas de la instancia |
Familias de columnas | Atributo dentro de una entrada de tabla |
Recurso de BigQuery | Recurso de Data Catalog |
---|---|
Conjunto de datos | Entrada dentro de un grupo de entradas de BigQuery |
Conjunto de datos vinculado | Entrada dentro de un grupo de entradas de BigQuery |
Tabla | Entrada dentro de un grupo de entradas de BigQuery |
Ver | Entrada dentro de un grupo de entradas de BigQuery |
Modelo | Entrada dentro de un grupo de entradas de BigQuery |
Rutina | Entrada dentro de un grupo de entradas de BigQuery |
Conexión | Entrada dentro de un grupo de entradas de BigQuery |
Recurso de Vertex AI | Recurso de Data Catalog |
---|---|
Modelo | Entrada dentro de un grupo de entradas de Vertex AI |
Conjunto de datos | Entrada dentro de un grupo de entradas de Vertex AI |
FeatureGroup | Entrada dentro de un grupo de entradas de Vertex AI |
FeatureOnlineStore | Entrada dentro de un grupo de entradas de Vertex AI |
FeatureView | Entrada dentro de un grupo de entradas de Vertex AI |