Las entradas y los grupos de entradas son conceptos clave en Data Catalog.
En la siguiente ilustración, se muestra cómo las entradas y los grupos de entradas se ajustan al modelo de datos de Data Catalog.
Entradas
Las entradas de Data Catalog representan recursos de datos:
- Recursos de Google Cloud, como una tabla o un conjunto de datos de BigQuery, o un tema de Pub/Sub, por ejemplo.
- Recursos personalizados con tipos de datos personalizados.
Puedes crear, buscar y administrar tus entradas. Si deseas obtener más información, consulta Crea entradas de Data Catalog personalizadas para tus fuentes de datos.
Grupos de entrada
Las entradas se encuentran en un grupo de entrada. Un grupo de entradas es un conjunto de entradas relacionadas de forma lógica junto con las políticas de Identity and Access Management que especifican los usuarios que pueden crear, editar y ver entradas dentro de un grupo de entradas.
Data Catalog crea de forma automática grupos de entradas para los recursos de Google Cloud, como BigQuery (@bigquery
) y temas de Pub/Sub (@pubsub
).
Los grupos de entrada de BigQuery y Pub/Sub son únicos porque no puedes ejecutar funciones de API que suelen trabajar en grupos de entrada personalizados. Algunos ejemplos de esas funciones son recuperar la lista de grupos de entrada en un proyecto, recuperar información básica sobre un grupo de entrada y crear o borrar una etiqueta.
Creas tu propio grupo de entrada para contener tus entradas de conjunto de archivos de Cloud Storage y las políticas de IAM asociadas con esas entradas. Si deseas obtener más información, consulta Archivos de superficie de Cloud Storage con entradas de conjuntos de archivos.
Los grupos de entrada, similares a las entradas, se pueden buscar.
Asigna recursos de datos a entradas y grupos de entradas
Consulta las siguientes tablas para ver cómo Data Catalog asigna recursos de datos de diferentes productos de Google Cloud.
Recurso de Dataproc Metastore | Recurso de Data Catalog |
---|---|
Servicio | Entrada y grupo de entrada |
Base de datos | Entrada |
Tabla | Entrada |
Recurso de Dataplex | Recurso de Data Catalog |
---|---|
Lake | Entrada y grupo de entrada |
Zona | Entrada |
Tabla | Entrada |
Conjunto de archivos | Entrada |
Recurso de Pub/Sub | Recurso de Data Catalog |
---|---|
Tema | Entrada dentro de un grupo de entradas de Pub/Sub |
Recurso de Bigtable | Recurso de Data Catalog |
---|---|
Instancia | Entrada y grupo de entrada |
Clúster | Atributo dentro de una entrada de instancia |
Tabla | Entrada dentro del grupo de entrada de instancia |
Familias de columnas | Atributo dentro de una entrada de tabla |
Recurso de BigQuery | Recurso de Data Catalog |
---|---|
Conjunto de datos | Entrada dentro de un grupo de entrada de BigQuery |
Conjunto de datos vinculado | Entrada dentro de un grupo de entrada de BigQuery |
Tabla | Entrada dentro de un grupo de entrada de BigQuery |
View | Entrada dentro de un grupo de entrada de BigQuery |
Modelo | Entrada dentro de un grupo de entrada de BigQuery |
Rutina | Entrada dentro de un grupo de entrada de BigQuery |
Conexión | Entrada dentro de un grupo de entrada de BigQuery |
Recurso de Vertex AI | Recurso de Data Catalog |
---|---|
Modelo | Entrada dentro de un grupo de entradas de Vertex AI |
Conjunto de datos | Entrada dentro de un grupo de entradas de Vertex AI |
FeatureGroup | Entrada dentro de un grupo de entradas de Vertex AI |
FeatureOnlineStore | Entrada dentro de un grupo de entradas de Vertex AI |
FeatureView | Entrada dentro de un grupo de entradas de Vertex AI |