Las entradas y los grupos de entradas son conceptos clave en Data Catalog. En la siguiente ilustración, se muestra cómo encajan en el modelo de datos de Data Catalog.
Entradas
Las entradas de Data Catalog representan recursos de datos:
- Recursos de Google Cloud, como un conjunto de datos o una tabla de BigQuery o un tema de Pub/Sub
- Recursos personalizados con tipos de datos personalizados.
Puedes crear, buscar y administrar tus entradas. Si deseas obtener más información, consulta Crea entradas personalizadas de Data Catalog para tus fuentes de datos.
Grupos de entrada
Las entradas se encuentran dentro de un grupo de entradas. Un grupo de entrada es un conjunto de entradas relacionadas de forma lógica junto con políticas de Identity and Access Management que especifican los usuarios que pueden crear, editar y ver entradas dentro de un grupo de entradas.
Data Catalog crea de forma automática grupos de entrada para los recursos de Google Cloud, como BigQuery (@bigquery
) y los temas de Pub/Sub (@pubsub
).
Los grupos de entradas de BigQuery y Pub/Sub son únicos porque no puedes ejecutar funciones de API que suelen trabajar en grupos de entrada personalizados. Algunos ejemplos de esas funciones son recuperar la lista de grupos de entrada de un proyecto, recuperar información básica sobre un grupo de entradas y crear o borrar una etiqueta.
Creas tu propio grupo de entrada para contener tus entradas de conjunto de archivos de Cloud Storage y las políticas de IAM asociadas con esas entradas. Si deseas obtener más información, consulta Archivos de superficie de Cloud Storage con entradas de conjuntos de archivos.
Al igual que las entradas, se pueden buscar los grupos de entrada.
Asigna recursos de datos a entradas y grupos de entradas
Consulta las siguientes tablas para ver cómo Data Catalog asigna recursos de datos de diferentes productos de Google Cloud.
Recurso de Dataproc Metastore | Recurso de Data Catalog |
---|---|
Servicio | Entrada y grupo de entradas |
Base de datos | Entrada |
Tabla | Entrada |
Recurso de Dataplex | Recurso de Data Catalog |
---|---|
Lake | Entrada y grupo de entradas |
Zona | Entrada |
Tabla | Entrada |
Conjunto de archivos | Entrada |
Recurso de Pub/Sub | Recurso de Data Catalog |
---|---|
Tema | Una entrada dentro de un grupo de entradas de Pub/Sub |
Recurso de Bigtable | Recurso de Data Catalog |
---|---|
Instancia | Entrada y grupo de entradas |
Clúster | Atributo dentro de una entrada de instancia |
Tabla | Entrada dentro del grupo de entrada de la instancia |
Familias de columnas | Atributo dentro de una entrada de tabla |
Recurso de BigQuery | Recurso de Data Catalog |
---|---|
Conjunto de datos | Una entrada dentro de un grupo de entradas de BigQuery |
Conjunto de datos vinculado | Una entrada dentro de un grupo de entradas de BigQuery |
Tabla | Una entrada dentro de un grupo de entradas de BigQuery |
Ver | Una entrada dentro de un grupo de entradas de BigQuery |
Modelo | Una entrada dentro de un grupo de entradas de BigQuery |
Rutina | Una entrada dentro de un grupo de entradas de BigQuery |
Conexión | Una entrada dentro de un grupo de entradas de BigQuery |
Recurso de Vertex AI | Recurso de Data Catalog |
---|---|
Modelo | Una entrada dentro de un grupo de entradas de Vertex AI |
Conjunto de datos | Una entrada dentro de un grupo de entradas de Vertex AI |
FeatureGroup | Una entrada dentro de un grupo de entradas de Vertex AI |
FeatureOnlineStore | Una entrada dentro de un grupo de entradas de Vertex AI |
FeatureView | Una entrada dentro de un grupo de entradas de Vertex AI |