Gestionar recursos de datos con Data Catalog
Data Catalog cataloga automáticamente los metadatos de los recursos de Bigtable. Esta función ayuda a tu organización a buscar y gestionar tus recursos de datos de Bigtable.
Los metadatos se sincronizan automáticamente de Bigtable a Data Catalog para los siguientes recursos de Bigtable:
- Instancias
- Clústeres
- Tablas, incluidos los detalles de las familias de columnas
Data Catalog es un servicio de gestión de metadatos totalmente gestionado. Proporciona una vista unificada y mecanismos de etiquetado para los metadatos técnicos y empresariales. Para obtener más información sobre Data Catalog y por qué deberías usarlo, consulta el artículo ¿Qué es Data Catalog?
Ventajas de usar Data Catalog con Bigtable
La información de Data Catalog sobre tus datos puede facilitar el análisis, la reutilización de datos, el desarrollo de aplicaciones y la gestión de datos.
Puede buscar entradas en Data Catalog por nombre de recurso o por detalles. Por ejemplo, puedes buscar el nombre de una instancia para encontrar la entrada de una instancia o buscar una familia de columnas para encontrar la entrada de una tabla. También puedes usar una búsqueda por facetas, aplicando filtros para acotar la búsqueda. Para obtener más información, consulta el artículo Buscar y ver recursos de datos con Data Catalog.
Etiquetar los recursos de datos puede ayudarte a comprender y catalogar los datos que están disponibles en tus tablas de Bigtable para que otros usuarios de Data Catalog puedan descubrirlos y buscarlos más fácilmente, así como para que formen parte de tu conjunto de datos más amplio. Las etiquetas te permiten añadir tus propios metadatos a los metadatos catalogados y, después, puedes usar esas etiquetas para hacer búsquedas.
Empieza a utilizar Data Catalog.
Para empezar a usar Data Catalog y gestionar sus recursos de datos de Bigtable, complete las siguientes tareas:
Si no has usado Data Catalog antes, habilita la API.
Concede roles de gestión de identidades y accesos a las entidades que necesiten acceder a las entradas de Bigtable en Data Catalog.
Para saber cómo buscar recursos de datos, consulta el artículo Buscar con Data Catalog.
Consulta la sintaxis de búsqueda de Data Catalog para saber cómo encontrar tus metadatos.
Consulta los conceptos sobre el etiquetado de entradas de Data Catalog en Etiquetas y plantillas de etiquetas.
Formas de buscar metadatos de Bigtable
Puedes buscar metadatos de Bigtable sincronizados con Data Catalog.
Además de los calificadores estándar, puedes buscar recursos de Bigtable con lo siguiente:
Instancia
- Nombre de la instancia de Bigtable
- ID de instancia de Bigtable
- Ubicación del clúster
- ID de clúster
Tabla
- ID de tabla
- Nombre de la familia de columnas
- Nombre de la instancia de Bigtable
- ID de instancia de Bigtable
Roles obligatorios
Para ver, etiquetar y buscar recursos de Bigtable en Data Catalog, se necesitan permisos diferentes. Por lo general, concede a las principales de tu organización el rol mínimo necesario para llevar a cabo una tarea.
Permiso para ver etiquetas públicas y privadas
Para obtener los permisos que necesitas para ver etiquetas públicas y privadas en recursos de Bigtable, pide a tu administrador que te conceda los siguientes roles de gestión de identidades y accesos:
Estos roles predefinidos contienen los permisos necesarios para ver etiquetas públicas y privadas. Los permisos exactos que se necesitan son los siguientes:
bigtable.instances.get
bigtable.clusters.get
bigtable.tables.get
datacatalog.tagTemplates.getTag
Permiso para buscar recursos de Bigtable
Para obtener los permisos que necesitas para buscar recursos de Bigtable en Data Catalog, pide a tu administrador que te conceda los siguientes roles de gestión de identidades y accesos:
Estos roles predefinidos contienen los permisos necesarios para buscar recursos de Bigtable. Los permisos exactos que se necesitan son los siguientes:
bigtable.instances.get
bigtable.clusters.get
bigtable.tables.get
Permiso para adjuntar etiquetas a recursos de Bigtable
Para obtener los permisos que necesitas para adjuntar etiquetas a recursos de Bigtable en Data Catalog, pide a tu administrador que te conceda los siguientes roles de gestión de identidades y accesos:
Estos roles predefinidos contienen los permisos necesarios para añadir etiquetas públicas y privadas. Los permisos exactos que se necesitan son los siguientes:
bigtable.instances.update
bigtable.clusters.update
bigtable.tables.update
datacatalog.tagTemplates.use
datacatalog.entries.updateTag
(Opcional) Crear un rol personalizado
Puedes crear un rol personalizado para concederlo a los usuarios que necesiten acceso completo a todos los metadatos de Bigtable en Data Catalog de tu proyecto u organización. Después, puedes convertir en principal del rol personalizado a cualquier usuario o cuenta de servicio que necesite acceso. Para obtener más información sobre los roles personalizados, consulta Roles y permisos.
Elige un nombre significativo para el rol, como Editor de catálogo de datos de Bigtable, y, a continuación, asigna solo las principales que necesiten acceso al rol. Para ver las instrucciones de configuración, consulta el artículo Crear un rol personalizado.
Concede los siguientes permisos al rol personalizado:
bigtable.instances.get
bigtable.instances.update
bigtable.clusters.get
bigtable.clusters.update
bigtable.tables.get
bigtable.tables.update
datacatalog.tagTemplates.getTag
datacatalog.tagTemplates.use
Para obtener más información sobre los permisos de Data Catalog, consulta Roles para buscarGoogle Cloud recursos. Para ver las descripciones de los permisos de Bigtable, consulta Permisos.
Restricciones conocidas
En la siguiente sección se enumeran algunas restricciones que debe tener en cuenta antes de usar Data Catalog para gestionar los metadatos de Bigtable.
Restricciones de ubicación
Si tu organización ha configurado restricciones de ubicación, es posible que las entradas de metadatos de tus recursos de Bigtable no se sincronicen con Data Catalog. Data Catalog conserva las entradas creadas antes de aplicar las restricciones de ubicación.
Para permitir que Data Catalog cargue recursos, le recomendamos que añada la multirregión global
a su política de ubicación.
Excepción del nombre de la familia de columnas
La API de Data Catalog rechaza las solicitudes en las que el nombre de la familia de columnas incluye un punto (.
). Por ejemplo, si el nombre de la familia de columnas es personal.info
.
Siguientes pasos
- Consulta una descripción general de Data Catalog.
- Consulta otras integraciones Google Cloud con Data Catalog.