Etiquetas y plantillas de etiquetas

Documentar elementos de datos a gran escala es difícil, en especial cuando usan grupos diferentes de una organización que tiene necesidades diversas. A menudo, cada grupo creará su propio conjunto de documentación y metadatos para describir los mismos datos, lo que da como resultado un esfuerzo duplicado y la información incompleta. Data Catalog resuelve este problema con etiquetas, que permiten a las organizaciones crear, buscar y administrar metadatos para todos sus recursos de datos en un servicio unificado.

En esta página, se explican dos conceptos clave de Data Catalog: las etiquetas, que te permiten proporcionar contexto para un recurso de datos, para lo cual se adjuntan campos de metadatos personalizados, y plantillas de etiquetas, estructuras reutilizables que se pueden usar para crear rápidamente etiquetas nuevas.

Etiquetas

Nota: Las etiquetas a veces se denominan “metadatos comerciales”. Agregar etiquetas a un elemento de datos ayuda a proporcionar un contexto significativo a cualquier persona que necesite usarlo. Por ejemplo, una etiqueta podría indicarte quién es responsable de un elemento de datos en particular, ya sea que contenga información de identificación personal (PII), la política de retención de datos del elemento, una puntuación de calidad de los datos, etcétera.

Las etiquetas contienen uno o más campos en los que se puede almacenar información. Los campos de una etiqueta se definen mediante una plantilla de etiqueta y cada campo se puede usar para almacenar uno o más valores. Cada etiqueta es una instancia de una plantilla de etiqueta que se puede aplicar a un recurso de datos completo o a tablas o columnas particulares. Una etiqueta en una columna podría indicar, por ejemplo, si esa columna contiene PII, si quedó obsoleta o qué fórmula se usó para calcular un valor determinado.

En el siguiente diagrama, se muestra una tabla de clientes de ejemplo cust_tbl, con varias etiquetas de metadatos empresariales adjuntas a la tabla y sus columnas.

Ejemplo de tabla de clientes

Plantillas de etiquetas

Para comenzar a etiquetar datos, primero debes crear una o más plantillas de etiquetas. Una plantilla de etiqueta es un grupo de pares clave-valor de metadatos llamados campos. Tener un conjunto de plantillas es similar a tener un esquema de base de datos para los metadatos.

Esto te permite estructurar las etiquetas por tema. Por ejemplo:

  • Una etiqueta de administración de datos con campos para: administración de datos, fecha de retención, fecha de eliminación, PII (sí o no), clasificación de datos (público, confidencial, sensible, reglamentario)
  • Una etiqueta de calidad de los datos con campos para los problemas de calidad, la frecuencia de actualización y la información de SLO.
  • Una etiqueta de uso de datos con campos para los usuarios principales, las principales búsquedas y los usuarios diarios promedio

Luego, puedes mezclar y combinar etiquetas a través de las etiquetas relevantes para cada recurso de datos y tus necesidades comerciales.

Para obtener información sobre cómo crear plantillas de etiquetas, consulta la guía de inicio rápido Etiqueta tablas.

Tipos de campo

Cada campo contiene un ID, un nombre visible y un tipo. El tipo puede ser string, double, boolean, enum (enumeración) o datetime. Cuando el tipo es enum, la plantilla también almacena los valores permitidos para el campo.

Esta es una plantilla de etiqueta de ejemplo de la guía de inicio rápido, que contiene varios tipos de campo:

Ejemplo de plantilla de etiquetas

Aquí se muestra una etiqueta creada a partir de la plantilla con valores para cada campo:

Ejemplo de etiqueta

Los campos se almacenan en la plantilla como un conjunto ordenado, en el que el orden representa la importancia relativa de un campo en relación con los otros campos.

Los campos son opcionales, a menos que estén marcados como obligatorios. Un campo obligatorio debe recibir un valor cuando se usa la plantilla, mientras que un campo opcional puede dejarse en blanco.

Para ayudarte a comenzar, Data Catalog incluye una galería de plantillas de etiquetas de muestra para ilustrar los casos de uso comunes del etiquetado. Recurre a estos ejemplos para descubrir lo que puedes hacer con el etiquetado, obtener inspiración o utilizarlos como punto de partida para crear tu propia infraestructura de etiquetado.

Para encontrar la galería de plantillas de etiquetas, haz clic en CREAR y selecciona Crear plantilla de etiqueta. La galería de plantillas se muestra en la parte superior de la página Crear plantilla.

Una vez que seleccionaste una plantilla de la galería, puedes usarla como cualquier otra plantilla de etiqueta. Puedes agregar y borrar atributos, y cambiar todo en la plantilla para satisfacer tus necesidades empresariales. Luego, puedes buscar los valores y campos de la plantilla mediante Data Catalog.

Control de acceso

Las etiquetas y sus metadatos pueden contener información sensible y es posible que los equipos de administración de datos deseen que ciertas etiquetas sean visibles solo para grupos específicos de usuarios. Data Catalog proporciona control de acceso sobre las plantillas, y esta configuración se extiende a todas las etiquetas creadas con esa plantilla.

Puedes configurar plantillas con muchas opciones de configuración de control de acceso; por ejemplo, las siguientes:

  • Una plantilla que solo puede usar el creador de plantillas para crear etiquetas
  • Una plantilla que crea etiquetas que solo son visibles para un grupo determinado de usuarios
  • Una plantilla que un conjunto determinado de usuarios puede utilizar a fin de crear etiquetas que solo son visibles para otro conjunto (posiblemente idéntico) de usuarios

El acceso a una plantilla de etiqueta se otorga o se rechaza con las funciones de IAM. Estos proporcionan permisos para crear, editar y usar la plantilla. Por ejemplo, la función tagTemplateUser otorga permiso para usar una plantilla de etiqueta a fin de etiquetar recursos.

Consulta Administración de identidades y accesos de Data Catalog para obtener más información.

Recursos regionales

Cada plantilla de etiqueta y etiqueta se almacena en una región de GCP particular. Puedes usar una plantilla de etiqueta para crear una etiqueta en cualquier región, por lo que no necesitas crear copias de tu plantilla si tienes recursos de datos distribuidos en varias regiones.