Se usó la API de Cloud Translation para traducir esta página.
Switch to English

Etiquetas y plantillas de etiquetas

Documentar elementos de datos a gran escala es difícil, en especial cuando usan grupos diferentes de una organización que tiene necesidades diversas. A menudo, cada grupo creará su propio conjunto de documentación y metadatos para describir los mismos datos, lo que da como resultado un esfuerzo duplicado y la información incompleta. Data Catalog resuelve este problema con etiquetas, que permiten a las organizaciones crear, buscar y administrar metadatos para todos sus recursos de datos en un servicio unificado.

En esta página, se explican dos conceptos clave de Data Catalog: las etiquetas, que te permiten proporcionar contexto para un recurso de datos, para lo cual se adjuntan campos de metadatos personalizados, y plantillas de etiquetas, estructuras reutilizables que se pueden usar para crear rápidamente etiquetas nuevas.

Etiquetas

Nota: Las etiquetas a veces se denominan “metadatos comerciales”. Agregar etiquetas a un elemento de datos ayuda a proporcionar un contexto significativo a cualquier persona que necesite usarlo. Por ejemplo, una etiqueta podría indicarte quién es responsable de un elemento de datos en particular, ya sea que contenga información de identificación personal (PII), la política de retención de datos del elemento, una puntuación de calidad de los datos, etcétera.

Las etiquetas contienen uno o más campos en los que se puede almacenar información. Los campos de una etiqueta se definen mediante una plantilla de etiqueta y cada campo se puede usar para almacenar uno o más valores. Cada etiqueta es una instancia de una plantilla de etiqueta que se puede aplicar a un recurso de datos completo o a tablas o columnas particulares. Una etiqueta en una columna podría indicar, por ejemplo, si esa columna contiene PII, si quedó obsoleta o qué fórmula se usó para calcular un valor determinado.

En el siguiente diagrama, se muestra una tabla de clientes de ejemplo cust_tbl, con varias etiquetas de metadatos empresariales adjuntas a la tabla y sus columnas.

Ejemplo de tabla de clientes

Plantillas de etiquetas

Para comenzar a etiquetar datos, primero debes crear una o más plantillas de etiquetas. Una plantilla de etiqueta es un grupo de pares clave-valor de metadatos llamados campos. Tener un conjunto de plantillas es similar a tener un esquema de base de datos para los metadatos.

Esto te permite estructurar las etiquetas por tema. Por ejemplo:

  • Una etiqueta de administración de datos con campos para: administración de datos, fecha de retención, fecha de eliminación, PII (sí o no), clasificación de datos (público, confidencial, sensible, reglamentario)
  • Una etiqueta de calidad de los datos con campos para los problemas de calidad, la frecuencia de actualización y la información de SLO.
  • Una etiqueta de uso de datos con campos para los usuarios principales, las principales búsquedas y los usuarios diarios promedio

Luego, puedes mezclar y combinar etiquetas a través de las etiquetas relevantes para cada recurso de datos y tus necesidades comerciales.

Para obtener información sobre cómo crear plantillas de etiquetas, consulta la guía de inicio rápido Etiqueta tablas.

Tipos de campo

Cada campo contiene un ID, un nombre visible y un tipo. El tipo puede ser string, double, boolean, enum (enumeración) o datetime. Cuando el tipo es enum, la plantilla también almacena los valores permitidos para el campo.

Esta es una plantilla de etiqueta de ejemplo de la guía de inicio rápido, que contiene varios tipos de campo:

Ejemplo de plantilla de etiquetas

Aquí se muestra una etiqueta creada a partir de la plantilla con valores para cada campo:

Ejemplo de etiqueta

Los campos se almacenan en la plantilla como un conjunto ordenado, en el que el orden representa la importancia relativa de un campo en relación con los otros campos.

Los campos son opcionales, a menos que estén marcados como obligatorios. Un campo obligatorio debe recibir un valor cuando se usa la plantilla, mientras que un campo opcional puede dejarse en blanco.

Para ayudarte a comenzar, Data Catalog incluye una galería de plantillas de etiquetas de muestra para ilustrar los casos de uso comunes del etiquetado. Recurre a estos ejemplos para descubrir lo que puedes hacer con el etiquetado, obtener inspiración o utilizarlos como punto de partida para crear tu propia infraestructura de etiquetado.

Para encontrar la galería de plantillas de etiquetas, haz clic en CREAR y, luego, selecciona Crear plantilla de etiqueta. La galería de plantillas se muestra en la parte superior de la página Crear plantilla.

Una vez que selecciones una plantilla de la galería, podrás usarla como cualquier otra plantilla de etiquetas. Puedes agregar y borrar atributos, y cambiar cualquier elemento de la plantilla para satisfacer las necesidades de tu empresa. Luego, puedes buscar los campos y valores de la plantilla con Data Catalog.

Control de acceso

Las etiquetas y sus metadatos pueden contener información sensible y es posible que los equipos de administración de datos deseen que ciertas etiquetas sean visibles solo para grupos específicos de usuarios. Data Catalog proporciona control de acceso sobre las plantillas, y esta configuración se extiende a todas las etiquetas creadas con esa plantilla.

Puedes configurar plantillas con muchas opciones de configuración de control de acceso; por ejemplo, las siguientes:

  • Una plantilla que solo puede usar el creador de plantillas para crear etiquetas
  • Una plantilla que crea etiquetas que solo son visibles para un grupo determinado de usuarios
  • Una plantilla que un conjunto determinado de usuarios puede utilizar a fin de crear etiquetas que solo son visibles para otro conjunto (posiblemente idéntico) de usuarios

El acceso a una plantilla de etiqueta se otorga o se rechaza con las funciones de IAM. Estos proporcionan permisos para crear, editar y usar la plantilla. Por ejemplo, la función tagTemplateUser otorga permiso para usar una plantilla de etiqueta a fin de etiquetar recursos.

Consulta Administración de identidades y accesos de Data Catalog para obtener más información.

Usa plantillas de etiquetas en varios proyectos

Todo en Google Cloud reside en un proyecto, incluidas tus plantillas de etiquetas. Sin embargo, puedes usar las plantillas de etiquetas de un proyecto para crear etiquetas en otro, siempre que autorices al otro proyecto a usar las plantillas. Hay funciones de IAM predefinidas para ayudar a implementar esto, como las funciones TagTemplate Owner, Creator, User y Viewer.

Por ejemplo: si el proyecto A otorga la función TagTemplate User a una cuenta de servicio que pertenece al proyecto B, esto permite que el proyecto B cree etiquetas con sus plantillas. El proyecto A también puede autorizar la misma cuenta de servicio para modificar las etiquetas creadas con la función Tag Editor.

Si en el proyecto A no se autoriza el proyecto B, el proyecto B no puede etiquetar sus propios recursos de datos mediante las plantillas de etiquetas del proyecto A, debe crear sus propias plantillas.

Prácticas recomendadas: Recomendamos que las plantillas se creen en un proyecto central si son relevantes para más de un proyecto. Además, tu equipo de administración de datos debe ser el propietario de las plantillas de etiquetas compartidas y mantenerlas en nombre de la organización.

Recursos regionales

Cada plantilla de etiqueta y etiqueta se almacena en una región de GCP particular. Puedes usar una plantilla de etiqueta para crear una etiqueta en cualquier región, por lo que no necesitas crear copias de tu plantilla si tienes recursos de datos distribuidos en varias regiones.