Etiquetas y plantillas de etiquetas

Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Es difícil documentar las entradas de datos a gran escala, especialmente cuando se usan en diferentes grupos de una organización con diferentes necesidades. Con frecuencia, cada grupo crea su propio conjunto de documentación y metadatos para describir los mismos datos, lo que da como resultado un esfuerzo duplicado e información incompleta. Data Catalog resuelve este problema con etiquetas, que permiten a las organizaciones crear, buscar y administrar metadatos para todas sus entradas de datos en un servicio unificado.

En este documento, se explican dos conceptos clave de Data Catalog:

  • Etiquetas. Te permite proporcionar contexto para una entrada de datos adjuntando campos de metadatos personalizados.

  • Plantillas de etiquetas. Estructuras reutilizables que puedes usar para crear etiquetas nuevas con rapidez.

Etiquetas

Las etiquetas son un tipo de metadatos empresariales. Agregar etiquetas a una entrada de datos ayuda a proporcionar un contexto significativo a cualquiera que necesite usar el recurso. Por ejemplo, una etiqueta puede indicarte información, como quién es responsable de una entrada de datos específica, si contiene información de identificación personal (PII), la política de retención de datos del elemento y un nivel de calidad de los datos.

Las etiquetas pueden ser etiquetas públicas o privadas. Cada tipo de etiqueta tiene ventajas únicas que se adaptan a los requisitos de tu empresa.

Etiquetas privadas

Las etiquetas privadas proporcionan controles de acceso estrictos. Puedes buscar o ver las etiquetas y las entradas de datos asociadas con las etiquetas solo si tienes los permisos de lectura necesarios en la plantilla de etiqueta privada y las entradas de datos.

Para buscar etiquetas privadas en la página de Data Catalog, se requiere la sintaxis de búsqueda tag: o los filtros de búsqueda.

Las etiquetas privadas son adecuadas en situaciones en las que necesitas almacenar información sensible en la etiqueta y deseas aplicar restricciones de acceso adicionales más allá de la verificación de si el usuario tiene permisos para ver la entrada etiquetada.

Etiquetas públicas

Las etiquetas públicas proporcionan un control de acceso menos estricto para buscar y ver la etiqueta en comparación con las etiquetas privadas. Cualquier usuario que tenga los permisos de vista necesarios para una entrada de datos puede ver todas las etiquetas públicas asociadas a ella. Los permisos de lectura para etiquetas públicas solo se requieren cuando realizas una búsqueda en Data Catalog con la sintaxis tag: o cuando ves una plantilla de etiqueta no adjunta.

Las etiquetas públicas admiten la búsqueda simple y la búsqueda con predicados en la página de búsqueda de Data Catalog. Cuando creas una plantilla de etiqueta, la opción de crear una plantilla de etiqueta pública es la opción recomendada y predeterminada en la consola.

Por ejemplo, supongamos que tienes una plantilla de etiqueta pública llamada employee data que usaste para crear etiquetas para tres entradas de datos llamadas Name, Location y Salary. Entre las tres entradas de datos, solo los miembros de un grupo específico llamado HR pueden ver la entrada de datos Salary. Las otras dos entradas de datos tienen permisos de lectura para todos los empleados de la empresa.

Si algún empleado que no es miembro del grupo HR usa la página de búsqueda de Data Catalog y realiza una búsqueda con la palabra employee, el resultado de la búsqueda solo mostrará las entradas de datos Name y Location con las etiquetas públicas asociadas.

Las etiquetas públicas son útiles en un amplio conjunto de situaciones, y estas etiquetas son intuitivas de usar. Las etiquetas públicas admiten la búsqueda y la búsqueda simples con predicados, mientras que las etiquetas privadas solo admiten la búsqueda con predicados.

Etiquetas de muestra adjuntas a una entrada de datos

En el siguiente diagrama, se muestra una tabla de clientes de ejemplo cust_tbl, con varias etiquetas de metadatos empresariales adjuntas a la tabla y sus columnas.

Ejemplo de tabla de clientes

Plantillas de etiquetas

Para comenzar a etiquetar datos, primero debe crear una o más plantillas de etiquetas. Una plantilla de etiqueta puede ser una plantilla de etiqueta pública o privada. Cuando creas una plantilla de etiqueta, la opción de crear una plantilla de etiqueta pública es la opción predeterminada y recomendada en la consola. Una plantilla de etiqueta es un grupo de pares clave-valor de metadatos llamados campos. Tener un conjunto de plantillas es similar a tener un esquema de base de datos para los metadatos.

Puedes estructurar las etiquetas por tema. Por ejemplo:

  • Una etiqueta de administración de datos con campos para: administración de datos, fecha de retención, fecha de eliminación, PII (sí o no), clasificación de datos (público, confidencial, sensible, reglamentario)
  • Una etiqueta de calidad de los datos con campos para los problemas de calidad, la frecuencia de actualización y la información de SLO.
  • Una etiqueta de uso de datos con campos para los usuarios principales, las principales búsquedas y los usuarios diarios promedio

Luego, puedes mezclar y combinar etiquetas a través de las etiquetas relevantes para cada recurso de datos y tus necesidades comerciales.

Campos en una etiqueta

Las etiquetas contienen uno o más campos en los que se puede almacenar información. Los campos de una etiqueta se definen mediante una plantilla de etiqueta, y cada campo se puede usar para almacenar uno o más valores. Cada etiqueta es una instancia de una plantilla de etiqueta, que se puede aplicar a una entrada de datos completa, o bien a tablas o columnas específicas. Una etiqueta en una columna podría indicar, por ejemplo, si esa columna contiene PII, si quedó obsoleta o qué fórmula se usó para calcular un valor determinado.

Cada campo contiene un ID, un nombre visible y un tipo. El tipo puede ser string, double, boolean, enum (enumeración) o datetime. Cuando el tipo es enum, la plantilla también almacena los valores permitidos para el campo.

Los campos se almacenan en la plantilla como un conjunto ordenado, en el que el orden representa la importancia relativa de un campo en relación con los otros campos.

Los campos son opcionales, a menos que estén marcados como obligatorios. Un campo obligatorio debe recibir un valor cuando se usa la plantilla, mientras que un campo opcional puede dejarse en blanco.

No puedes cambiar un campo opcional a obligatorio después de crear tu plantilla.

Campos de muestra en una etiqueta

A continuación, se muestra una plantilla de etiqueta de ejemplo de la guía de inicio rápido, que contiene varios tipos de campo:

Ejemplo de plantilla de etiquetas

A continuación, se muestra una etiqueta creada a partir de la plantilla con valores proporcionados para cada campo:

Ejemplo de etiqueta

Para ayudarte a comenzar, Data Catalog incluye una galería de plantillas de etiqueta de muestra a fin de ilustrar casos de uso de etiquetado comunes. Usa estos ejemplos a fin de aprender sobre la eficacia del etiquetado, para obtener inspiración o como punto de partida para crear tu propia infraestructura.

Para usar una biblioteca de plantillas de etiquetas, sigue estos pasos:

  1. En Console, vaya a la página Plantillas de etiquetas de Data Catalog.

    Ir a Plantillas de etiquetas

  2. Haga clic en Crear plantilla de etiqueta.

    La galería de plantillas se muestra como parte de la página Crear plantilla.

Después de seleccionar una plantilla de la galería, puedes usarla como cualquier otra plantilla de etiquetas. Puedes agregar y borrar atributos, así como cambiar cualquier elemento de la plantilla que se adapte a tus necesidades empresariales. Luego, puedes buscar los campos de plantilla y los valores con Data Catalog.

Control de acceso para etiquetas

Las etiquetas y sus metadatos pueden contener información sensible y es posible que los equipos de administración de datos deseen que ciertas etiquetas sean visibles solo para grupos específicos de usuarios. El catálogo de datos proporciona control de acceso a las plantillas de etiquetas, y esta configuración se extiende a todas las etiquetas creadas con esa plantilla.

Puede configurar plantillas de etiqueta con muchas configuraciones de control de acceso, como se muestra a continuación:

  • Una plantilla de etiqueta que solo el creador de la plantilla puede usar para crear etiquetas
  • Una plantilla de etiqueta que crea etiquetas que solo son visibles para un conjunto selecto de usuarios
  • Una plantilla de etiqueta que un conjunto selecto de usuarios puede usar para crear etiquetas que solo son visibles para otro conjunto (posiblemente idéntico) de usuarios
  • Una plantilla de etiqueta visible para todos los usuarios de una organización o proyecto (etiqueta pública)

El acceso a una plantilla de etiqueta se otorga o se rechaza con las funciones de IAM. Estos proporcionan permisos para crear, editar y usar la plantilla de etiqueta. Estas son algunas funciones de Data Catalog disponibles:

  • Para permitir que un usuario cree o actualice una plantilla de etiqueta, debes otorgarle la función de creador de plantillas de etiquetas.

  • Para permitir que un usuario aplique etiquetas a una entrada de datos, debes otorgarle la función de usuario de plantilla de etiqueta.

Consulta Administración de identidades y accesos de Data Catalog para obtener más información.

Recursos regionales

Cada plantilla de etiqueta y etiqueta se almacena en una región de GCP particular. Puedes usar una plantilla de etiqueta para crear una etiqueta en cualquier región, por lo que no es necesario que crees copias de tu plantilla si tienes entradas de datos distribuidas en varias regiones.

Próximos pasos