En este documento, se muestra cómo usar el Dataplex Attribute Store.
El almacén de atributos de Dataplex es una infraestructura extensible que te permite especificar comportamientos relacionados con las políticas en los recursos asociados. Los administradores de Dataplex pueden usar el Almacén de atributos para definir cómo hay que tratar ciertos datos asociando datos con atributos.
El beneficio clave de aprovechar el Almacén de atributos es que puedes agregar varios atributos a un objeto, como una columna. El almacén de atributos combina los comportamientos de todos los atributos asociados con un objeto y los presenta como una sola política en el recurso subyacente.
Puedes establecer atributos en los conjuntos de datos publicados. Los conjuntos de datos publicados se refieren a los conjuntos de datos que crea Dataplex a partir de las tablas descubiertas en un activo de bucket.
Se admiten los siguientes comportamientos de políticas:
- Especificaciones del recurso: Especifica el acceso a un recurso, como una tabla.
- Especificaciones de columna: Especifica el acceso a una columna en una tabla de BigQuery.
Puedes usar el almacén de atributos para definir una jerarquía de atributos llamada taxonomía. En una taxonomía, un atributo secundario hereda especificaciones de la jerarquía de atributos superior. Especificaciones de la unidad superior que la secundaria fusiona en una list, que se propaga al recurso.
Puedes usar el Almacén de atributos de Dataplex para hacer lo siguiente:
- Crear taxonomías
- Crear atributos y organizarlos en una jerarquía
- Asocia uno o más atributos a las tablas.
- Asocia uno o más atributos a las columnas.
Terminología
En este documento, se usa la siguiente terminología:
Taxonomía de atributos
Una taxonomía de datos es una jerarquía de atributos. En una taxonomía, los atributos de los nodos superiores permiten que los atributos debajo de ellos (atributos secundarios) hereden y agreguen las especificaciones de comportamiento de los atributos superiores a los suyos.
Por ejemplo, si un atributo llamado PII
tiene una especificación de recursos group-a@company.com
y un atributo secundario de PII
llamado Social Security numbers
tiene una especificación de recursos group-b@company.com
, las especificaciones de recursos aplicadas a las políticas en las que se asocia el atributo Social Security numbers
serán group-a@company.com
y group-b@company.com
.
Cuando defines un atributo, puedes elegir si es superior o secundario. Cuando definas un atributo secundario, debes especificar su atributo superior.
Especificaciones de la columna
Las especificaciones de comportamiento para las columnas. Especifica las personas o los grupos que tienen acceso de lectura a las columnas. Si asocias un atributo que contiene una especificación de columna con la columna de una tabla, se agrega una etiqueta de política de columna de BigQuery a esa columna.
Especificaciones de los recursos
Los permisos de las personas o los grupos para acceder a los recursos (tablas) Si asocias un atributo con una especificación de recursos, Dataplex propaga los roles de IAM a los usuarios especificados para acceder a las tablas asociadas con el atributo.
Antes de comenzar
Limitaciones
Dataplex propaga las políticas de especificación de columnas como Etiquetas de política de BigQuery. BigQuery tiene una limitación de una etiqueta de política por columna. Si ya existe una etiqueta de política en una columna, Dataplex arroja un error en la administración Inicie sesión en la pestaña Administrar.
Cuotas
A continuación, se indican las cuotas y los límites que se aplican a Dataplex. Almacén de atributos:
Límite | Predeterminado |
---|---|
Cantidad máxima de taxonomías en una región | 100 |
Cantidad máxima de atributos en todas las taxonomías de una región | 10,000 |
Cantidad máxima de atributos que se pueden asociar con un recurso (tabla) | 50 |
Cantidad máxima de atributos que se pueden asociar con una columna | 100 |
Profundidad máxima por árbol de atributos de datos en una taxonomía de atributos | 4 |
Roles y permisos requeridos
A fin de obtener los permisos que necesitas para usar el almacén de atributos de Dataplex, solicita a tu administrador que te otorgue el los siguientes roles de IAM en el proyecto:
-
Administrar taxonomías y atributos:
Administrador de taxonomía de Dataplex (
roles/dataplex.taxonomyAdmin
) -
Consulta las vinculaciones asociadas a los recursos y los atributos: Visualizador de taxonomía de Dataplex (
roles/dataplex.taxonomyViewer
). -
Crea y administra recursos de vinculación en un proyecto:
-
Administrador de vinculaciones de Dataplex (
roles/dataplex.bindingAdmin
) -
Administrador de Dataplex (
roles/dataplex.admin
en el recurso de zona)
-
Administrador de vinculaciones de Dataplex (
-
Administra las especificaciones de acceso a los recursos y datos:
Administrador de seguridad de Dataplex (
roles/dataplex.securityAdmin
)
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
Estos roles predefinidos contienen los permisos necesarios para usar el almacén de atributos de Dataplex. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:
Permisos necesarios
Se requieren los siguientes permisos para usar el almacén de atributos de Dataplex:
-
Administra taxonomías y atributos:
-
dataplex.datataxonomies.*
-
dataplex.dataattributes.*
(exceptdataplex.dataattributes.configureResourceAccess
anddataplex.dataattributes.configureDataAccess
)
-
-
Consulta las vinculaciones asociadas a los recursos y atributos:
-
dataplex.datataxonomies.get
-
dataplex.datataxonomies.list
-
dataplex.dataattributes.get
-
dataplex.dataattributes.list
-
dataplex.dataattributebindings.get
-
dataplex.dataattributebindings.list
-
-
Crea y administra recursos de vinculación en un proyecto:
dataplex.dataattributebindings.*
-
Administra las especificaciones de acceso a los recursos y datos:
-
dataplex.datataxonomies.configureResourceAccess
-
dataplex.datataxonomies.configureDataAccess
-
También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.
Ejemplos de casos de uso
Piensa en una empresa llamada ACME que tiene tres tipos de datos:
Red
datos sensibles.- Datos de
Green
que están restringidos, pero menos sensibles. - Datos sin categorizar
El administrador de Dataplex de ACME crea el siguiente conjunto de atributos:
Atributo:
Red
- Especificaciones de la columna:
secrets_team@acme
con permiso de lectura - Especificaciones de recursos:
secrets_team@acme
ytenured_employees@acme
con permiso de lectura
- Especificaciones de la columna:
Atributo:
Green
- Especificaciones de la columna:
full_time_employees@acme
con permiso de lectura - Especificaciones del recurso:
full_time_employees@acme
con permiso de edición
- Especificaciones de la columna:
Los atributos Red
y Green
controlan el comportamiento de acceso a los recursos (tablas) según los atributos asociados con las tablas y sus columnas.
Considera una tabla con las siguientes columnas:
- ID
- Código postal
- Nombre
- Dirección
- $Value
Caso de uso 1: Asocia el mismo atributo con la tabla y una columna
Si asocias el atributo Red
con la tabla y su columna Name, haz lo siguiente:
Luego, Dataplex propaga las siguientes políticas:
- Los empleados de
secrets_team@acme
ytenured_employees@acme
pueden leer la una tabla, ver sus metadatos y consultarlos. - Solo los empleados de
secrets_team@acme
pueden consultar la columna Nombre, ya que está protegida adicionalmente por las especificaciones de la columna.
Caso de uso 2: Combina atributos
Considera las siguientes asociaciones:
- Asocia los atributos
Red
yGreen
a la tabla. - Asocia los atributos
Red
yGreen
con la columna Nombre. - Asocia el atributo
Red
con la columna $Value.
En este caso, Dataplex propaga las siguientes políticas:
- Los empleados de
secrets_team@acme
,tenured_employees@acme
yfull_time_employees@acme
pueden acceder a la tabla. Esto se debe a que Dataplex combina las especificaciones de recursos de los atributosRed
yGreen
. - Los empleados de
secrets_team@acme
yfull_time_employees@acme
pueden acceder a la columna Nombre. Esto se debe a que Dataplex fusiona las especificaciones de columna de los atributosRed
yGreen
. - Solo los empleados de
secrets_team@acme
pueden hacer consultas en la columna $Value.
Caso de uso 3: Cómo organizar atributos en una jerarquía
Puedes organizar los atributos en una jerarquía especificando los subtipos de atributos. Considera el siguiente conjunto de atributos:
Atributo superior 1:
Atributo: PII
- Especificaciones de la columna:
secrets_team@acme
- Especificaciones de los recursos:
secrets_team@acme
ytenured_employees@acme
Atributo secundario de PII
:
Atributo: Email
- Especificaciones de las columnas:
email_comm@acme
- Especificaciones de los recursos:
email_comm@acme
Atributo superior 2:
Atributo: Financial
- Especificaciones de las columnas:
full_time_employees@acme
- Especificaciones de los recursos:
full_time_employees@acme
Considera las siguientes asociaciones:
- Asocia los atributos
Email
yFinancial
con la tabla. - Asocia los atributos
Email
yFinancial
con la columna Nombre. - Asocia el atributo
PII
con la columna $Value.
En este caso, Dataplex propaga las siguientes políticas:
- Los empleados de
secrets_team@acme
,tenured_employees@acme
,full_time_employees@acme
yemail_comm@acme
pueden acceder a la tabla. Esta es porque Dataplex fusiona las especificaciones de recursos de los atributosFinancial
yEmail
, y el atributoEmail
hereda el especificaciones del atributoPII
. - Los empleados de
secrets_team@acme
,email_comm@acme
yfull_time_employees@acme
pueden acceder a la columna Nombre. Esto se debe a que Dataplex combina las especificaciones de columna del los atributosFinancial
yEmail
. - Solo los empleados de
secrets_team@acme
pueden hacer consultas en la columna $Value.
Configura los atributos
Para crear un atributo, primero debes crear una taxonomía y, luego, crear la atributos de datos superiores y secundarios.
Crea una taxonomía de atributos de datos
En la consola de Google Cloud, ve a la página Almacén de atributos de Dataplex.
Haz clic en Crear taxonomía.
Ingresa el Nombre de la taxonomía, el ID y la Descripción.
Selecciona una región.
Haz clic en Enviar.
La taxonomía nueva aparece en la página Taxonomías de datos.
Crea un atributo superior
En la consola de Google Cloud, ve a la página Almacén de atributos de Dataplex.
En la página Taxonomías de datos, haz clic en la taxonomía en la que deseas crea el atributo superior.
En la página Detalles de taxonomía, haz clic en Agregar atributo de datos.
Selecciona Crear atributo de datos superior.
Ingresa un nombre, un ID y una descripción para el atributo superior.
Opcional: Configura las especificaciones de los atributos.
Configura las especificaciones de los recursos:
- Haz clic en Administrar permisos en Recurso.
- Haz clic en Agregar.
- En el campo Principales nuevas, ingresa la dirección de correo electrónico de una persona o un grupo que necesite acceso al recurso.
- Selecciona los roles necesarios y haz clic en Guardar.
- Haz clic en Guardar.
Configura las especificaciones de columna:
- Haz clic en Administrar permisos para la Columna.
- Haz clic en Agregar.
- En el campo Principales nuevas, ingresa la dirección de correo electrónico de una persona. o un grupo que necesita acceso a la columna.
- Selecciona los Roles necesarios y haz clic en Guardar.
- Haz clic en Guardar.
Haz clic en Crear.
Crea un atributo secundario
En la consola de Google Cloud, ve a la página Attribute Store de Dataplex.
En la página Taxonomías de datos, haz clic en la taxonomía en la que deseas crea el atributo secundario.
En la página Detalles de la taxonomía, haz clic en Agregar atributo de datos.
Selecciona Crear atributo de datos secundario.
Selecciona un Atributo de datos superior para el atributo secundario que crearás.
Ingresa un nombre, un ID y una descripción para el atributo secundario.
Opcional: Configura las especificaciones de los atributos.
Configura las especificaciones de los recursos:
- Haz clic en Administrar permisos en Recurso.
- Haz clic en Agregar.
- En el campo Principales nuevas, ingresa la dirección de correo electrónico de una persona o un grupo que necesite acceso al recurso.
- Selecciona los roles necesarios y haz clic en Guardar.
- Haz clic en Guardar.
Configura las especificaciones de columna:
- Haz clic en Administrar permisos para la Columna.
- Haz clic en Agregar.
- En el campo Principales nuevas, ingresa la dirección de correo electrónico de una persona. o un grupo que necesita acceso a la columna.
- Selecciona los Roles necesarios y haz clic en Guardar.
- Haz clic en Guardar.
Haz clic en Crear.
Actualiza los recursos del almacén de atributos
Actualiza los detalles de la taxonomía
En la consola de Google Cloud, ve a la página Attribute Store de Dataplex.
Haz clic en la taxonomía que deseas actualizar.
Haz clic en Edit.
Edita el nombre de la taxonomía y su descripción según sea necesario.
Haz clic en Enviar.
Actualiza los detalles del atributo
En la consola de Google Cloud, ve a la página Attribute Store de Dataplex.
Haz clic en la taxonomía que contiene el atributo que deseas actualizar.
Haz clic en el atributo que deseas actualizar.
Para actualizar el nombre del atributo y la descripción, haz clic en Editar.
- Si actualizas un atributo superior, tienes la opción de hacerlo. a un atributo secundario y viceversa. Selecciona las opciones según corresponda.
- Edita el nombre del atributo y su descripción según sea necesario.
- Haz clic en Actualizar.
Para actualizar las especificaciones de recursos del atributo, haz clic en
para Especificaciones de recursosPara agregar un nuevo principal, sigue estos pasos:
- Haz clic en Agregar.
- En el campo Principales nuevas, ingresa la dirección de correo electrónico de una persona o un grupo que necesita acceso al recurso.
- Selecciona los roles necesarios.
- Haz clic en Guardar.
Para actualizar un director existente, sigue estos pasos:
- Haz clic en para la principal que quieres actualizar.
- Selecciona los Roles necesarios.
- Haz clic en Guardar.
Para quitar un principal existente, sigue estos pasos:
- Selecciona la principal que deseas quitar.
- Haz clic en Quitar.
Para actualizar las especificaciones de columna del atributo, haz clic en
para Especificaciones de columnaPara agregar un nuevo principal, sigue estos pasos:
- Haz clic en Agregar.
- En el campo Principales nuevas, ingresa la dirección de correo electrónico de una persona o un grupo que necesite acceso a la columna.
- Selecciona los roles necesarios.
- Haz clic en Guardar.
Para actualizar un director existente, sigue estos pasos:
- Haz clic en para la principal que quieres actualizar.
- Selecciona los Roles necesarios.
- Haz clic en Guardar.
Para quitar un principal existente, sigue estos pasos:
- Selecciona la principal que deseas quitar.
- Haz clic en Quitar.
Asocia atributos con recursos
Cómo asociar un atributo a una tabla
En la consola de Google Cloud, ve a la página Almacén de atributos de Dataplex.
Haz clic en la taxonomía que contiene el atributo.
Haz clic en el atributo con el que deseas asociar una tabla.
Haz clic en la pestaña Recursos.
Haz clic en Agregar recursos.
Selecciona una tabla de la lista.
Haz clic en Seleccionar.
Asocia un atributo con una columna
En la consola de Google Cloud, ve a la página Almacén de atributos de Dataplex.
Busca y selecciona la tabla para la que deseas asociar un atributo a una columna.
Haz clic en la pestaña Esquema y etiquetas de columnas.
Haz clic en
en Etiquetas de política para con la que deseas asociar un atributo.Selecciona la taxonomía que contiene el atributo.
Selecciona el atributo.
Haz clic en Adjuntar.
¿Qué sigue?
- Obtén más información sobre la seguridad de Dataplex.
- Obtén más información sobre la administración de políticas en Dataplex.
- Obtén más información sobre las funciones de IAM de Dataplex.