Introducción a la administración de datos en BigQuery

En este documento, se proporciona una introducción a la administración de datos de BigQuery y se explica cómo puedes usar las funciones de BigQuery para implementar y aplicar políticas de administración de datos de BigQuery. Para obtener una descripción general más completa de la administración de datos en Google Cloud, consulta ¿Qué es la administración de datos?

La administración de datos es la gestión de la seguridad y la calidad de los datos durante su ciclo de vida para garantizar que el acceso y la exactitud cumplan con las políticas y normas de la organización. Estas prioridades de administración de datos se pueden dividir en tres categorías:

En las siguientes secciones, se definen estas categorías de administración de datos, se analiza cómo las funciones de BigQuery las admiten y se recomiendan los próximos pasos.

Control de acceso

La administración de acceso a los datos es el proceso de definir, aplicar y supervisar las reglas y políticas que controlan quién tiene acceso a los datos. La administración de acceso garantiza que solo quienes están autorizados para acceder a los datos tengan acceso a ellos. BigQuery proporciona las siguientes funciones para ayudarte a acceder a los datos:

  • Identity and Access Management (IAM). IAM te permite controlar quién tiene acceso a tus recursos de BigQuery, como proyectos, conjuntos de datos, tablas y vistas. Puedes otorgar roles de IAM a usuarios, grupos y cuentas de servicio. Estos roles definen lo que pueden hacer con tus recursos.
  • Controles de acceso a nivel de columna y controles de acceso a nivel de fila. Los controles de acceso a nivel de columna y a nivel de fila te permiten restringir el acceso a columnas y filas específicas en una tabla según los atributos de usuario o los valores de datos. Este control te permite implementar un acceso detallado para ayudar a proteger los datos sensibles del acceso no autorizado.
  • Administración de transferencia de datos. Los Controles del servicio de VPC te permiten crear perímetros en los recursos de Google Cloud y controlar el acceso a esos recursos según las políticas de tu organización.
  • Registros de auditoría. Los registros de auditoría te proporcionan un registro detallado de la actividad del usuario y los eventos del sistema en tu organización. Estos registros te ayudan a aplicar políticas de administración de datos y a identificar posibles riesgos de seguridad.

Próximos pasos para el control de acceso

En la siguiente tabla, se describen los próximos pasos que puedes seguir para obtener más información sobre las funciones de control de acceso:

Nivel de experiencia Ruta de aprendizaje
Usuarios nuevos en la nube
Usuarios con experiencia en la nube

Administración de datos

La administración de datos ayuda a proteger los datos sensibles a través de la categorización, el enmascaramiento, el ocultamiento o la encriptación adecuados de los datos durante las consultas, el tránsito o el almacenamiento. Este enfoque mejora la organización y la protección de los datos. BigQuery proporciona las siguientes funciones para ayudarte con la administración de datos:

  • Enmascaramiento de datos. El enmascaramiento de datos te permite ocultar los datos sensibles en una tabla, a la vez que permite que los usuarios autorizados accedan a los datos que los rodean. También puede enmascarar datos que coincidan con patrones de datos sensibles, lo que brinda protección contra la divulgación accidental de datos.
  • Encriptación. BigQuery encripta todos los datos en reposo y en tránsito de forma automática, a la vez que te permite personalizar la configuración de encriptación para que cumpla con tus necesidades y requisitos específicos.
  • Administración de metadatos. La administración de metadatos te permite etiquetar recursos, lo que, a su vez, te ayuda con la búsqueda de datos, la organización y la categorización.

Próximos pasos para la administración de datos

En la siguiente tabla, se describen los próximos pasos que puedes seguir para obtener más información sobre las funciones de administración de datos:

Nivel de experiencia Ruta de aprendizaje
Usuarios nuevos en la nube
Usuarios con experiencia en la nube

Calidad de los datos

La administración de calidad de los datos es el proceso de rastrear el linaje de datos y garantizar que los datos cumplen con tus estándares para garantizar la exactitud, la integridad y la coherencia. BigQuery proporciona las siguientes funciones para ayudarte con la calidad de los datos:

  • Linaje de datos. El linaje de datos te permite hacer un seguimiento del flujo de tus datos con el tiempo, lo que proporciona estadísticas sobre el origen de los datos, cómo cambian con el tiempo y su destino final dentro del sistema.
  • Análisis de perfiles de datos. Los análisis de perfiles de datos te permiten analizar las características estadísticas de tus datos, como los valores promedio y únicos.
  • Análisis de la calidad de los datos. Los análisis de calidad de los datos te permiten realizar verificaciones de datos, validarlos en reglas definidas y solucionar problemas de calidad de los datos.

Próximos pasos para la calidad de los datos

En la siguiente tabla, se describen los próximos pasos que puedes seguir para obtener más información sobre las funciones de calidad de los datos:

Nivel de experiencia Ruta de aprendizaje
Usuarios nuevos en la nube
Usuarios con experiencia en la nube

¿Qué sigue?