Usar Protección de Datos Sensibles para analizar datos de BigQuery
Saber dónde se encuentran tus datos sensibles suele ser el primer paso para asegurarte de que están protegidos y gestionados correctamente. Este conocimiento puede ayudar a reducir el riesgo de exponer información sensible, como números de tarjetas de crédito, información médica, números de la Seguridad Social, números de carnés de conducir, direcciones, nombres completos y secretos específicos de la empresa. Analizar periódicamente tus datos también puede ayudarte a cumplir los requisitos y a asegurarte de que se siguen las prácticas recomendadas a medida que tus datos crecen y cambian con el uso. Para cumplir los requisitos, usa Protección de Datos Sensibles para inspeccionar tus tablas de BigQuery y proteger tus datos sensibles.
Hay dos formas de analizar tus datos de BigQuery:
Elaboración de perfiles de datos sensibles. Protección de Datos Sensibles puede generar perfiles sobre datos de BigQuery de una organización, una carpeta o un proyecto. Los perfiles de datos contienen métricas y metadatos sobre tus tablas y te ayudan a determinar dónde se encuentran los datos sensibles y de alto riesgo. Protección de Datos Sensibles registra estas métricas a nivel de proyecto, tabla y columna. Para obtener más información, consulta el artículo sobre los perfiles de datos de BigQuery.
Inspección bajo demanda. Protección de Datos Sensibles puede realizar una inspección exhaustiva de una sola tabla o de un subconjunto de columnas, y generar informes con los resultados hasta el nivel de celda. Este tipo de inspección puede ayudarte a identificar instancias concretas de tipos de datos específicos, como la ubicación exacta de un número de tarjeta de crédito en una celda de una tabla. Puedes hacer una inspección bajo demanda en la página Protección de Datos Sensibles de laGoogle Cloud consola, en la página BigQuery de la Google Cloud consola o mediante programación con la API DLP.
En esta página se describe cómo hacer una inspección bajo demanda a través de la página BigQuery de la consola de Google Cloud .
Sensitive Data Protection es un servicio totalmente gestionado que permite a los Google Cloud clientes identificar y proteger datos sensibles a gran escala. Protección de Datos Sensibles usa más de 150 detectores predefinidos para identificar patrones, formatos y sumas de comprobación. Protección de Datos Sensibles también proporciona un conjunto de herramientas para desidentificar tus datos, como el enmascaramiento, la tokenización, la seudonimización, el cambio de fecha y más, todo ello sin replicar los datos de los clientes.
Para obtener más información sobre la protección de datos sensibles, consulta la documentación de Protección de Datos Sensibles.
Antes de empezar
- Familiarízate con los precios de Protección de Datos Sensibles y cómo controlar los costes de Protección de Datos Sensibles.
Asegúrate de que el usuario que cree tus tareas de Protección de Datos Sensibles tenga asignado un rol de gestión de identidades y accesos predefinido de Protección de Datos Sensibles adecuado o permisos suficientes para ejecutar tareas de Protección de Datos Sensibles.
Analizar datos de BigQuery con la Google Cloud consola
Para analizar datos de BigQuery, crea una tarea de Protección de Datos Sensibles que analice una tabla. Puede analizar una tabla de BigQuery rápidamente con la opción Analizar con Protección de Datos Sensibles de la consola de BigQuery Google Cloud .
Para analizar una tabla de BigQuery con Protección de Datos Sensibles, sigue estos pasos:
En la Google Cloud consola, ve a la página BigQuery.
En el panel Explorador, expande tu proyecto y tu conjunto de datos, y selecciona la tabla.
Haz clic en Exportar > Analizar con Protección de Datos Sensibles. La página de creación de trabajos de protección de datos sensibles se abre en una pestaña nueva.
En Paso 1: Elige los datos de entrada, introduce un ID de trabajo. Los valores de la sección Ubicación se generan automáticamente. Además, la sección Muestreo se configura automáticamente para realizar un análisis de muestra de tus datos, pero puedes ajustar la configuración según sea necesario.
Haz clic en Continuar.
Opcional: En el paso 2: Configurar la detección, puede configurar los tipos de datos que quiere buscar, denominados
infoTypes
.Elige una de estas opciones:
- Para seleccionar uno de los
infoTypes
predefinidos, haz clic en Gestionar infoTipos. A continuación, selecciona los infoTypes que quieras buscar. - Para usar una plantilla de inspección, en el campo Nombre de la plantilla, introduce el nombre completo del recurso de la plantilla.
Para obtener más información sobre
infoTypes
, consulta InfoTypes y detectores de infoType en la documentación de Protección de Datos Sensibles.- Para seleccionar uno de los
Haz clic en Continuar.
Opcional: En el paso 3: Añadir acciones, activa Guardar en BigQuery para publicar los resultados de Protección de Datos Sensibles en una tabla de BigQuery. Si no almacenas los resultados, la tarea completada solo incluirá estadísticas sobre el número de resultados y sus
infoTypes
. Si guardas las detecciones en BigQuery, se guardarán los detalles sobre la ubicación precisa y la confianza de cada detección.Opcional: Si has activado la opción Guardar en BigQuery, en la sección Guardar en BigQuery, introduce la siguiente información:
- ID de proyecto: el ID del proyecto en el que se almacenan los resultados.
- ID del conjunto de datos: el nombre del conjunto de datos que almacena los resultados.
- Opcional: ID de tabla: nombre de la tabla que almacena los resultados. Si no se especifica ningún ID de tabla, se asigna un nombre predeterminado a la nueva tabla, similar al siguiente:
dlp_googleapis_date_1234567890
. Si especificas una tabla que ya existe, los resultados se añadirán a ella.
Para incluir el contenido detectado, activa Incluir cita.
Haz clic en Continuar.
Opcional: En el paso 4: Programación, configura un periodo o una programación. Para ello, selecciona Especificar periodo o Crear un activador para ejecutar la tarea de forma periódica.
Haz clic en Continuar.
Opcional: En la página Revisar, consulta los detalles del trabajo. Si es necesario, ajusta la configuración anterior.
Haz clic en Crear.
Una vez que se haya completado el trabajo de Protección de Datos Sensibles, se te redirigirá a la página de detalles del trabajo y recibirás una notificación por correo electrónico. Puede ver los resultados del análisis en la página de detalles del trabajo o hacer clic en el enlace a la página de detalles del trabajo de Protección de Datos Sensibles que aparece en el correo de finalización del trabajo.
Si has elegido publicar los resultados de Protección de Datos Sensibles en BigQuery, en la página Detalles del trabajo, haz clic en Ver resultados en BigQuery para abrir la tabla en la consola de Google Cloud . Después, puedes consultar la tabla y analizar los resultados. Para obtener más información sobre cómo consultar los resultados en BigQuery, consulta el artículo Consultar resultados de Protección de Datos Sensibles en BigQuery de la documentación de Protección de Datos Sensibles.
Siguientes pasos
Lee la entrada del blog de identidad y seguridad Toma el control de tus datos: usa Protección de Datos Sensibles para desidentificar y ofuscar información sensible.
Si quieres ocultar o desidentificar los datos sensibles que ha encontrado el análisis de Protección de Datos Sensibles, consulta lo siguiente:
- Inspeccionar texto para desidentificar información sensible
- Desidentificar datos sensibles en la documentación de Protección de Datos Sensibles
- Conceptos de cifrado AEAD en GoogleSQL para obtener información sobre cómo cifrar valores individuales de una tabla
- Proteger datos con claves de Cloud KMS para obtener información sobre cómo crear y gestionar tus propias claves de cifrado en Cloud KMS para cifrar tablas de BigQuery