Usa Cloud DLP para analizar datos de BigQuery

Saber dónde están tus datos sensibles es, a menudo, el primer paso para garantizar que se protejan y administren correctamente. Conocer esta información puede ayudar a reducir el riesgo de exponer datos sensibles, como números de tarjetas de crédito, información médica, números de identificación personal, números de licencia de conducir, direcciones, nombres completos y secretos específicos de una empresa. El análisis periódico de tus datos también puede ayudar con los requisitos de cumplimiento y garantizar que se sigan las recomendaciones a medida que los datos aumentan y cambian con el uso. A fin de cumplir con los requisitos de cumplimiento, utiliza Cloud Data Loss Prevention (Cloud DLP) para analizar tus tablas de BigQuery y proteger tus datos sensibles.

Cloud DLP es un servicio completamente administrado, que permite a los clientes de Google Cloud Platform identificar y proteger datos sensibles a gran escala. Cloud DLP usa más de 100 detectores predefinidos para identificar patrones, formatos y sumas de verificación. Cloud DLP también proporciona un conjunto de herramientas para desidentificar los datos, entre las que se incluyen enmascaramiento, asignación de token, seudonimización, cambio de fecha y más, todo sin replicar los datos del cliente.

Para obtener más información sobre Cloud DLP, consulta la documentación de Cloud DLP.

Antes de comenzar

  1. Familiarízate con los precios de Cloud DLP y con cómo controlar los costos de Cloud DLP.
  2. Habilita la API de Cloud DLP.

    Habilitar la API

  3. Asegúrate de que el usuario que crea tus trabajos de Cloud DLP cuente con una función de IAM predefinida de Cloud DLP apropiada o con permisos suficientes para ejecutar trabajos de Cloud DLP.

Analiza datos de BigQuery con GCP Console

Para analizar datos de BigQuery, crea un trabajo de Cloud DLP que analice una tabla. Puedes analizar una tabla de BigQuery rápidamente con la opción Analizar con DLP en GCP Console de BigQuery.

Para analizar una tabla de BigQuery con Cloud DLP, sigue estos pasos:

  1. Abre la IU web de BigQuery en GCP Console.
    Ir a la IU web de BigQuery

  2. En la sección Recursos, expande tu proyecto y conjunto de datos y selecciona la tabla de BigQuery que quieres analizar.

  3. Haz clic en Exportar > Analizar con DLP (Beta). Se abrirá la página de creación de trabajos de Cloud DLP en una nueva pestaña.

  4. Para el Paso 1: Seleccionar datos de entrada, los valores de las secciones Nombre y Ubicación se generan de forma automática. Además, la sección Muestreo se configura automáticamente para ejecutar un análisis de muestra con tus datos. Si deseas ajustar la cantidad de filas de la muestra, elige Porcentaje de filas en el campo Limitar filas por. También puedes cambiar la cantidad de filas de la muestra si ajustas el valor del campo Cantidad máxima de filas.

  5. Haz clic en Continuar.

  6. De manera opcional, en el Paso 2: Configurar detección, puedes configurar los infoTypes, que son los tipos de datos que se deben buscar. Puedes elegir de la lista de infoTypes predefinidos o seleccionar una plantilla si la hay. Para obtener más información sobre los infoTypes, consulta Infotipos y detectores de Infotipos en la documentación de Cloud DLP.

  7. Haz clic en Continuar.

  8. En el Paso 3: Agregar acciones, puedes habilitar Guardar en BigQuery para que los resultados de Cloud DLP se publiquen en una tabla de BigQuery (opcional). Si no almacenas los resultados, el trabajo completado solo contendrá estadísticas sobre la cantidad de elementos detectados y sus infoTypes. Cuando guardas los resultados en BigQuery, se conserva un registro de los detalles de la ubicación exacta y la confianza de cada resultado individual.

  9. Si habilitaste Guardar en BigQuery, tendrás las siguientes opciones en la sección del mismo nombre (opcional):

    • En ID del proyecto, ingresa el ID del proyecto en el que se almacenarán tus resultados.
    • En ID del conjunto de datos, ingresa el nombre del conjunto de datos en el que se almacenarán tus resultados.
    • Si lo deseas, ingresa en ID de la tabla el nombre de la tabla en la que se almacenarán tus resultados (opcional). Si no especificas un ID de tabla, se asignará un nombre predeterminado a una tabla nueva, similar al siguiente: dlp_googleapis_[DATE]_1234567890. Si especificas una tabla existente, los resultados se agregan a ella.
  10. Haz clic en Continuar.

  11. En el Paso 4: Programa, puedes configurar un período o programa. Para ello, selecciona Especificar un intervalo de tiempo o Crear un activador para ejecutar un trabajo de forma periódica (opcional).

  12. Haz clic en Continuar.

  13. En la página Revisar, puedes examinar los detalles de tu trabajo (opcional).

  14. Haz clic en Crear.

  15. Una vez finalizado el trabajo de Cloud DLP, se te redireccionará a la página de detalles del trabajo y recibirás una notificación por correo electrónico. Puedes ver los resultados del análisis en la página de detalles del trabajo o hacer clic en el vínculo a la página de detalles del trabajo de Cloud DLP en el correo electrónico de finalización del trabajo.

  16. Si elegiste que los resultados de Cloud DLP se publiquen en BigQuery, en la página Detalles del trabajo, haz clic en Ver resultados en BigQuery para abrir la tabla en la IU web de BigQuery. Luego, puedes consultar la tabla y analizar los resultados. Para obtener más información sobre cómo consultar los resultados en BigQuery, ve Cómo consultar resultados de Cloud DLP en BigQuery en la documentación de Cloud DLP.

Próximos pasos

Si deseas obtener más información sobre cómo inspeccionar BigQuery y otros repositorios de almacenamiento para datos sensibles con Cloud DLP, consulta los siguientes temas en la documentación de Cloud DLP:

Si deseas ocultar o desidentificar de alguna otra forma los datos sensibles que encontró el análisis de Cloud DLP, consulta los siguientes recursos:

Recursos adicionales

¿Te ha resultado útil esta página? Enviar comentarios:

Enviar comentarios sobre...

Si necesitas ayuda, visita nuestra página de asistencia.