En esta guía, se explica cómo usar Sensitive Data Protection con Cloud Data Fusion.
Cloud Data Fusion proporciona un complemento de Sensitive Data Protection que ofrece tres transformaciones que pueden filtrar, ocultar o desencriptar tus datos sensibles:
La transformación del filtro de PII te permite filtrar registros sensibles de una transmisión de datos de entrada.
La transformación de ocultamiento te permite transformar datos sensibles, como enmascarar los datos o encriptarlos.
La transformación de desencriptación te permite desencriptar datos sensibles que se encriptaron previamente con la transformación Ocultar.
Costos
En este documento, usarás los siguientes componentes facturables de Google Cloud:
Para generar una estimación de costos en función del uso previsto, usa la calculadora de precios.
Antes de comenzar
En la consola de Google Cloud, ve a la página del selector de proyectos y selecciona o crea un proyecto.
Habilita la API de Cloud Data Fusion para el proyecto.
Habilita la API de DLP (parte de la Protección de datos sensibles) para tu proyecto.
Otorga permisos de Sensitive Data Protection
En la consola de Google Cloud, ve a la página IAM.
En la tabla de permisos, selecciona una de las siguientes cuentas de servicio en la columna Principal:
Para obtener permiso para los recursos en el entorno de ejecución, selecciona la cuenta de servicio que usa tu clúster de Dataproc. La configuración predeterminada es Compute Engine, cuenta de servicio, lo cual no se recomienda por motivos de seguridad
Para obtener permiso a los recursos cuando usas Wrangler o Preview en Cloud Data Fusion (no en el tiempo de ejecución), selecciona la cuenta de servicio que coincida con el formato:
service-project-number@gcp-sa-datafusion.iam.gserviceaccount.com
.
Haz clic en el ícono de lápiz a la derecha de la cuenta de servicio.
Haz clic en Agregar otra función.
Haz clic en el menú desplegable que aparece.
Usa la barra de búsqueda para buscar y, luego, selecciona Administrador de DLP.
Haga clic en Save. Verifica que el Administrador de DLP aparezca en la columna Función.
Implementa el complemento de protección de datos sensibles
Ve a tu instancia:
En la consola de Google Cloud, ve a la página de Cloud Data Fusion.
Para abrir la instancia en Cloud Data Fusion Studio, haz clic en Instancias y, luego, en Ver instancia.
En la IU web de Cloud Data Fusion, haz clic en Centro en la parte superior derecha.
Haz clic en el complemento Prevención de pérdida de datos.
Haz clic en Implementar.
Haz clic en Finalizar.
Haga clic en Crear una canalización.
Usa la transformación del filtro de PII
Esta transformación separa los registros sensibles de los registros no sensibles. Registro A se considera confidencial si coincide con los criterios que defines en un Plantilla de protección de datos sensibles. Por ejemplo, cuando creas tu plantilla, puedes definir datos sensibles como información de tarjetas de crédito o números de identificación personal.
Crea una plantilla de inspección de Sensitive Data Protection.
Abre tu canalización en Cloud Data Fusion y haz clic en Studio > Transform.
Haz clic en la transformación Filtro de PII.
Mantén el puntero sobre el nodo de Filtro de PII y haz clic en Propiedades.
En Filtro activado, elige si deseas filtrar registros o campos.
Cumple con los límites de la protección de datos sensibles, Si un registro supera los 0.5 MB, tu canalización de Cloud Data Fusion fallará. Para evitar este tipo de fallas, filtra por campo en lugar de registro.
En ID de plantilla, ingresa el ID de plantilla de Sensitive Data Protection. plantilla que creaste.
En Administración de errores, define cómo proceder cuando tu canalización encuentre datos sensibles. Elige una de las siguientes opciones de administración de errores:
- Detener canalización: detiene la canalización apenas se encuentra un error.
- Omitir registro: omite el registro que causó el error. La canalización continúa ejecutándose y no se informa ningún error.
- Enviar al error: envía errores al puerto de error. La canalización continúa ejecutándose.
Haz clic en el botón X.
Usa la transformación de ocultamiento
Esta transformación identifica registros sensibles en el flujo de entrada y aplica las transformaciones que defines para esos registros. Un registro se considera sensible si coincide con filtros predefinidos de Protección de datos sensibles que elegiste o una plantilla personalizada que definiste.
En la página Estudio de la IU web de Cloud Data Fusion, haz clic para expandir el menú Transformar.
Haz clic en la transformación Ocultar.
Mantén el puntero sobre el nodo Ocultar y haz clic en Propiedades.
Elige si deseas aplicar transformaciones a filtros predefinidos o si deseas crear uno propio.
No puedes combinar estas dos opciones. Puedes usar parámetros predefinidos filtros O crear una plantilla personalizada.
Filtros predefinidos
Para aplicar transformaciones a filtros predefinidos, deja la Plantilla personalizada con el valor No y, en Coincidencias, define una regla:
En Aplicar, haz clic en el menú desplegable y elige una transformación. Obtén más información sobre las transformaciones disponibles en la sección Descripción de la pestaña Documentación del complemento.
En Activado, haz clic en el menú desplegable y elige una categoría, que es un conjunto de filtros predefinidos de Protección de datos sensibles agrupados por tipo. Para ver la lista completa de categorías proporcionadas y los filtros que contienen, consulta la sección Asignación de filtro de DLP en la pestaña Documentación del complemento.
Para configurar varias reglas coincidentes, haz clic en el botón +.
Plantilla personalizada
Para aplicar transformaciones según una plantilla personalizada, configura la Plantilla personalizada como Sí.
Crea una plantilla personalizada de protección de datos sensibles.
De regreso en la IU web de Cloud Data Fusion, en el menú de propiedades Ocultar, en ID de plantilla, ingresa el ID de plantilla de la plantilla personalizada que creaste.
Haz clic en el botón X.
Usa la transformación de desencriptación
Esta transformación identifica los registros que se encriptaron con Sensitive Data Protection en el flujo de entrada y aplica la desencriptación. Solo los registros que se encriptaron con un algoritmo reversible, como la encriptación que preserva el formato La encriptación determinista se puede desencriptar.
En la página Estudio de la IU web de Cloud Data Fusion, haz clic para expandir el menú Transformar.
Haz clic en la transformación Desencriptar.
Mantén el puntero sobre el nodo Desencriptar y haz clic en Propiedades.
Ingresa los mismos valores que se usaron para configurar el complemento Redact que y encriptó estos datos. Las propiedades de este complemento son idénticas a las del complemento Ocultar.
Haz clic en el botón X.
¿Qué sigue?
- Sigue un instructivo para ocultar datos confidenciales del usuario.
- Obtén más información sobre la Protección de datos sensibles.