Oculta datos confidenciales


En este instructivo, se muestra cómo usar el plugin de Cloud Data Fusion para Cloud DLP a fin de ocultar datos sensibles.

Situación

Considera la siguiente situación, en la que se debe ocultar parte de la información sensible del cliente:

El equipo de asistencia al cliente documenta los detalles de cada caso de ayuda que controlan en un ticket de asistencia. Toda la información en los tickets de asistencia se extrae en un archivo CSV. No se supone que los técnicos de asistencia documentan la información de los clientes que se considera confidencial, pero a veces lo hacen erróneamente. Notarás que en el archivo CSV aparecen algunos números de teléfono de algunos clientes.

Deseas revisar el archivo CSV y ocultar todos los números de teléfono. Crea una canalización de Cloud Data Fusion que oculta los datos sensibles de los clientes con el complemento de Cloud DLP.

En este instructivo, crearás una canalización que haga lo siguiente:

  • Se ocultan los números de teléfono de los clientes enmascarando el carácter #.
  • Almacenar los datos sensibles enmascarados y los no sensibles en un bucket de Cloud Storage.

Objetivos

  • Conectar Cloud Data Fusion a una fuente de Cloud Storage
  • Implementa el complemento de Cloud DLP.
  • Crea una plantilla personalizada de Cloud DLP.
  • Usa el complemento de transformación Ocultar a fin de enmascarar los datos sensibles de los clientes.
  • Escribe los datos de salida en Cloud Storage.

Costos

En este documento, usarás los siguientes componentes facturables de Google Cloud:

Para generar una estimación de costos en función del uso previsto, usa la calculadora de precios. Es posible que los usuarios nuevos de Google Cloud califiquen para obtener una prueba gratuita.

Antes de comenzar

  1. Accede a tu cuenta de Google Cloud. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. En la página del selector de proyectos de la consola de Google Cloud, selecciona o crea un proyecto de Google Cloud.

    Ir al selector de proyectos

  3. Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

  4. En la página del selector de proyectos de la consola de Google Cloud, selecciona o crea un proyecto de Google Cloud.

    Ir al selector de proyectos

  5. Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

  6. Habilita las API de Cloud Data Fusion, BigQuery, Cloud Storage, and Dataproc.

    Habilita las API

  7. Crea una instancia de Cloud Data Fusion.

Obtén permisos de Cloud DLP

  1. En la consola de Google Cloud, ve a la página IAM.

    Abrir la página IAM

  2. En la tabla de permisos, en la columna Principal, busca la cuenta de servicio que coincida con el formato service-project-number@gcp-sa-datafusion.iam.gserviceaccount.com.

  3. Haz clic en  Cambiar.

  4. Haz clic en Agregar otro rol.

  5. Usa la barra de búsqueda para buscar y, luego, selecciona Administrador de DLP.

  6. Haz clic en Guardar.

  7. Verifica que el Administrador de DLP aparezca en la columna Función.

Cuando usas Cloud Data Fusion, debes usar la consola de Google Cloud y la IU independiente de Cloud Data Fusion. En la consola de Google Cloud, puedes crear un proyecto de la consola de Google Cloud y crear y borrar instancias de Cloud Data Fusion. En la IU de Cloud Data Fusion, puedes usar las distintas páginas, como Studio o Wrangler, para usar las funciones de Cloud Data Fusion.

  1. En la consola de Google Cloud, abre la página Instancias.

    Abrir la página de instancias

  2. En la columna Acciones de la instancia, haz clic en el vínculo Ver instancia. La IU de Cloud Data Fusion se abrirá en una pestaña nueva del navegador.

Crea la canalización

Crear una canalización que oculte datos sensibles de clientes La canalización que compilas hará lo siguiente:

  • Lee los datos de entrada mediante el complemento de origen de Cloud Storage.
  • Implementa el complemento de Cloud DLP desde Hub.
  • Escribe los datos de salida mediante un complemento del receptor de Cloud Storage.

Carga los datos del cliente

En este instructivo, se usa el conjunto de datos de entrada, CallCenterRecords.csv, que se proporciona en un bucket de Cloud Storage disponible de forma pública.

  1. Abre tu instancia de Cloud Data Fusion y haz clic en Menú > Studio.

  2. En el menú Origen, haz clic en el complemento de Cloud Storage.

    Selecciona el complemento.

  3. En el nodo de Cloud Storage, haz clic en Propiedades.

  4. En el campo Nombre de referencia, ingresa un nombre.

  5. En el campo Ruta de acceso, ingresa gs://datafusion-sample-datasets/CallCenterRecords.csv.

  6. En el campo Formato, selecciona CSV.

  7. Para el Esquema de salida, borra los campos offset y body. Haz clic en Agregar y, luego, ingresa los siguientes campos:

    • Fecha
    • Banco
    • Estado
    • Zip
    • Notas

    Ingresa las propiedades fuente.

  8. Haz clic en Validar para comprobar si hay errores.

  9. Haz clic en Cerrar.

Oculta datos sensibles

El complemento de ocultamiento de Cloud DLP identifica registros sensibles en el flujo de entrada de datos y aplica las transformaciones que defines a esos registros. Un registro de datos se considera sensible si coincide con los filtros predefinidos de Cloud DLP que elijas o una plantilla personalizada que definas.

En este instructivo, deseas ocultar los números de teléfono del cliente que algunos técnicos de asistencia en tu equipo tomaron nota accidentalmente. Ingresaron la información sensible en la sección Notas de los tickets de asistencia, que aparece como la columna Notas en el archivo CSV. Debes crear una plantilla de Cloud DLP personalizada y, luego, proporcionar el ID de la plantilla en el menú de propiedades del complemento.

Implementa el complemento de Cloud DLP

  1. En tu instancia de Cloud Data Fusion, haz clic en Hub.

  2. Haz clic en el complemento Cloud DLP.

  3. Haz clic en Implementar.

  4. Haz clic en Finalizar.

  5. Haz clic en Cerrar para salir del diálogo de Cloud DLP.

  6. Haz clic en Close para salir del Hub.

Cómo crear una plantilla personalizada

  1. En la consola de Google Cloud, ve a la página Cloud DLP.

    Ir a Cloud DLP

  2. En el menú Create (Crear), elige Template (Plantilla).imagen

  3. En el campo ID de plantilla, ingresa un ID para tu plantilla.

  4. Haz clic en Continuar.

  5. En el campo Configurar detección, haz clic en Administrar infotipos.

  6. En la pestaña Integrado, usa el filtro para buscar por “número de teléfono”.

    Filtro.

  7. Seleccionar PHONE_NUMBER

  8. Haz clic en Listo > Crear.

Obtén más información sobre la creación de plantillas de Cloud DLP.

Aplica la transformación de ocultamiento de Cloud DLP

  1. Ve a la página Studio de Cloud Data Fusion y haz clic para expandir el menú Transformar.

  2. Haz clic en el complemento Ocultar de Cloud DLP.

    Haz clic en el complemento para agregarlo a tu canalización.

  3. Arrastra una flecha de conexión desde el nodo de Cloud Storage al nodo Ocultar.

    Conecta los dos nodos.

  4. Mantén el puntero sobre el nodo Ocultar y haz clic en Propiedades.

    1. Establece la Plantilla personalizada en Yes.

    2. En el campo ID de plantilla, ingresa el ID de plantilla de la plantilla personalizada que creaste.

    3. En el campo Matching , aplica Masking en Custom template dentro de Notes.

    4. En el campo Masking Character, ingresa #.

      Máscara.

    5. Haz clic en Validar para comprobar si hay errores.

    6. Haz clic en Cerrar.

Almacena los datos de salida

Almacena los resultados de la canalización en un archivo de Cloud Storage.

  1. En la página Studio, haz clic para expandir el menú Receptor.

  2. Haz clic en Cloud Storage.

  3. Arrastra una flecha de conexión desde el nodo Ocultar hasta el nodo Cloud Storage2.

    Conecta el nodo Redact al segundo nodo de Cloud Storage.

  4. Mantén el puntero sobre el nodo Cloud Storage2 y haz clic en Propiedades.

    1. En el campo Nombre de referencia, ingresa un nombre.

    2. En el campo Ruta de acceso, ingresa la ruta de acceso de un bucket de Cloud Storage en el que quieras almacenar los resultados de la canalización. Cloud Data Fusion crea el bucket por ti. Asegúrate de seguir los lineamientos para asignar nombres a buckets.

    3. En el campo Formato, selecciona CSV.

    4. Haz clic en Validar para asegurarse de que no haya errores.

    5. Haz clic en Cerrar.

Ejecuta la canalización en modo de vista previa

Ejecuta la canalización en modo de vista previa antes de implementarla.

  1. Haz clic en Vista previa y, luego, en Ejecutar.

    Ejecutar la canalización

    Si haces clic en Ejecutar, se muestra el estado de la canalización, que comienza con Iniciar, luego cambia a Detener y, luego, a Ejecutar.

  2. Cuando se completa la ejecución de vista previa, en el nodo Ocultar, haz clic en Vista previa de datos para ver una comparación en paralelo de los datos de entrada y salida. Comprueba que los números de teléfono se hayan enmascarado con el carácter #.

    Comprueba que los números de teléfono estén enmascarados.

Oculta otro tipo de datos

Mientras examinas los resultados de la vista previa, notas que aún hay información sensible que aparece en la columna Notas: direcciones de correo electrónico. Vuelve y edita la plantilla de Cloud DLP para ocultar las direcciones de correo electrónico.

  1. En la consola de Google Cloud, ve a la página Cloud DLP.

    Abrir la página de Cloud DLP

  2. En la pestaña Configuración, selecciona tu plantilla.

  3. Haz clic en Editar.

  4. Haz clic en Administrar infotipos.

  5. En la pestaña Integrado, usa el filtro para buscar “O” "dirección de correo electrónico".

    Filtro.

  6. Selecciona todo y haz clic en Listo.

  7. Haz clic en Guardar.

  8. Una vez más, ejecuta la canalización en el modo de vista previa. Cloud Data Fusion usará automáticamente la plantilla actualizada de Cloud DLP.

  9. Comprueba que los números de teléfono y las direcciones de correo electrónico se hayan enmascarado con el carácter #.

    Comprobar que los datos estén enmascarados

Implementa y ejecuta la canalización

  1. Asegúrate de que el modo Vista previa esté desmarcado.

  2. Haz clic en Guardar. Si haces clic en Guardar, se te solicitará que asignes un nombre a tu canalización. Luego, haga clic en Aceptar.

  3. Haz clic en Implementar.

  4. Cuando finalice la implementación, haz clic en Ejecutar. Puede tardar unos minutos ejecutar tu canalización. Mientras esperas, puedes observar el Estado de la transición de la canalización de Aprovisionamiento a Iniciada a En ejecución a Desaprovisionamiento a Correcto.

Vea los resultados

  1. En la consola de Google Cloud, ve a la página de Cloud Storage.

    Ir a Cloud Storage

  2. En el navegador de Storage, navega hasta el bucket de Cloud Storage receptor que especificaste en las propiedades del complemento del Cloud Storage receptor.

  3. En URL de vínculo, haz clic en el vínculo para descargar el archivo CSV con los resultados. Comprueba que los números de teléfono y las direcciones de correo electrónico se hayan enmascarado con el carácter #.

    Comprobar que los datos estén enmascarados

Limpia

Para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos usados en este instructivo, borra el proyecto que contiene los recursos o conserva el proyecto y borra los recursos individuales.

Borra la instancia de Cloud Data Fusion

Sigue estas instrucciones para borrar tu instancia de Cloud Data Fusion.

Borra el proyecto

La manera más fácil de eliminar la facturación es borrar el proyecto que creaste para el instructivo.

Para borrar el proyecto, haz lo siguiente:

  1. En la consola de Google Cloud, ve a la página Administrar recursos.

    Ir a Administrar recursos

  2. En la lista de proyectos, elige el proyecto que quieres borrar y haz clic en Borrar.
  3. En el diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

¿Qué sigue?