Ocultar datos confidenciales

En este instructivo, se muestra cómo usar el complemento de Cloud Data Fusion para Cloud DLP a fin de ocultar datos sensibles.

Situación

Considera la siguiente situación, en la que se debe ocultar información sensible del cliente:

El equipo de asistencia al cliente documenta los detalles de cada caso de ayuda que controlan en un ticket de asistencia. Toda la información en los tickets de asistencia se extrae en un archivo CSV. No se supone que los técnicos de asistencia documentan la información de los clientes que se considera confidencial, pero a veces lo hacen erróneamente. Notarás que en el archivo CSV aparecen algunos números de teléfono de algunos clientes.

Deseas revisar el archivo CSV y ocultar todos los números de teléfono. Crea una canalización de Cloud Data Fusion que oculta los datos sensibles de los clientes con el complemento de Cloud DLP.

En este instructivo, crearás una canalización que haga lo siguiente:

  • Ocultar los números de teléfono del cliente al enmascararlos con el carácter #.
  • Almacenar los datos sensibles enmascarados y los no sensibles en un bucket de Cloud Storage.

Objetivos

  • Conectar Cloud Data Fusion a una fuente de Cloud Storage
  • Implementa el complemento de Cloud DLP.
  • Crea una plantilla personalizada de Cloud DLP.
  • Usa el complemento de transformación Ocultar a fin de enmascarar los datos sensibles de los clientes.
  • Escribe los datos de salida en Cloud Storage.

Costos

En este instructivo, se usan los siguientes componentes facturables de Google Cloud:

Para generar una estimación de costos en función del uso previsto, usa la calculadora de precios. Es posible que los usuarios nuevos de Google Cloud califiquen para obtener una prueba gratuita.

Antes de comenzar

  1. Accede a tu cuenta de Google Cloud. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. En la página del selector de proyectos de Google Cloud Console, selecciona o crea un proyecto de Google Cloud.

    Ir al selector de proyectos

  3. Comprueba que la facturación esté habilitada en tu proyecto.

    Descubre cómo puedes habilitar la facturación

  4. En la página del selector de proyectos de Google Cloud Console, selecciona o crea un proyecto de Google Cloud.

    Ir al selector de proyectos

  5. Comprueba que la facturación esté habilitada en tu proyecto.

    Descubre cómo puedes habilitar la facturación

  6. Habilita las API de Cloud Data Fusion, Cloud Storage, BigQuery, and Cloud Dataproc.

    Habilita las API

  7. Crea una instancia de Cloud Data Fusion.

Obtén permisos de Cloud DLP

  1. En Cloud Console, ve a la página IAM.

    Abrir la página IAM

  2. En la tabla de permisos, en la columna Principal, busca la cuenta de servicio que coincida con el formato service-project-number@gcp-sa-datafusion.iam.gserviceaccount.com.

  3. Haz clic en el botón Editar  a la derecha de la cuenta de servicio.

  4. Haz clic en Agregar otra función.

  5. Haz clic en el menú desplegable que aparece.

  6. Usa la barra de búsqueda para buscar y, luego, selecciona Administrador de DLP.

  7. Haga clic en Save.

  8. Verifica que el Administrador de DLP aparezca en la columna Función.

Cuando usas Cloud Data Fusion, usas Cloud Console y la IU de Cloud Data Fusion, que está separada. En Cloud Console, puedes crear un proyecto de Cloud Console, crear y borrar instancias de Cloud Data Fusion. En la IU de Cloud Data Fusion, puedes usar las distintas páginas, como Studio o Wrangler, para usar las funciones de Cloud Data Fusion.

  1. En Cloud Console, abre la página Instancias.

    Abrir la página de instancias

  2. En la columna Acciones de la instancia, haz clic en el vínculo Ver instancia. La IU de Cloud Data Fusion se abrirá en una pestaña nueva del navegador.

Crea la canalización

Crear una canalización que oculte datos sensibles de clientes La canalización que compilas hará lo siguiente:

  • Lee los datos de entrada mediante el complemento de origen de Cloud Storage.
  • Implementa el complemento de Cloud DLP desde Hub y aplica el complemento de transformación Ocultar.
  • Escribe los datos de salida mediante un complemento del receptor de Cloud Storage.

Carga los datos del cliente

En este instructivo, se usa el conjunto de datos de entrada, CallCenterRecords.csv, que se proporciona en un bucket de Cloud Storage disponible de forma pública.

  1. En la IU de Cloud Data Fusion, haz clic en el menú y navega a la página Studio.

  2. En el menú Fuente, haz clic en el complemento GCS.

    image

  3. Mantén el cursor sobre el nodo GCS que aparecerá y haz clic en Propiedades.

  4. En Nombre de referencia, ingresa un nombre de referencia.

  5. En Ruta, ingresa gs://datafusion-sample-datasets/CallCenterRecords.csv.

  6. En Formato, selecciona CSV.

  7. En Esquema de salida, quita los campos cuerpo y desplazamiento. Haga clic en + para agregar los siguientes campos:

    • Fecha
    • Banco
    • State
    • Zip
    • Notas
  8. Asegúrate de que todos los tipos de datos sean del tipo string. Para cambiar el tipo, haz clic en él y selecciona string en el menú desplegable que aparece.

    imagen

  9. Haz clic en Validar para asegurarte de que no haya errores.

  10. Haz clic en el botón X en la esquina superior derecha del cuadro de diálogo.

Oculta datos sensibles

El complemento de transformación Ocultar identifica registros sensibles en tu flujo de entrada de datos y aplica transformaciones que definas en esos registros. Un registro de datos se considera sensible si coincide con filtros de Cloud DLP predefinidos que elijas o una plantilla personalizada que definas.

En este instructivo, deseas ocultar los números de teléfono del cliente que algunos técnicos de asistencia en tu equipo tomaron nota accidentalmente. Ingresaron la información sensible en la sección Notas de los tickets de asistencia, que aparece como la columna Notas en el archivo CSV. Crea una plantilla personalizada de Cloud DLP y, luego, proporciona el ID de plantilla en el menú de propiedades del complemento de transformación Ocultar.

Implementa el complemento de Cloud DLP

  1. En la IU web de Cloud Data Fusion, haz clic en Hub en la parte superior derecha.

  2. Haz clic en el complemento Prevención de pérdida de datos.

  3. Haz clic en Implementar.

  4. Haz clic en Finalizar.

  5. Haz clic en X en la esquina superior derecha del cuadro de diálogo Cloud DLP | Implementar.

  6. Haz clic en el botón X para salir del Hub.

Cómo crear una plantilla personalizada

  1. En Cloud Console, abre Cloud DLP.

    Abrir la página de Cloud DLP

  2. En el menú Create (Crear), elige Template (Plantilla).image

  3. En Definir plantilla, en el campo ID de plantilla, ingresa un ID para la plantilla. Necesitarás el ID de la plantilla más adelante en el instructivo.

  4. Haga clic en Continue.

  5. En Configurar detección, haz clic en Administrar tipos de información.

  6. En la pestaña Integrado, usa el filtro para buscar por “número de teléfono”.

    image

  7. Seleccionar número de teléfono

  8. Haga clic en Listo.

  9. Haga clic en Crear.

Obtén más información sobre cómo crear plantillas de Cloud DLP.

Aplica la transformación Ocultar

  1. Vuelve a la IU de Cloud Data Fusion y, en la página de Studio, haz clic para expandir el menú Transformar.

  2. Haz clic en el complemento de transformación Ocultar.

    image

  3. Arrastre una flecha de conexión del nodo GCS al nodo Ocultar.

    image

  4. Mantén el puntero sobre el nodo Ocultar y haz clic en Propiedades.

    1. Configura la Plantilla personalizada como .

    2. En ID de plantilla, ingresa el ID de plantilla de la plantilla personalizada que creaste.

    3. En Coincidencias, aplica Enmascaramiento en Plantilla personalizada dentro de Notas.

    4. En Carácter de enmascaramiento, ingresa #.

      image

    5. Haz clic en Validar para asegurarse de que no haya errores.

    6. Haz clic en el botón X en la esquina superior derecha del cuadro de diálogo.

Almacena los datos de salida

Almacena los resultados de la canalización en un archivo de Cloud Storage.

  1. En la IU de Cloud Data Fusion, en la página Studio, haz clic para expandir el menú Receptor.

  2. Haz clic en GCS.

  3. Arrastra una flecha de conexión desde el nodo Ocultar al nodo GCS2.

    image

  4. Mantén el puntero sobre el nodo GCS2 y haz clic en Propiedades.

    1. En Nombre de referencia, ingresa un nombre de referencia.

    2. En Ruta de acceso, ingresa la ruta de un bucket de Cloud Storage en el que deseas almacenar los resultados de las canalizaciones. Cloud Data Fusion crea el bucket de Cloud Storage para ti. Asegúrate de seguir los lineamientos para asignar nombres a buckets.

    3. En Formato, selecciona CSV.

      image

    4. Haz clic en Validar para asegurarse de que no haya errores.

    5. Haz clic en el botón X en la esquina superior derecha del cuadro de diálogo.

Ejecuta la canalización en modo de vista previa

Ejecuta la canalización en modo de vista previa antes de implementarla.

  1. Haz clic en Vista previa y, luego, en Ejecutar.

    image

    El botón Ejecutar muestra el estado de la canalización, que comienza con Iniciando, luego cambia a Detener y luego a Ejecutar.

  2. Cuando se completa la ejecución de vista previa, en el nodo Ocultar, haz clic en Vista previa de datos para ver una comparación en paralelo de los datos de entrada y salida. Comprueba que se hayan enmascarado los números de teléfono con el carácter #.

    image

Oculta otro tipo de datos

Mientras examinas los resultados de la vista previa, notas que aún hay información sensible que aparece en la columna Notas: direcciones de correo electrónico. Vuelve y edita la plantilla de Cloud DLP para ocultar las direcciones de correo electrónico.

  1. En Cloud Console, ve a la página Cloud DLP.

    Abrir la página de Cloud DLP

  2. En la pestaña Configuración, selecciona la plantilla.

  3. Haz clic en Editar.

  4. Haz clic en Administrar infotipos.

  5. En la pestaña Integrado, usa el filtro para buscar “O” "dirección de correo electrónico".

    image

  6. Selecciona todo y haz clic en Listo.

  7. Haga clic en Save.

  8. Una vez más, ejecuta la canalización en el modo de vista previa. Cloud Data Fusion usará automáticamente la plantilla actualizada de Cloud DLP.

  9. Verifica que los números de teléfono y las direcciones de correo electrónico se hayan enmascarado con el carácter #.

    image

Implementa y ejecuta la canalización

  1. Asegúrate de que el modo Vista previa esté desmarcado.

  2. Haga clic en Save. Si haces clic en Guardar, se te solicitará que asignes un nombre a tu canalización. Luego, haga clic en Aceptar.

    image

  3. Haz clic en Implementar.

  4. Cuando finalice la implementación, haz clic en Ejecutar. Puede tardar unos minutos ejecutar tu canalización. Mientras esperas, puedes observar el Estado de la transición de la canalización de Aprovisionamiento a Iniciada a En ejecución a Desaprovisionamiento a Correcto.

Observa los resultados.

  1. En Cloud Console, ve a la página de Cloud Storage.

    Abrir la página de Cloud Storage

  2. En el navegador de Storage, navega hasta el bucket de Cloud Storage receptor que especificaste en las propiedades del complemento del Cloud Storage receptor.

  3. En URL de vínculo, haz clic en el vínculo para descargar el archivo CSV con los resultados. Verifica que los números de teléfono y las direcciones de correo electrónico se hayan enmascarado con el carácter #.

    imagen

Limpia

Para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos usados en este instructivo, borra el proyecto que contiene los recursos o conserva el proyecto y borra los recursos individuales.

Borra la instancia de Cloud Data Fusion

Sigue estas instrucciones para borrar tu instancia de Cloud Data Fusion.

Borra el proyecto

La manera más fácil de eliminar la facturación es borrar el proyecto que creaste para el instructivo.

Para borrar el proyecto, sigue estos pasos:

  1. En Cloud Console, ve a la página Administrar recursos.

    Ir a Administrar recursos

  2. En la lista de proyectos, elige el proyecto que quieres borrar y haz clic en Borrar.
  3. En el diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

¿Qué sigue?