Cloud Data Loss Prevention (Cloud DLP) ahora forma parte de la protección de datos sensibles. El nombre de la API sigue siendo el mismo: API de Cloud Data Loss Prevention (API de DLP). Para obtener información sobre los servicios que conforman la protección de datos sensibles, consulta la Descripción general de la protección de datos sensibles.

Referencia de transformación

En este tema, se describen las técnicas o transformaciones de desidentificación disponibles en la protección de datos sensibles.

Tipos de técnicas de desidentificación

La elección de la transformación de desidentificación que desees usar depende del tipo de datos que deseas desidentificar y con qué propósito lo haces. Las técnicas de desidentificación que admite la protección de datos sensibles se dividen en las siguientes categorías generales:

Ocultamiento: Borra de forma parcial o completa un valor sensible detectado.
Reemplazo: Reemplaza un valor sensible detectado por un valor subrogado especificado.
Enmascaramiento: Reemplaza una cantidad de caracteres de un valor sensible por un carácter subrogado especificado, como un hash (#) o un asterisco (*).
Asignación de tokens basada en criptografía: Encripta el valor original de los datos sensibles mediante el uso de una clave criptográfica. La protección de datos sensibles admite varios tipos de asignación de token, incluidas las transformaciones que se pueden revertir o “reidentificar”.
Agrupamiento: “Generaliza” un valor sensible mediante su reemplazo por un rango de valores. Por ejemplo, reemplaza una edad específica por un rango de edades o reemplaza temperaturas por rangos que correspondan a “Caliente”, “Medio” y “Frío”.
Cambio de fechas: Cambia los valores sensibles de fecha por una cantidad de tiempo aleatoria.
Extracción de tiempo: Extrae o conserva partes específicas de valores de fecha y hora.

En el resto de este tema, se describe cada tipo diferente de transformación de desidentificación y se proporcionan ejemplos de su uso.

Métodos de transformación

En la siguiente tabla, se enumeran las transformaciones que proporciona la protección de datos sensibles para desidentificar datos sensibles:

Transformación	Objeto	Descripción	Se puede revertir₁	Integridad referencial₂	Tipo de entrada
Ocultamiento	`RedactConfig`	Quita un valor y lo oculta.			Cualquiera
Reemplazo	`ReplaceValueConfig`	Reemplaza cada valor de entrada con un valor determinado.			Cualquiera
Reemplazar por diccionario	`ReplaceDictionaryConfig`	Reemplaza un valor de entrada por un valor que se selecciona de forma aleatoria de una lista de palabras.			Cualquiera
Reemplazo con Infotipo	`ReplaceWithInfoTypeConfig`	Reemplaza un valor de entrada con el nombre de su Infotipo.			Cualquiera
Enmascaramiento con caracteres	`CharacterMaskConfig`	Enmascara una string por completo o parcialmente mediante el reemplazo de un número determinado de caracteres con un carácter fijo especificado.			Cualquiera
Seudonimización mediante el reemplazo de un valor de entrada con un hash criptográfico	`CryptoHashConfig`	Reemplaza valores de entrada con una string hexadecimal de 32 bytes mediante una clave de encriptación de datos. Para obtener más información, consulta la documentación conceptual de seudonimización.		✔	Strings o números enteros
Seudonimización mediante el reemplazo por token de preservación de formato criptográfico	`CryptoReplaceFfxFpeConfig`	Reemplaza un valor de entrada con un token, o valor sustituto, de la misma longitud mediante la encriptación de preservación de formato (FPE) con el modo de operación FFX. Esto permite que la salida se use en sistemas con validación de formato en función de la longitud. Esto es útil para los sistemas heredados en los que se debe mantener la longitud de la string. Importante: Para las entradas que varían en su longitud o que tienen una longitud superior a 32 bytes, usa `CryptoDeterministicConfig`. Para mantener la seguridad, el Instituto Nacional de Normas y Tecnología recomienda usar los siguientes límites: radix^max_size <= 2^128. radix^min_len >= 100 Además de garantizar la integridad referencial, recomendamos el uso de CryptoDeterministicConfig para todos los casos prácticos que no requieran conservar el espacio y el tamaño del alfabeto de entrada. Para obtener más información, consulta la documentación conceptual de seudonimización.	✔	✔	Strings o números enteros con una cantidad limitada de caracteres y una longitud uniforme. El alfabeto debe estar compuesto al menos por 2 caracteres y no debe contener más de 95.
Seudonimización mediante el reemplazo por token criptográfico	`CryptoDeterministicConfig`	Reemplaza un valor de entrada por un token o un valor subrogado de la misma longitud mediante el uso de AES en modo de vector de inicialización sintética (AES-SIV). Este método de transformación, a diferencia de la asignación de token con preservación de formato, no tiene límites en los grupos de caracteres de string compatibles, genera tokens idénticos para cada instancia de un valor de entrada idéntico y usa subrogados para habilitar la reidentificación con la clave de encriptación original.	✔	✔	Cualquiera
Valores de bucket con base en rangos de tamaño fijos	`FixedSizeBucketingConfig`	Enmascara los valores de entrada y los reemplaza por depósitos, o rangos dentro de los cuales se encuentra el valor de entrada.			Cualquiera
Valores de bucket con base en rangos de tamaño personalizados	`BucketingConfig`	Valores de entrada de depósito con base en rangos configurables por el usuario y valores de reemplazo.			Cualquiera
Cambio de fechas	`DateShiftConfig`	Cambia las fechas por un número de días al azar, con la opción de ser coherente en el mismo contexto.		✔ Conserva la secuencia y la duración	Fechas y horarios
Extracción de datos de tiempo	`TimePartConfig`	Extrae o conserva una parte de los valores de `Date`, `Timestamp` y `TimeOfDay`.			Fechas y horarios

Pies de página

¹ Las transformaciones reversibles se pueden revertir para reidentificar los datos sensibles mediante el método content.reidentify.

² La integridad referencial permite que los registros mantengan su relación entre sí, a la vez que desidentifican los datos. Por ejemplo, con la misma clave criptográfica y el mismo contexto, los datos se reemplazarán por el mismo formato ofuscado cada vez que se transformen, lo que permite preservar las conexiones entre los registros.

Ocultamiento

Si solo quieres quitar datos sensibles del contenido de entrada, la Protección de datos sensibles admite una transformación de ocultamiento (RedactConfig en la API de DLP).

Por ejemplo, supongamos que deseas realizar un ocultamiento simple de todos los Infotipos EMAIL_ADDRESS y que la siguiente string se envía a la Protección de datos sensibles:

My name is Alicia Abernathy, and my email address is aabernathy@example.com.

La string obtenida será la que se muestra a continuación:

My name is Alicia Abernathy, and my email address is .

En el siguiente ejemplo de JSON y código en varios lenguajes, se muestra cómo formar la solicitud a la API y lo que muestra la API de DLP.

C#

Para obtener información sobre cómo instalar y usar la biblioteca cliente de la protección de datos sensibles, consulta Bibliotecas cliente de la protección de datos sensibles.

Para autenticarte en la protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

Valores originales	Valores transformados
`9/21/1976`	`1976`
`6/7/1945`	`1945`
`1/20/2009`	`2009`
`7/4/1776`	`1776`
`8/1/1984`	`1984`
`4/21/1982`	`1982`

Referencia de transformación

Tipos de técnicas de desidentificación

Métodos de transformación

Pies de página

Ocultamiento

C#

Go

Java

Node.js

PHP

Python

REST

Reemplazo

Reemplazo básico

C#

Go

Java

Node.js

PHP

Python

REST

Reemplazo del diccionario

C#

Go

Java

Node.js

PHP

Python

Reemplazo del Infotipo

Enmascaramiento

Java

Node.js

Python

Go

PHP

C#

REST

Transformaciones de asignación de tokens basada en criptografía

Hashing criptográfico

Encriptación de preservación de formato

Java

Python

PHP

C#

Ejemplos de encriptación que preservan el formato: desidentificación

Java

Node.js

Python

Go

PHP

C#

Ejemplos de encriptación que preservan el formato: desidentificación con tipo subrogado

Go

Java

Node.js

PHP

Python

C#

Ejemplos de encriptación que preservan el formato: desidentificación de datos sensibles en tablas

C#

Go

Java

Node.js

PHP

Python

Ejemplos de encriptación que preservan el formato: reidentificación

Go

Java

Node.js

PHP

Python

C#

Ejemplos de encriptación que preservan el formato: reidentificación de texto

C#

Go

Java

Node.js

PHP

Python

Ejemplos de encriptación que preservan el formato: reidentificación con tipo subrogado