Un detector de infoTipo personalizado de expresión regular (regex) te permite crear tus propios detectores para que Protección de Datos Sensibles detecte coincidencias basadas en un patrón de regex. Por ejemplo, supongamos que tenías números de historial médico con el formato ###-#-#####
. Podrías definir un patrón de expresión regular como el siguiente:
[0-9]{3}-[0-9]{1}-[0-9]{5}
Protección de Datos Sensibles buscaría coincidencias con elementos como los siguientes:
012-4-56789
Anatomía de un detector de infoType personalizado de expresiones regulares
Como se resume en el artículo Descripción general de la API, para crear un detector de infoType de expresión regular personalizada, debes definir un objeto CustomInfoType
que contenga lo siguiente:
- El nombre que quieres asignar al detector de infoType personalizado, dentro de un objeto
InfoType
. - Un valor
Likelihood
opcional. Si omite este campo, las coincidencias de regex devolverán una probabilidad predeterminada deVERY_LIKELY
. Si observas que un detector de infoType personalizado de regex devuelve demasiados falsos positivos, prueba a reducir la probabilidad base y a usar reglas de detección para aumentar la probabilidad con información contextual. Para obtener más información, consulta Personalizar la probabilidad de los resultados. - Opcional
DetectionRule
s o reglas de palabras activas. Estas reglas ajustan la probabilidad de que se produzcan detecciones dentro de una proximidad determinada de las palabras clave activadoras especificadas. Consulta más información sobre las reglas de palabras activas en el artículo Personalizar la probabilidad de encontrar. Un valor
SensitivityScore
opcional. Si omite este campo, las coincidencias con la expresión regular devolverán un nivel de sensibilidad predeterminado deHIGH
.Las puntuaciones de sensibilidad se usan en los perfiles de datos. Al crear perfiles de tus datos, Protección de Datos Sensibles usa las puntuaciones de sensibilidad de los infoTypes para calcular el nivel de sensibilidad.
Un
Regex
objeto que consta de un único patrón que define la expresión regular.
Como objeto JSON, un detector de infoType personalizado de expresión regular que incluye todos los componentes opcionales tiene este aspecto:
{
"customInfoTypes":[
{
"infoType":{
"name":"CUSTOM_INFOTYPE_NAME"
},
"likelihood":"LIKELIHOOD_LEVEL",
"detectionRules":[
{
"hotwordRule":{
HOTWORD_RULE
}
},
"sensitivityScore":{
"score": "SENSITIVITY_SCORE"
},
],
"regex":{
"pattern":"REGULAR_EXPRESSION_PATTERN"
}
}
],
...
}
Ejemplo de regex: buscar números de historial médico
El siguiente fragmento de código JSON y el código en varios idiomas que se muestra a continuación muestran un detector de infoTipo personalizado de expresión regular que indica a Protección de Datos Sensibles que busque un número de historial médico (NHC) en el texto de entrada "Patient's MRN 444-5-22222" y que asigne a cada coincidencia una probabilidad de POSSIBLE
.
C#
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Go
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Java
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Node.js
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
PHP
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Python
Para saber cómo instalar y usar la biblioteca de cliente de Protección de Datos Sensibles, consulta el artículo sobre las bibliotecas de cliente de Protección de Datos Sensibles.
Para autenticarte en Protección de Datos Sensibles, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
REST
Consulta la guía de inicio rápido de JSON para obtener más información sobre cómo usar la API de DLP con JSON.
Entrada JSON:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"Patients MRN 444-5-22222"
},
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"C_MRN"
},
"regex":{
"pattern":"[1-9]{3}-[1-9]{1}-[1-9]{5}"
},
"likelihood":"POSSIBLE"
}
]
}
}
Salida JSON:
{
"result":{
"findings":[
{
"infoType":{
"name":"C_MRN"
},
"likelihood":"POSSIBLE",
"location":{
"byteRange":{
"start":"13",
"end":"24"
},
"codepointRange":{
"start":"13",
"end":"24"
}
},
"createTime":"2018-11-30T01:29:37.799Z"
}
]
}
}
El resultado muestra que, con el detector de infoType personalizado al que le hemos dado el nombre
C_MRN
y su regex personalizado, Protección de Datos Sensibles ha identificado correctamente
el número de historial médico y le ha asignado una certeza de POSSIBLE
,
tal como hemos especificado.
Personalizar la probabilidad de coincidencia se basa en este ejemplo para incluir palabras de contexto.