Un detector de Infotipo personalizado de expresiones regulares (regex) te permite crear tus propios detectores que permiten que la Protección de datos sensibles detecte coincidencias basadas en un patrón de regex. Por ejemplo, supongamos que tienes números de historias clínicas en el formato ###-#-#####
. Podrías definir un patrón de regex como el siguiente:
[0-9]{3}-[0-9]{1}-[0-9]{5}
Sensitive Data Protection haría coincidir con elementos como los siguientes:
012-4-56789
Anatomía de un detector de Infotipo personalizado de regex
Como se resume en la Descripción general de la API, para crear un detector de Infotipo de regex personalizado, debes definir un objeto CustomInfoType
que contenga lo siguiente:
- El nombre que desees darle al detector de Infotipo personalizado, dentro de un objeto
InfoType
. - Un valor
Likelihood
opcional. Si omites este campo, las coincidencias de regex mostrarán una probabilidad predeterminada deVERY_LIKELY
. Si notas que un detector de Infotipo personalizado de regex muestra demasiados falsos positivos, intenta reducir la probabilidad base y usar reglas de detección para aumentar la probabilidad mediante información contextual. Para obtener más información, consulta Personaliza la probabilidad de resultados. DetectionRule
opcionales o reglas de palabra clave. Estas reglas ajustan la probabilidad de resultados dentro de una proximidad determinada de las palabras clave específicas. Obtén más información sobre las reglas de palabra clave en Personaliza la probabilidad de resultados.Un valor
SensitivityScore
opcional. Si omites este campo, las coincidencias con la expresión regular mostrarán un nivel de sensibilidad predeterminado deHIGH
.Las puntuaciones de sensibilidad se usan en los perfiles de datos. Cuando se crea un perfil de tus datos, Sensitive Data Protection usa las puntuaciones de sensibilidad de los infoTypes para calcular el nivel de sensibilidad.
Un objeto
Regex
que consiste en un patrón único que define la expresión regular.
Al igual que un objeto JSON, un detector de Infotipo personalizado de regex que incluye todos los componentes opcionales se ve así:
{
"customInfoTypes":[
{
"infoType":{
"name":"CUSTOM_INFOTYPE_NAME"
},
"likelihood":"LIKELIHOOD_LEVEL",
"detectionRules":[
{
"hotwordRule":{
HOTWORD_RULE
}
},
"sensitivityScore":{
"score": "SENSITIVITY_SCORE"
},
],
"regex":{
"pattern":"REGULAR_EXPRESSION_PATTERN"
}
}
],
...
}
Ejemplo de regex: genera coincidencias con números de historias clínicas
El siguiente fragmento y código JSON en varios lenguajes a continuación muestra un detector de Infotipo personalizado de expresión regular que le indica a la Protección de datos sensibles que coincida con un número de historia clínica (MRN) en el texto de entrada "MRN del paciente 444-5-22222" y que asigne a cada coincidencia una probabilidad de POSSIBLE
.
C#
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Go
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
PHP
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Protección de datos sensibles, consulta las Bibliotecas cliente de Protección de datos sensibles.
Para autenticarte en la Protección de datos sensibles, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
REST
Consulta la guía de inicio rápido de JSON para obtener más información sobre el uso de la API de DLP con JSON.
Entrada de JSON:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"Patients MRN 444-5-22222"
},
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"C_MRN"
},
"regex":{
"pattern":"[1-9]{3}-[1-9]{1}-[1-9]{5}"
},
"likelihood":"POSSIBLE"
}
]
}
}
Salida de JSON:
{
"result":{
"findings":[
{
"infoType":{
"name":"C_MRN"
},
"likelihood":"POSSIBLE",
"location":{
"byteRange":{
"start":"13",
"end":"24"
},
"codepointRange":{
"start":"13",
"end":"24"
}
},
"createTime":"2018-11-30T01:29:37.799Z"
}
]
}
}
El resultado muestra que con el detector de Infotipo personalizado, le dimos el nombre C_MRN
y su regex personalizado. Sensitive Data Protection identificó de manera correcta el número de historia clínica y le asignó una certeza de POSSIBLE
, según lo especificamos.
La personalización de la probabilidad de coincidencias se basa en este ejemplo para incluir palabras de contexto.