Crea un detector de expresiones regulares personalizado

Un detector de Infotipo personalizado de expresiones regulares (regex) te permitirá crear tus propios detectores que permiten a Cloud DLP detectar coincidencias basadas en un patrón de regex. Por ejemplo, supón que tienes números de historias clínicas en el formato ###-#-#####. Podrías definir un patrón de regex como el siguiente:

[0-9]{3}-[0-9]{1}-[0-9]{5}

Cloud DLP haría coincidir con elementos como los siguientes:

012-4-56789

Anatomía de un detector de Infotipo personalizado de regex

Como se resume en la Descripción general de la API, para crear un detector de Infotipo de regex personalizado, tienes que definir un objeto CustomInfoType que contenga:

  • El nombre que desees darle al detector de Infotipo personalizado, dentro de un objeto InfoType.
  • Un valor Likelihood opcional. Si omites esto, las coincidencias de regex mostrarán una probabilidad predeterminada de VERY_LIKELY. Si observas que un detector de Infotipo personalizado de regex muestra demasiados falsos positivos, intenta reducir la probabilidad básica y usa las reglas de detección para aumentar la probabilidad mediante el uso de información contextual. Para obtener más información, consulta Personaliza la probabilidad de resultados.
  • DetectionRule opcionales o reglas de palabra clave. Estas reglas ajustan la probabilidad de resultados dentro de una proximidad determinada de las palabras clave específicas. Obtén más información sobre las reglas de palabras clave en Personaliza la probabilidad de resultados.
  • Un objeto Regex que consiste en un solo patrón que define la expresión regular.

Al igual que un objeto JSON, un detector de Infotipo personalizado de regex que incluye todos los componentes opcionales se ve así:

{
  "customInfoTypes":[
    {
      "infoType":{
        "name":"[CUSTOM_INFOTYPE_NAME]"
      },
      "likelihood":"[LIKELIHOOD_VALUE]",
      "detectionRules":[
        {
          "hotwordRule":{
            [HOTWORDRULE_OBJECT]
          }
        },
        ...
      ],
      "regex":{
        "pattern":"[REGEX_PATTERN]"
      }
    }
  ],
  ...
}

Ejemplo de regex: genera coincidencias con números de historias clínicas

En el ejemplo de entrada JSON a continuación, se muestra un detector de Infotipo personalizado de regex que indica a Cloud DLP que coincida con un número de historia clínica (MRN) en el texto de entrada "MRN del paciente 444-5-22222" y que asigne a cada coincidencia una probabilidad de POSSIBLE.

Entrada de JSON:

POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}

{
  "item":{
    "value":"Patients MRN 444-5-22222"
  },
  "inspectConfig":{
    "customInfoTypes":[
      {
        "infoType":{
          "name":"C_MRN"
        },
        "regex":{
          "pattern":"[1-9]{3}-[1-9]{1}-[1-9]{5}"
        },
        "likelihood":"POSSIBLE"
      }
    ]
  }
}

Resultado de JSON:

{
  "result":{
    "findings":[
      {
        "infoType":{
          "name":"C_MRN"
        },
        "likelihood":"POSSIBLE",
        "location":{
          "byteRange":{
            "start":"13",
            "end":"24"
          },
          "codepointRange":{
            "start":"13",
            "end":"24"
          }
        },
        "createTime":"2018-11-30T01:29:37.799Z"
      }
    ]
  }
}

El resultado muestra que con el detector de Infotipo personalizado, le dimos el nombre C_MRN y su regex personalizado. Cloud DLP identificó de manera correcta el número de historia clínica y le asignó una certeza de POSSIBLE, según lo especificado.

La Personalización de la probabilidad de coincidencias se basa en este ejemplo para incluir palabras de contexto.

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

Cloud Data Loss Prevention