Inspecciona texto estructurado en busca de datos sensibles

Cloud Data Loss Prevention (DLP) puede detectar y clasificar datos sensibles dentro de contenido estructurado, como CSV o JSON. Mediante la inspección o la desidentificación como una tabla, la estructura y las columnas proporcionan pistas adicionales a Cloud DLP. Es posible que estas pistas le permitan brindar mejores resultados para algunos casos prácticos.

Inspecciona una tabla

Las muestras de códigos que figuran a continuación ilustran cómo inspeccionar una tabla de datos en busca de contenido sensible. Las tablas son compatibles con una variedad de tipos.

Para obtener más información sobre el uso de la API de Cloud DLP con JSON, consulta la guía de inicio rápido de JSON.

Entrada de JSON:

POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}

{
  "item":{
    "table":{
      "headers": [{"name":"name"}, {"name":"phone"}],
      "rows": [{
        "values":[
          {"string_value": "John Doe"},
          {"string_value": "(206) 555-0123"}
        ]}
      ],
    }
  },
  "inspectConfig":{
    "infoTypes":[
      {
        "name":"PHONE_NUMBER"
      }
    ],
    "includeQuote":true
  }
}

Salida de JSON:

{
  "result": {
    "findings": [
     {
      "quote": "(206) 555-0123",
      "infoType": {
       "name": "PHONE_NUMBER"
      },
      "likelihood": "VERY_LIKELY",
      "location": {
         "byteRange": {
          "end": "14"
         },
         "codepointRange": {
          "end": "14"
         },
         "contentLocations": [
          {
           "recordLocation": {
              "fieldId": {
               "name": "phone"
              },
              "tableLocation": {
              }
           }
          }
         ]
      },
      "createTime": "2019-03-08T23:55:10.980Z"
     }
    ]
  }
}

Texto en comparación con texto estructurado

La estructuración del texto puede ayudar a proporcionar contexto. Si se inspecciona la misma solicitud del ejemplo anterior como una string, es decir, como “John Doe, (206) 555-0123”, proporcionaría resultados menos precisos. Esto se debe a que Cloud DLP tiene menos pistas contextuales sobre cuál podría ser el propósito del número. Cuando sea posible, considera analizar tus strings en un objeto de tabla para obtener resultados de análisis más precisos.