Como inspecionar texto estruturado de dados confidenciais

O Cloud Data Loss Prevention (DLP) pode detectar e classificar dados confidenciais em conteúdo estruturado, como CSV ou JSON. Ao inspecionar ou desidentificar como uma tabela, a estrutura e as colunas dão ao Cloud DLP pistas adicionais que podem permitir que ele forneça resultados melhores para alguns casos de uso.

Como inspecionar uma tabela

Veja os exemplos de código abaixo para saber como verificar conteúdo confidencial em uma tabela de dados. As tabelas são compatíveis com vários tipos.

Consulte o guia de início rápido do JSON para mais informações sobre o uso da API Cloud DLP com o JSON.

Entrada JSON:

POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}

{
  "item":{
    "table":{
      "headers": [{"name":"name"}, {"name":"phone"}],
      "rows": [{
        "values":[
          {"string_value": "John Doe"},
          {"string_value": "(206) 555-0123"}
        ]}
      ],
    }
  },
  "inspectConfig":{
    "infoTypes":[
      {
        "name":"PHONE_NUMBER"
      }
    ],
    "includeQuote":true
  }
}

Saída JSON:

{
  "result": {
    "findings": [
     {
      "quote": "(206) 555-0123",
      "infoType": {
       "name": "PHONE_NUMBER"
      },
      "likelihood": "VERY_LIKELY",
      "location": {
         "byteRange": {
          "end": "14"
         },
         "codepointRange": {
          "end": "14"
         },
         "contentLocations": [
          {
           "recordLocation": {
              "fieldId": {
               "name": "phone"
              },
              "tableLocation": {
              }
           }
          }
         ]
      },
      "createTime": "2019-03-08T23:55:10.980Z"
     }
    ]
  }
}

Texto estruturado

A estruturação de texto pode ajudar a contextualizar. A mesma solicitação do exemplo anterior, se inspecionada como uma string, ou seja, apenas "John Doe, (206) 555-0123", traria resultados menos precisos. Isso porque o Cloud DLP tem menos pistas contextuais sobre qual poderia ser a finalidade do número. Quando possível, considere analisar as strings em um objeto de tabela para conseguir os resultados de verificação mais precisos.