Inspeção e edição de imagem

A proteção de dados confidenciais pode inspecionar e editar texto confidencial de uma imagem de acordo com os critérios que você especificar.

Usando detectores de infoType e reconhecimento óptico de caracteres (OCR), a proteção de dados sensíveis inspeciona uma imagem codificada em base64 em busca de texto e detecta dados sensíveis no texto. Em seguida, ele pode retornar informações sobre a localização de dados confidenciais na imagem ou editar os dados confidenciais mascarando-os com um retângulo opaco.

Inspeção e edição são duas ações distintas:

  • Inspeção: a proteção de dados sensíveis inspeciona a imagem codificada em base64 enviada para os infoTypes especificados. Ela retorna os InfoTypes detectados e um ou mais conjuntos de dimensões e coordenadas de pixel. Cada conjunto de valores de coordenadas e dimensões de pixels indica o canto inferior esquerdo e as dimensões das caixas delimitadoras, respectivamente. Cada caixa delimitadora corresponde a toda ou parte de uma descoberta de proteção de dados confidenciais.
  • Edição: a proteção de dados confidenciais inspeciona a imagem codificada em base64 enviada para os infoTypes especificados. A proteção de dados sensíveis edita todas as descobertas de dados sensíveis mascarando-as com retângulos opacos. Ele retorna a imagem codificada em base64 editada no mesmo formato da imagem original. Também é possível configurar a cor das caixas de edição na solicitação.

Sobre a inspeção

A inspeção de imagem da proteção de dados confidenciais usa uma imagem codificada em base64, reconhece qualquer texto na imagem e pesquisa o texto em busca de dados que correspondam aos critérios de inspeção. Por fim, a proteção de dados sensíveis retorna os locais dos dados sensíveis detectados.

Considere a imagem a seguir. Esta imagem é um exemplo de um arquivo de imagem típico gerado a partir de uma digitalização de um documento em papel.

Imagem original não editada.
Imagem original não editada (clique para ampliar).

Se você instruir a proteção de dados sensíveis a inspecionar essa imagem em busca de números de CPF ou CNPJ dos EUA, ela passará pelo processo ilustrado no diagrama a seguir.

Processo de inspeção de imagem.
Processo de inspeção de imagens (clique para ampliar).
  1. A imagem codificada em base64 é transmitida para a proteção de dados sensíveis usando o método content.inspect.
  2. Com o reconhecimento óptico de caracteres (OCR), a proteção de dados sensíveis reconhece textos no documento.
  3. A proteção de dados sensíveis verifica o texto reconhecido usando a configuração de detecção de dados sensíveis definida anteriormente e identifica correspondências.
  4. A proteção de dados sensíveis retorna as coordenadas e dimensões das regiões na imagem em que os dados sensíveis foram encontrados, de acordo com os critérios de detecção.

As coordenadas retornadas indicam onde encontrar os dados confidenciais. A proteção de dados sensíveis geralmente usa várias caixas para indicar onde uma única instância de dados sensíveis está na imagem. Isso é especialmente verdadeiro quando o texto é escrito à mão, como neste exemplo.

Se a proteção de dados sensíveis não encontrar nenhum dado na imagem que corresponda aos seus critérios de detecção, ela vai retornar uma resposta HTTP 200 vazia e bem-sucedida.

Sobre a edição

A edição da imagem é idêntica à inspeção de imagem, com uma etapa a mais. Depois que a proteção de dados sensíveis identifica os locais dos dados sensíveis na imagem, em vez de retornar as coordenadas das áreas que contêm os dados, ela preenche essas áreas, retornando uma imagem codificada em base64 editada.

Considere novamente a imagem original da seção anterior. Se você instruir a proteção de dados sensíveis a editar todos os números de CPF ou CNPJ dos EUA da imagem, ele passará pelo processo ilustrado no diagrama a seguir.

Processo de edição de imagens.
Processo de edição de imagens (clique para ampliar).
  1. A imagem codificada em base64 é transmitida para a proteção de dados sensíveis usando o método image.redact.
  2. Com o reconhecimento óptico de caracteres (OCR), a proteção de dados sensíveis reconhece textos no documento.
  3. A proteção de dados sensíveis verifica o texto reconhecido usando a configuração de detecção de dados sensíveis definida anteriormente e identifica correspondências.
  4. A proteção de dados sensíveis edita todos os dados sensíveis detectados cobrindo-os com um retângulo opaco. Em seguida, ele codifica a imagem em base64 e a retorna na resposta da solicitação.

Se a proteção de dados sensíveis não encontrar dados na imagem que correspondam aos critérios de detecção, a imagem codificada em base64 será retornada inalterada.

A seguir