Inspeção e edição de imagem

A Proteção de dados sensíveis pode inspecionar e editar texto confidencial de uma imagem de acordo com os critérios que você especificar.

Usando detectores de infoType e reconhecimento ótico de caracteres (OCR), a Proteção de dados sensíveis inspeciona uma imagem codificada em base64 para texto e detecta dados sensíveis no texto. Em seguida, ele pode retornar informações sobre a localização de dados confidenciais na imagem ou editar os dados confidenciais mascarando-os com um retângulo opaco.

Inspeção e edição são duas ações distintas:

  • Inspeção: a Proteção de dados sensíveis inspeciona a imagem codificada em base64 enviada para os InfoTypes especificados. Ela retorna os InfoTypes detectados e um ou mais conjuntos de dimensões e coordenadas de pixel. Cada conjunto de valores de coordenadas e dimensões de pixels indica o canto inferior esquerdo e as dimensões das caixas delimitadoras, respectivamente. Cada caixa limitadora corresponde a toda ou parte de uma descoberta da Proteção de dados sensíveis.
  • Edição: a Proteção de dados sensíveis inspeciona a imagem codificada em base64 enviada para os infoTypes especificados. A Proteção de Dados Sensíveis edita todas as descobertas de dados sensíveis mascarando-as com retângulos opacos. Ele retorna a imagem codificada em base64 editada no mesmo formato da imagem original. Também é possível configurar a cor das caixas de edição na solicitação.

Sobre a inspeção

A inspeção de imagem da Proteção de dados sensíveis usa uma imagem codificada em base64, reconhece qualquer texto na imagem e pesquisa o texto em busca de dados que correspondam aos critérios de inspeção. Por fim, a Proteção de dados sensíveis retorna os locais dos dados sensíveis detectados.

Considere a imagem a seguir. Esta imagem é um exemplo de um arquivo de imagem típico gerado a partir de uma digitalização de um documento em papel.

Imagem original não editada.
Imagem original não editada (clique para ampliar).

Se você instruir a Proteção de dados sensíveis a inspecionar essa imagem em busca de números de seguro social dos EUA, ela vai passar pelo processo ilustrado no diagrama a seguir.

Processo de inspeção de imagem.
Processo de inspeção de imagem (clique para ampliar).
  1. A imagem codificada em base64 é transmitida para a Proteção de dados sensíveis usando o método content.inspect.
  2. Com o reconhecimento óptico de caracteres (OCR), a Proteção de dados sensíveis reconhece texto no documento.
  3. A Proteção de dados sensíveis verifica o texto reconhecido usando a configuração de detecção de dados sensíveis definida anteriormente e identifica as correspondências.
  4. A Proteção de dados sensíveis retorna as coordenadas e dimensões das regiões na imagem em que ela encontrou dados sensíveis de acordo com seus critérios de detecção.

As coordenadas retornadas indicam onde encontrar os dados confidenciais. A proteção de dados sensíveis geralmente usa várias caixas para indicar onde uma única instância de dados sensíveis pode ser encontrada na imagem. Isso é especialmente verdadeiro quando o texto é escrito à mão, como neste exemplo.

Se a Proteção de dados sensíveis não encontrar nenhum dado na imagem que corresponda aos seus critérios de detecção, ela vai retornar uma resposta HTTP 200 vazia e bem-sucedida.

Sobre a edição

A edição da imagem é idêntica à inspeção de imagem, com uma etapa a mais. Depois que a proteção de dados sensíveis identifica os locais dos dados sensíveis na imagem, em vez de retornar as coordenadas das áreas que contêm os dados, ela preenche essas áreas na imagem, retornando uma imagem codificada em base64 e editada.

Considere novamente a imagem original da seção anterior. Se você instruir a Proteção de dados sensíveis a editar todos os números do seguro social dos EUA da imagem, ele vai passar pelo processo ilustrado no diagrama a seguir.

Processo de edição de imagem.
Processo de edição de imagem (clique para ampliar).
  1. A imagem codificada em base64 é transmitida para a Proteção de dados sensíveis usando o método image.redact.
  2. Com o reconhecimento óptico de caracteres (OCR), a Proteção de dados sensíveis reconhece texto no documento.
  3. A Proteção de dados sensíveis verifica o texto reconhecido usando a configuração de detecção de dados sensíveis definida anteriormente e identifica as correspondências.
  4. A Proteção de dados sensíveis edita todos os dados sensíveis detectados cobrindo-os com um retângulo opaco. Em seguida, ele codifica a imagem em base64 e a retorna na resposta da solicitação.

Se a Proteção de dados sensíveis não encontrar nenhum dado na imagem que corresponda aos critérios de detecção, ela vai retornar a imagem codificada em base64 inalterada.

A seguir