Classificação, edição e desidentificação

A proteção de dados sensíveis ajuda você a entender, gerenciar e proteger dados sensíveis. Com a proteção de dados sensíveis, é possível classificar e editar facilmente dados sensíveis contidos em conteúdo e imagens baseados em texto, incluindo o conteúdo armazenado em repositórios de armazenamento do Google Cloud.

Classificação de texto

Considere a seguinte entrada de texto:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

O resultado é uma lista de descobertas, organizadas nas seguintes categorias:

O exemplo de resultado é mostrado na tabela abaixo.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

Edição automática de texto

A edição automática produz um resultado com correspondências de dados confidenciais removidas, em vez de oferecer uma lista de descobertas.

Exemplo de entrada de edição de automação:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Exemplo de resultado usando um marcador de posição de "***":

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

Classificação de imagens

A proteção de dados sensíveis usa a tecnologia de reconhecimento óptico de caracteres (OCR) para identificar o texto antes da classificação. Semelhante à classificação de texto, ela retorna descobertas, mas também adiciona uma caixa delimitadora onde o texto foi encontrado.

Classificação de armazenamento

A classificação de armazenamento verifica os dados armazenados no Cloud Storage, no Firestore no modo Datastore (Datastore) e no BigQuery. Em vez de fazer streaming de dados para a proteção de dados sensíveis, especifique na solicitação o local de armazenamento do bucket do Cloud Storage, o tipo do Datastore ou a tabela do BigQuery que você quer que a proteção de dados sensíveis verifique.

Ao verificar arquivos em locais do Cloud Storage, a proteção de dados sensíveis aceita a verificação de arquivos binários, de texto, de imagem, do Microsoft Word, do Microsoft Excel, do Microsoft Powerpoint, de PDF e do Apache Avro. Uma lista de extensões dos tipos de arquivo no Cloud Storage que a proteção de dados sensíveis pode verificar está disponível na página de referência da API para FileType. Os arquivos de tipos não reconhecidos são verificados como arquivos binários.

Os resultados da verificação podem ser salvos em uma nova tabela do BigQuery ou publicados em um tópico do Pub/Sub. Depois disso, é possível usar ferramentas integradas do BigQuery para executar análises avançadas de SQL ou ferramentas como o Looker Studio para gerar relatórios.

Para mais informações sobre como verificar dados confidenciais em repositórios de armazenamento usando a proteção de dados confidenciais, consulte Como inspecionar dados confidenciais em armazenamento e bancos de dados.

Para mais informações sobre como visualizar os resultados da verificação usando outras ferramentas do Google Cloud, consulte Como analisar e gerar relatórios sobre descobertas da proteção de dados confidenciais.

A seguir