Classificação, edição e desidentificação

O Cloud Data Loss Prevention (DLP) ajuda a entender, gerenciar e proteger dados confidenciais. Com o Cloud DLP, é possível classificar e editar facilmente dados confidenciais contidos em imagens e conteúdo de texto, incluindo conteúdo armazenado em repositórios de armazenamento do Google Cloud.

Classificação de texto

Considere a seguinte entrada de texto:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

O resultado é uma lista de descobertas, organizadas nas seguintes categorias:

O exemplo de resultado é mostrado na tabela abaixo.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

Edição automática de texto

A edição automática produz um resultado com correspondências de dados confidenciais removidas, em vez de oferecer uma lista de descobertas.

Exemplo de entrada de edição de automação:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Exemplo de resultado usando um marcador de posição de "***":

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

Classificação de imagens

O Cloud DLP usa a tecnologia de reconhecimento óptico de caracteres (OCR, na sigla em inglês) para reconhecer texto antes da classificação. Semelhante à classificação de texto, ela retorna descobertas, mas também adiciona uma caixa delimitadora onde o texto foi encontrado.

Classificação de armazenamento

A classificação de armazenamento verifica os dados armazenados no Cloud Storage, no Datastore e no BigQuery. Em vez de fazer streaming de dados para o Cloud DLP, especifique na solicitação o local de armazenamento do bucket do Cloud Storage, do tipo Datastore ou da tabela do BigQuery que você quer verificar no Cloud DLP.

Uma lista de extensões dos tipos de arquivo que o Cloud DLP pode verificar está disponível na página de referência de FileType. Os arquivos de tipos não reconhecidos são verificados como arquivos binários.

Os resultados da verificação podem ser salvos em uma nova tabela do BigQuery ou publicados em um tópico do Pub/Sub. A partir daí, é possível usar ferramentas integradas do BigQuery para executar análises avançadas de SQL ou ferramentas como o Google Data Studio para gerar relatórios.

Para mais informações sobre como verificar dados confidenciais em repositórios de armazenamento usando o Cloud DLP, consulte Como inspecionar dados confidenciais em armazenamento e bancos de dados.

Para mais informações sobre como visualizar os resultados da verificação usando outras ferramentas do Google Cloud, consulte Como analisar e gerar relatórios sobre as descobertas do Cloud DLP.