Classificação, ocultação e anonimização

A proteção de dados confidenciais ajuda a compreender, gerir e proteger dados confidenciais. Com a proteção de dados confidenciais, pode classificar e ocultar facilmente dados confidenciais contidos em conteúdo baseado em texto e imagens, incluindo conteúdo armazenado em Google Cloud repositórios de armazenamento.

Classificação de texto

Tendo em conta a seguinte entrada de texto:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

A saída é uma lista de resultados, organizada nas seguintes categorias:

A saída de exemplo é apresentada na tabela abaixo.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

Ocultação automática de texto

A ocultação automática produz uma saída com correspondências de dados confidenciais removidas, em vez de lhe dar uma lista de resultados.

Exemplo de entrada de ocultação de automatização:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Exemplo de resultado com um marcador de posição "***":

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

Classificação de imagens

A proteção de dados confidenciais usa a tecnologia de reconhecimento ótico de carateres (OCR) para reconhecer o texto antes da classificação. Semelhante à classificação de texto, devolve resultados, mas também adiciona uma caixa delimitadora onde o texto foi encontrado.

Classificação do armazenamento

A classificação do armazenamento analisa os dados armazenados no Cloud Storage, no Firestore no modo Datastore (Datastore) e no BigQuery. Em vez de transmitir dados para a proteção de dados confidenciais, especifica na sua solicitação a localização de armazenamento do contentor do Cloud Storage, do tipo Datastore ou da tabela do BigQuery que quer que a proteção de dados confidenciais analise.

Ao analisar ficheiros em localizações do Cloud Storage, a proteção de dados sensíveis suporta a análise de ficheiros binários, de texto, de imagem, do Microsoft Word, do Microsoft Excel, do Microsoft PowerPoint, PDF e do Apache Avro. Pode encontrar uma lista de extensões de ficheiros para os tipos de ficheiros no Cloud Storage que o Sensitive Data Protection pode analisar na página de referência da API para FileType. Os ficheiros de tipos não reconhecidos são analisados como ficheiros binários.

Os resultados da análise podem ser guardados numa nova tabela do BigQuery ou publicados num tópico do Pub/Sub. A partir daí, pode usar ferramentas integradas do BigQuery para executar análises SQL avançadas ou ferramentas como o Looker Studio para gerar relatórios.

Para mais informações sobre a análise de repositórios de armazenamento para dados confidenciais com a proteção de dados confidenciais, consulte o artigo Inspeção de armazenamento e bases de dados para dados confidenciais.

Para mais informações sobre a visualização dos resultados da análise com outras ferramentas, consulte o artigo Analisar e criar relatórios sobre as conclusões da proteção de dados confidenciais. Google Cloud

O que se segue?