Como usar a proteção de dados sensíveis com o BigQuery

Esta página contém referências a páginas com informações sobre como usar a proteção de dados sensíveis com o BigQuery.

Guias de início rápido

Guia de início rápido: como programar uma verificação de inspeção de proteção de dados sensíveis
Programe inspeção periódica de um bucket do Cloud Storage, uma tabela do BigQuery ou um tipo do Datastore. Para instruções detalhadas, consulte Como criar e programar jobs de inspeção de proteção de dados confidenciais.

Guias de instruções

Nesta seção, há uma lista categorizada de guias com base em tarefas que demonstram como usar a proteção de dados sensíveis com o BigQuery.

Inspeção

Como inspecionar armazenamento e bancos de dados confidenciais
Crie um job único que pesquise dados confidenciais em um bucket do Cloud Storage, uma tabela do BigQuery ou um tipo do Datastore.
Como criar e programar jobs de inspeção de proteção de dados sensíveis
Crie e programe um gatilho de jobs que pesquisa dados confidenciais em um bucket do Cloud Storage, uma tabela do BigQuery ou um tipo do Datastore. Um acionador de jobs automatiza a criação de jobs de proteção de dados sensíveis periodicamente.

Como trabalhar com resultados de verificação

Como enviar resultados da verificação da proteção de dados sensíveis para o Data Catalog
Verificar uma tabela do BigQuery e enviar as descobertas ao Data Catalog para criar tags automaticamente com base nas descobertas da proteção de dados confidenciais.
Como enviar resultados da verificação da proteção de dados sensíveis para o Security Command Center
Verifique um bucket do Cloud Storage, uma tabela do BigQuery ou um tipo do Datastore e envie as descobertas para o Security Command Center.
Análise e geração de relatórios sobre descobertas de proteção de dados sensíveis
Use o BigQuery para executar análises sobre descobertas de proteção de dados sensíveis.
Como consultar descobertas de proteção de dados confidenciais no BigQuery
Analise as consultas de amostra que podem ser usadas no BigQuery para analisar as descobertas identificadas pela proteção de dados sensíveis.

Análise de risco de reidentificação

Como medir o risco de reidentificação e divulgação

Analise dados estruturados armazenados em uma tabela do BigQuery e calcule as seguintes métricas de risco de reidentificação:

Como calcular estatísticas numéricas e categóricas

Determine os valores mínimo, máximo e quantil de uma coluna individual do BigQuery.

Como visualizar o risco de reidentificação usando o Looker Studio

Meça o k-anonimato de um conjunto de dados e visualize-o no Looker Studio.

Tutoriais

Desidentificar dados do BigQuery no momento da consulta
Siga um tutorial passo a passo que usa as funções remotas do BigQuery para desidentificar e reidentificar dados nos resultados da consulta em tempo real.
Desidentificação e reidentificação de PII em conjuntos de dados de grande escala usando a Proteção de dados sensíveis
Revise uma arquitetura de referência para criar um pipeline de transformação de dados automatizado que desidentifica dados confidenciais, como informações de identificação pessoal (PII).

Práticas recomendadas

Proteger um data warehouse do BigQuery que armazena dados confidenciais
Visão geral da arquitetura e práticas recomendadas para governança de dados ao criar, implantar e operar um data warehouse no Google Cloud, incluindo desidentificação de dados, tratamento diferencial de dados confidenciais e controles de acesso no nível de coluna.

Contribuições da comunidade

Os itens a seguir pertencem e são gerenciados por membros da comunidade, e não pela equipe de proteção de dados sensíveis. No caso de perguntas sobre esses itens, entre em contato com os respectivos proprietários.

Criar tags do Data Catalog inspecionando dados do BigQuery com a proteção de dados confidenciais
Inspecione os dados do BigQuery usando a API Cloud Data Loss Prevention e use a API Data Catalog para criar tags no nível da coluna de acordo com os elementos confidenciais encontrados pela proteção de dados sensíveis.
Arquitetura de programação sem servidor orientada a eventos com proteção de dados sensíveis
Configure um aplicativo de programação sem servidor e orientado a eventos que usa a API Cloud Data Loss Prevention para inspecionar os dados do BigQuery.
Detecção de anomalias em tempo real com serviços de IA e análise de stream do Google Cloud
Acompanhe um padrão de inteligência artificial em tempo real (IA) para detectar anomalias nos arquivos de registros. Essa prova de conceito usa o Pub/Sub, o Dataflow, o BigQuery ML e a proteção de dados sensíveis.
Importação de banco de dados relacional para o BigQuery com o Dataflow e a proteção de dados sensíveis
Use o Dataflow e a proteção de dados sensíveis para tokenizar e importar com segurança dados de um banco de dados relacional para o BigQuery. Este exemplo descreve como tokenizar dados de PII antes de se tornarem persistentes.

Preços

Ao inspecionar uma tabela do BigQuery, você gera custos de proteção de dados sensíveis, de acordo com os preços do job de inspeção de armazenamento.

Além disso, quando você salva as descobertas da inspeção em uma tabela do BigQuery, está sujeito a cobranças do BigQuery.