Usar a proteção de dados confidenciais para analisar dados do BigQuery

Saber onde existem os seus dados confidenciais é, muitas vezes, o primeiro passo para garantir que estão devidamente protegidos e geridos. Estes conhecimentos podem ajudar a reduzir o risco de expor detalhes confidenciais, como números de cartões de crédito, informações médicas, números da segurança social, números de cartas de condução, moradas, nomes completos e segredos específicos da empresa. A análise periódica dos seus dados também pode ajudar com os requisitos de conformidade e garantir que as práticas recomendadas são seguidas à medida que os seus dados aumentam e mudam com a utilização. Para ajudar a cumprir os requisitos de conformidade, use a proteção de dados confidenciais para inspecionar as suas tabelas do BigQuery e ajudar a proteger os seus dados confidenciais.

Existem duas formas de analisar os seus dados do BigQuery:

  • Criação de perfis de dados confidenciais. A proteção de dados confidenciais pode gerar perfis sobre dados do BigQuery numa organização, pasta ou projeto. Os perfis de dados contêm métricas e metadados sobre as suas tabelas e ajudam a determinar onde residem os dados confidenciais e de alto risco. A proteção de dados confidenciais comunica estas métricas ao nível do projeto, da tabela e da coluna. Para mais informações, consulte o artigo Perfis de dados para dados do BigQuery.

  • Inspeção a pedido. A proteção de dados confidenciais pode realizar uma inspeção detalhada numa única tabela ou num subconjunto de colunas e comunicar as respetivas conclusões até ao nível da célula. Este tipo de inspeção pode ajudar a identificar instâncias individuais de tipos de dados específicos, como a localização precisa de um número de cartão de crédito numa célula de tabela. Pode fazer uma inspeção a pedido através da página Proteção de dados confidenciais naGoogle Cloud consola, da página BigQuery ou programaticamente através da API DLP.

Esta página descreve como fazer uma inspeção a pedido através da página BigQuery na Google Cloud consola.

A Proteção de dados confidenciais é um serviço totalmente gerido que permite aos Google Cloud clientes identificar e proteger dados confidenciais em grande escala. A Proteção de dados confidenciais usa mais de 150 detetores predefinidos para identificar padrões, formatos e somas de verificação. A proteção de dados confidenciais também fornece um conjunto de ferramentas para desidentificar os seus dados, incluindo ocultação, tokenização, pseudonimização, alteração de datas e muito mais, tudo sem replicar os dados dos clientes.

Para saber mais sobre a proteção de dados confidenciais, consulte a documentação sobre a proteção de dados confidenciais.

Antes de começar

  1. Familiarize-se com os preços da proteção de dados confidenciais e como manter os custos da proteção de dados confidenciais sob controlo.
  2. Ative a API DLP.

    Ative a API

  3. Certifique-se de que o utilizador que cria as tarefas de proteção de dados confidenciais tem uma função do IAM de proteção de dados confidenciais predefinida adequada ou autorizações suficientes para executar tarefas de proteção de dados confidenciais.

Analisar dados do BigQuery através da Google Cloud consola

Para analisar dados do BigQuery, cria uma tarefa de proteção de dados confidenciais que analisa uma tabela. Pode analisar rapidamente uma tabela do BigQuery através da opção Analisar com a proteção de dados confidenciais na consola do BigQuery Google Cloud .

Para analisar uma tabela do BigQuery com a proteção de dados confidenciais:

  1. Na Google Cloud consola, aceda à página do BigQuery.

    Aceda ao BigQuery

  2. No painel Explorador, expanda o projeto e o conjunto de dados e, de seguida, selecione a tabela.

  3. Clique em Exportar > Analisar com a proteção de dados confidenciais. A página de criação do trabalho de proteção de dados confidenciais é aberta num novo separador.

  4. Para Passo 1: escolha os dados de entrada, introduza um ID da tarefa. Os valores na secção Localização são gerados automaticamente. Além disso, a secção Amostragem é configurada automaticamente para executar uma análise de amostra nos seus dados, mas pode ajustar as definições conforme necessário.

  5. Clique em Continuar.

  6. Opcional: no Passo 2: configure a deteção, pode configurar os tipos de dados a procurar, denominados infoTypes.

    Efetue um dos seguintes passos:

    • Para selecionar a partir da lista de infoTypes predefinidos, clique em Gerir infoTypes. Em seguida, selecione os infoTypes que quer pesquisar.
    • Para usar um modelo de inspeção existente, no campo Nome do modelo, introduza o nome completo do recurso do modelo.

    Para mais informações sobre infoTypes, consulte os InfoTypes e os detetores de infoType na documentação sobre a proteção de dados confidenciais.

  7. Clique em Continuar.

  8. Opcional: para o Passo 3: adicione ações, ative a opção Guardar no BigQuery para publicar as suas conclusões da Proteção de dados confidenciais numa tabela do BigQuery. Se não armazenar as conclusões, a tarefa concluída contém apenas estatísticas sobre o número de conclusões e a respetiva infoTypes. A guardar as descobertas no BigQuery, guarda detalhes sobre a localização precisa e a confiança de cada descoberta individual.

  9. Opcional: se ativou a opção Guardar no BigQuery, na secção Guardar no BigQuery, introduza as seguintes informações:

    • ID do projeto: o ID do projeto onde os resultados estão armazenados.
    • ID do conjunto de dados: o nome do conjunto de dados que armazena os resultados.
    • Opcional: ID da tabela: o nome da tabela que armazena os seus resultados. Se não for especificado nenhum ID da tabela, é atribuído um nome predefinido a uma nova tabela semelhante ao seguinte: dlp_googleapis_date_1234567890. Se especificar uma tabela existente, as conclusões são anexadas à mesma.

    Para incluir o conteúdo real que foi detetado, ative a opção Incluir citação.

  10. Clique em Continuar.

  11. Opcional: para o Passo 4: agende, configure um intervalo de tempo ou um agendamento selecionando Especificar intervalo de tempo ou Criar um acionador para executar a tarefa num agendamento periódico.

  12. Clique em Continuar.

  13. Opcional: na página Rever, examine os detalhes da sua tarefa. Se necessário, ajuste as definições anteriores.

  14. Clique em Criar.

  15. Após a conclusão da tarefa de proteção de dados confidenciais, é redirecionado para a página de detalhes da tarefa e recebe uma notificação por email. Pode ver os resultados da análise na página de detalhes da tarefa ou clicar no link para a página de detalhes da tarefa de proteção de dados confidenciais no email de conclusão da tarefa.

  16. Se optou por publicar as conclusões da Proteção de dados confidenciais no BigQuery, na página Detalhes da tarefa, clique em Ver conclusões no BigQuery para abrir a tabela na consola Google Cloud . Em seguida, pode consultar a tabela e analisar os resultados. Para mais informações sobre como consultar os resultados no BigQuery, consulte o artigo Consultar resultados da Proteção de dados confidenciais no BigQuery na documentação da Proteção de dados confidenciais.

O que se segue?

Se quiser ocultar ou desidentificar os dados confidenciais que a análise de proteção de dados confidenciais encontrou, consulte o seguinte: