Como usar o Cloud DLP para verificar dados do BigQuery

Saber onde seus dados confidenciais estão geralmente é o primeiro passo para garantir que eles sejam protegidos e gerenciados de maneira adequada. Esse conhecimento ajuda a reduzir o risco de expor detalhes confidenciais, como números de cartão de crédito, informações médicas, CPF ou CNPJ, número da carteira de habilitação, endereços, nomes completos e segredos específicos da empresa. A verificação periódica dos dados também ajuda nos requisitos de conformidade e garantir que as práticas recomendadas sejam seguidas à medida que seus dados crescem e mudam com o uso. Para ajudar a atender aos requisitos de conformidade, use o Cloud Prevenção contra perda de dados (Cloud DLP) para analisar as tabelas do BigQuery e proteger os dados confidenciais.

O Cloud DLP é um serviço totalmente gerenciado que permite aos clientes do Google Cloud identificar e proteger dados confidenciais em escala. O Cloud DLP usa mais de 100 detectores predefinidos para identificar padrões, formatos e somas de verificação. O Cloud DLP também fornece um conjunto de ferramentas para tornar seus dados anônimos, incluindo mascaramento, tokenização, pseudonimização, troca de datas e muito mais, sem a necessidade de replicar os dados dos clientes.

Para saber mais sobre o Cloud DLP, consulte a documentação do Cloud DLP.

Antes de começar

  1. Familiarize-se com os preços do Cloud DLP e saiba como manter os custos do Cloud DLP sob controle.
  2. Ative a API DLP Ative a API
  3. Certifique-se de que o usuário que está criando os jobs do Cloud DLP tenha um papel do IAM predefinido apropriado ou permissões suficientes para executar jobs do Cloud DLP.

Como verificar dados do BigQuery usando o Console do Cloud

Para verificar dados do BigQuery, crie um job do Cloud DLP que analisa uma tabela. É possível verificar uma tabela do BigQuery rapidamente usando a opção Verificação com DLP no BigQuery Cloud Console.

Para verificar uma tabela do BigQuery usando o Cloud DLP, siga estes passos:

  1. No Console do Cloud, acesse a página do BigQuery.

    Acesse a página do BigQuery

  2. Na seção Recursos, expanda o projeto e o conjunto de dados e selecione a tabela do BigQuery que você quer verificar.

  3. Clique em Exportar > Verificar com o DLP (Beta). A página de criação de jobs do Cloud DLP abre em uma nova guia.

  4. Na Etapa 1: escolher dados de entrada, os valores nas seções Nome e Local são gerados automaticamente. Além disso, a seção Amostragem é configurada automaticamente para executar uma varredura de amostra nos seus dados. Ajuste o número de linhas na amostra escolhendo Porcentagem de linhas no campo Limitar linhas por. Também é possível alterar o número de linhas de amostra ajustando o valor no campo Número máximo de linhas.

  5. Clique em Continuar.

  6. (Opcional) Na Etapa 2: configurar a detecção, é possível configurar os tipos de dados a serem procurados, chamados infoTypes. Selecione na lista de infoTypes predefinidos ou selecionar um modelo, se houver. Para mais informações sobre infoTypes, consulte InfoTypes e detectores infoType na documentação do Cloud DLP.

  7. Clique em Continuar.

  8. (Opcional) Na Etapa 3: adicionar ações, ative a opção Salvar no BigQuery para publicar as descobertas do Cloud DLP em uma tabela do BigQuery. Se você não armazenar as descobertas, o job concluído conterá apenas estatísticas sobre o número de descobertas e os respectivos infoTypes. Salvar as descobertas no BigQuery guarda detalhes sobre a localização precisa e a confiança de cada descoberta individual.

  9. (Opcional) Se você ativou a opção Salvar no BigQuery, na seção Salvar no BigQuery, digite as seguintes informações:

    • ID do projeto: o ID do projeto onde os resultados são armazenados.
    • ID do conjunto de dados: o nome do conjunto de dados que armazena os resultados.
    • (Opcional) ID da tabela: o nome da tabela que armazena os resultados. Se nenhum código de tabela for especificado, um nome padrão será atribuído a uma nova tabela semelhante ao seguinte: dlp_googleapis_date_1234567890. Se você especificar uma tabela atual, as descobertas serão anexadas a ela.
  10. Clique em Continuar.

  11. (Opcional) Na Etapa 4: programar, configure um intervalo de tempo ou uma programação, selecionando Especificar período de tempo ou Criar um acionador para executar o job em uma programação periódica.

  12. Clique em Continuar.

  13. (Opcional) Na página Revisar, examine os detalhes do job.

  14. Clique em Criar.

  15. Após a conclusão do job do Cloud DLP, você será redirecionado para a página de detalhes do job e receberá uma notificação por e-mail. É possível ver os resultados da verificação na página de detalhes do job ou clicar no link para a página de detalhes do job do Cloud DLP no e-mail de conclusão.

  16. Se você optou por publicar as descobertas do Cloud DLP no BigQuery, na página Detalhes do job, clique em Visualizar descobertas no BigQuery para abrir a tabela no Console do Cloud. Lá, é possível consultar a tabela e analisar suas descobertas. Para mais informações sobre como consultar seus resultados no BigQuery, veja Como consultar as descobertas do Cloud DLP no BigQuery na documentação do Cloud DLP.

Próximas etapas

Para saber mais sobre como inspecionar o BigQuery e outros repositórios de armazenamento em busca de dados confidenciais usando o Cloud DLP, consulte os seguintes tópicos na documentação do Cloud DLP:

Se você quiser editar ou tornar anônimos os dados confidenciais encontrados pela verificação do Cloud DLP, consulte:

Outros recursos