O Cloud Data Loss Prevention (Cloud DLP) agora faz parte da Proteção de dados confidenciais. O nome da API continua o mesmo: API Cloud Data Loss Prevention (API DLP). Saiba mais sobre os serviços que fazem parte da Proteção de dados confidenciais.

Como criar e programar jobs de inspeção de proteção de dados sensíveis

Neste tópico, descrevemos em detalhes como criar um job de inspeção de proteção de dados sensíveis e como programar jobs de inspeção recorrentes criando um acionador de jobs. Para um tutorial rápido sobre como criar um novo acionador de jobs usando a IU de proteção de dados confidenciais, consulte Guia de início rápido: como criar um acionador de jobs de proteção de dados confidenciais.

Sobre jobs de inspeção e gatilhos de jobs

Quando a proteção de dados sensíveis executa uma verificação de inspeção para identificar dados sensíveis, cada verificação é executada como um job. A proteção de dados sensíveis cria e executa um recurso de job sempre que você pede para inspecionar os repositórios de armazenamento do Google Cloud, incluindo buckets do Cloud Storage, tabelas do BigQuery, tipos do Datastore e dados externos.

Para programar jobs de verificação de inspeção de proteção de dados confidenciais, crie acionadores de jobs. Um acionador de jobs automatiza a criação de jobs de proteção de dados sensíveis periodicamente e também pode ser executado sob demanda.

Para saber mais sobre jobs e acionadores de jobs na proteção de dados sensíveis, consulte a página conceitual Jobs e gatilhos de jobs.

Criar um novo job de inspeção

Para criar um novo job de inspeção de proteção de dados sensíveis, faça o seguinte:

Console

Na seção "Proteção de dados sensíveis" do console do Google Cloud, acesse a página Criar job ou gatilho de jobs.

Acessar "Criar job ou gatilho de jobs"

A página Criar job ou gatilho de jobs contém as seguintes seções:

Escolher dados de entrada
Configurar detecção
Adicionar ações
Revisão

Escolher dados de entrada

Nome

Insira um nome para o job. Use letras, números e hifens. Nomear o job é opcional. Se você não informar um nome, a proteção de dados sensíveis vai atribuir ao job um identificador de número exclusivo.

Local

No menu Tipo de armazenamento, escolha o tipo de repositório que armazena os dados que você quer verificar:

Cloud Storage: digite o URL do bucket que você quer verificar ou escolha Incluir/excluir no menu Tipo de local e clique em Procurar para navegar até o bucket ou a subpasta que você quer verificar. Marque a caixa de seleção Verificar pasta recursivamente para verificar o diretório especificado e todos os diretórios contidos. Deixe-a desmarcada para verificar apenas o diretório especificado e não mais profundamente.
BigQuery: insira os identificadores do projeto, o conjunto de dados e a tabela que você quer verificar.
Datastore: insira os identificadores do projeto, o namespace (opcional) e o tipo que você quer verificar.
Híbrido: é possível adicionar rótulos obrigatórios e opcionais e opções para lidar com dados tabulares. Para mais informações, consulte Tipos de metadados que você pode fornecer.

Amostragem

A amostragem é uma forma opcional de economizar recursos, se você tiver uma quantidade muito grande de dados.

Em Amostragem, escolha se você quer verificar todos os dados selecionados ou criar amostras dos dados verificando uma determinada porcentagem. A amostragem funciona de maneira diferente, dependendo do tipo de repositório de armazenamento que você está verificando:

Para o BigQuery, é possível criar uma amostra de um subconjunto do total de linhas selecionadas, correspondendo à porcentagem de arquivos especificada a ser incluída na verificação.
Para o Cloud Storage, se algum arquivo exceder o tamanho especificado em Tamanho máximo de bytes a ser verificado por arquivo, a proteção de dados sensíveis verificará o arquivo até esse tamanho máximo e, em seguida, avançará para o próximo arquivo.

Para ativar a amostragem, escolha uma das seguintes opções no primeiro menu:

Comece a amostragem de cima para baixo: a proteção de dados sensíveis inicia a verificação parcial no início dos dados. Para o BigQuery, isso inicia a verificação na primeira linha. Para o Cloud Storage, isso inicia a verificação no início de cada arquivo e para a verificação depois que a proteção de dados sensíveis é verificada até qualquer tamanho máximo de arquivo especificado.
Iniciar amostragem do início aleatório: a proteção de dados confidenciais inicia a verificação parcial em um local aleatório nos dados. Para o BigQuery, isso inicia a verificação em uma linha aleatória. Para o Cloud Storage, essa configuração só se aplica a arquivos que excedam qualquer tamanho máximo especificado. A proteção de dados confidenciais verifica os arquivos com o tamanho máximo na íntegra e os arquivos acima do tamanho máximo até o máximo.

Para realizar uma verificação parcial, também é necessário escolher qual porcentagem dos dados você quer verificar. Use o controle deslizante para definir a porcentagem.

Também é possível restringir os arquivos ou registros a serem verificados por data. Para saber como, consulte Programar, mais adiante neste tópico.

Configuração avançada

Ao criar um job para uma verificação de buckets do Cloud Storage ou tabelas do BigQuery, restrinja a pesquisa especificando uma configuração avançada. Mais especificamente, é possível configurar estes elementos:

Arquivos (somente Cloud Storage): os tipos de arquivos a serem verificados, que incluem arquivos de texto, binários e de imagem.
Campos de identificação (somente BigQuery): identificadores de linha exclusivos na tabela.
Para o Cloud Storage, se algum arquivo exceder o tamanho especificado em Tamanho máximo de bytes a ser verificado por arquivo, a proteção de dados sensíveis verificará o arquivo até esse tamanho máximo e, em seguida, avançará para o próximo arquivo.

Para ativar a amostragem, escolha a porcentagem dos dados que você quer verificar. Use o controle deslizante para definir a porcentagem. Em seguida, escolha uma das seguintes opções no primeiro menu:

Comece a amostragem de cima para baixo: a proteção de dados sensíveis inicia a verificação parcial no início dos dados. Para o BigQuery, isso inicia a verificação na primeira linha. Para o Cloud Storage, isso inicia a verificação no início de cada arquivo e para a verificação depois que a proteção de dados sensíveis é verificada até qualquer tamanho máximo de arquivo especificado (veja acima).
Iniciar amostragem do início aleatório: a proteção de dados confidenciais inicia a verificação parcial em um local aleatório nos dados. Para o BigQuery, isso inicia a verificação em uma linha aleatória. Para o Cloud Storage, essa configuração só se aplica a arquivos que excedam qualquer tamanho máximo especificado. A proteção de dados confidenciais verifica os arquivos com o tamanho máximo na íntegra e os arquivos acima do tamanho máximo até o máximo.

Arquivos

Para arquivos armazenados no Cloud Storage, especifique os tipos a serem incluídos na verificação em Arquivos.

Escolha entre arquivos binários, de texto, de imagem, CSV, TSV, Microsoft Word, Microsoft Excel, Microsoft Powerpoint, PDF e Apache Avro. Para conferir uma lista completa de extensões de arquivos que a proteção de dados sensíveis pode verificar em buckets do Cloud Storage, consulte FileType. Escolher Binário faz com que a proteção de dados sensíveis verifique os arquivos de tipos que não são reconhecidos.

Campos de identificação

Para tabelas no BigQuery, no campo Campos de identificação, é possível direcionar a proteção de dados sensíveis para incluir os valores das colunas de chave primária da tabela nos resultados. Isso permite vincular as descobertas às linhas da tabela que as contêm.

Insira os nomes das colunas que identificam exclusivamente cada linha na tabela. Se necessário, use a notação de ponto para especificar campos aninhados. Você pode adicionar quantos campos quiser.

Também é necessário ativar a ação Salvar no BigQuery para exportar as descobertas para o BigQuery. Quando as descobertas são exportadas para o BigQuery, cada uma delas contém os respectivos valores dos campos de identificação. Para mais informações, consulte identifyingFields.

Configurar detecção

A seção Configurar detecção é onde você especifica os tipos de dados confidenciais que quer verificar. A conclusão desta seção é opcional. Se você pular esta seção, a proteção de dados sensíveis verificará seus dados em busca de um conjunto padrão de infoTypes.

Modelo

Também é possível usar um modelo de proteção de dados sensíveis para reutilizar as informações de configuração especificadas anteriormente.

Se você já tiver criado um modelo que queira usar, clique no campo Nome do modelo para ver uma lista dos modelos de inspeção. Escolha ou digite o nome do modelo que você quer usar.

Para mais informações sobre como criar modelos, consulte Como criar modelos de inspeção de proteção de dados sensíveis.

InfoTypes

Os detectores InfoType encontram dados confidenciais de um determinado tipo. Por exemplo, o detector de infoType integrado US_SOCIAL_SECURITY_NUMBER de proteção de dados sensíveis encontra números da Previdência Social dos EUA. Além dos detectores de infoType integrados, é possível criar seus próprios detectores de infoType personalizados.

Em InfoTypes, escolha o detector infoType correspondente a um tipo de dados que você quer verificar. Não recomendamos deixar esta seção em branco. Isso faz com que a proteção de dados sensíveis verifique seus dados com um conjunto padrão de infoTypes, que podem incluir infoTypes que você não precisa. Para mais informações sobre cada detector, consulte a referência dos detectores InfoType.

Para mais informações sobre como gerenciar infoTypes integrados e personalizados nesta seção, consulte Gerenciar infoTypes por meio do console do Google Cloud.

Conjuntos de regras de inspeção

Limite de confiança

Sempre que detecta uma possível correspondência para dados sensíveis, a proteção de dados sensíveis atribui a eles um valor de probabilidade em uma escala de "Muito improvável" a "Muito provável". Ao definir um valor de probabilidade aqui, você instrui a proteção de dados sensíveis a fazer a correspondência apenas com dados que correspondem a esse valor ou superior.

O valor padrão "Possível" é suficiente para a maioria das finalidades. Se você normalmente recebe correspondências muito amplas, mova o controle deslizante para a direita. Se você recebe poucas correspondências, mova o controle deslizante para a esquerda.

Quando terminar, clique em Continuar.

Adicionar ações

Na etapa Adicionar ações, selecione uma ou mais ações que você quer que a proteção de dados sensíveis realize após a conclusão do job.

É possível configurar as seguintes ações:

Salvar no BigQuery: salve os resultados do job de proteção de dados sensíveis em uma tabela do BigQuery. Antes de visualizar ou analisar os resultados, confira se o job foi concluído.

Sempre que uma verificação é executada, a proteção de dados sensíveis salva as descobertas na tabela do BigQuery que você especificou. As descobertas exportadas contêm detalhes sobre o local de cada descoberta e a probabilidade de correspondência. Se você quiser que cada descoberta inclua a string que corresponde ao detector de infoType, ative a opção Incluir citação.

Se você não especificar um ID de tabela, o BigQuery atribuirá um nome padrão a uma nova tabela na primeira vez que a verificação for executada. Se você especificar uma tabela atual, a proteção de dados sensíveis anexará as descobertas da verificação a ela.

Se as descobertas não forem salvas no BigQuery, os resultados da verificação conterão apenas estatísticas sobre o número e os infoTypes delas.

Quando os dados são gravados em uma tabela do BigQuery, o faturamento e o uso de cota são aplicados ao projeto que contém a tabela de destino.
Publicar no Pub/Sub: publique uma notificação com o nome do job de proteção de dados sensíveis como um atributo para um canal do Pub/Sub. É possível especificar um ou mais tópicos para enviar a mensagem de notificação. Garanta que a conta de serviço de proteção de dados sensíveis que executa o job de verificação tenha acesso de publicação no tópico.

Observação :se houver problemas de configuração ou permissão com o tópico do Pub/Sub, a proteção de dados sensíveis tentará enviar a notificação do Pub/Sub por até duas semanas. Depois de duas semanas, a notificação é descartada.
Publicar no Security Command Center: publique um resumo dos resultados do job no Security Command Center. Para mais informações, acesse Enviar resultados da verificação da proteção de dados sensíveis ao Security Command Center.
Publicar no Dataplex: envie os resultados do job para o Dataplex, o serviço de gerenciamento de metadados do Google Cloud.
Notificar por e-mail: envie um e-mail quando o job for concluído. O e-mail vai para os proprietários do projeto do IAM e os Contatos essenciais.
Publicar no Cloud Monitoring: envie os resultados da inspeção para o Cloud Monitoring no pacote de operações do Google Cloud.
Fazer uma cópia desidentificada: desidentifique todas as descobertas nos dados inspecionados e grave o conteúdo desidentificado em um novo arquivo. É possível usar a cópia desidentificada nos processos comerciais, no lugar dos dados que contêm informações confidenciais. Para mais informações, consulte Criar uma cópia desidentificada dos dados do Cloud Storage usando a proteção de dados sensíveis no Console do Google Cloud.

Para mais informações, consulte Ações.

Quando terminar de selecionar ações, clique em Continuar.

Revisar

A seção Revisar contém um resumo formatado em JSON das configurações do job recém-especificado.

Clique em Criar para criar o job (se não tiver especificado uma programação) e executar o job uma vez. A página de informações do job é exibida, que contém status e outras informações. Se o job estiver em execução no momento, será possível clicar no botão Cancelar para interrompê-lo. Também é possível excluir o job clicando em Excluir.

Para retornar à página principal da Proteção de dados sensíveis, clique na seta Voltar no console do Google Cloud.

C#

Para saber como instalar e usar a biblioteca de cliente para proteção de dados sensíveis, consulte Bibliotecas de cliente de proteção de dados sensíveis.

Para usar a proteção de dados sensíveis, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.

Como criar e programar jobs de inspeção de proteção de dados sensíveis

Sobre jobs de inspeção e gatilhos de jobs

Criar um novo job de inspeção

Console

Escolher dados de entrada

Nome

Local

Amostragem

Configuração avançada

Arquivos

Campos de identificação

Configurar detecção

Modelo

InfoTypes

Conjuntos de regras de inspeção

Limite de confiança

Adicionar ações

Revisar

C#

Go

Java

Node.js

PHP

Python

REST

Criar um novo gatilho de job

Console

Escolher dados de entrada

Nome

Local

Amostragem

Configuração avançada

Arquivos

Campos de identificação

Configurar detecção

Modelo

InfoTypes

InfoTypes personalizados

Conjuntos de regras de inspeção

Limite de confiança

Adicionar ações

Programar

Revisar

C#

Go

Java

Node.js

PHP

Python

REST

Listar todos os jobs

Console

C#

Go

Java

Node.js

PHP

Python

REST

Listar todos os gatilhos de job

Console

C#

Go

Java

Node.js

PHP

Python

REST

Excluir um job

Console

C#

Go

Java

Node.js

PHP

Python

REST

Excluir gatilhos de jobs

Console

C#