Um job é uma ação executada pela proteção de dados sensíveis para verificar o conteúdo de dados confidenciais ou calcular o risco de reidentificação. A proteção de dados sensíveis cria e executa um recurso de job sempre que você pede para inspecionar os dados.
Atualmente, há dois tipos de vagas de proteção de dados sensíveis:
- Jobs de inspeção inspecionam o conteúdo de dados confidenciais de acordo com os critérios e geram relatórios resumidos de onde e de que tipo para dados confidenciais atuais.
- Jobs de análise de risco analisam dados desidentificados e retornam métricas sobre a probabilidade de reidentificação dos dados.
Crie acionadores de jobs para programar quando a proteção de dados sensíveis executa jobs. Um gatilho de job é um evento que automatiza a criação de jobs de proteção de dados sensíveis para verificar os repositórios de armazenamento do Google Cloud, incluindo buckets do Cloud Storage, tabelas do BigQuery e tipos do Datastore.
Os gatilhos de jobs permitem programar jobs de verificação definindo intervalos em que cada gatilho é desativado. Eles podem ser configurados para procurar novas descobertas desde a última verificação para ajudar a monitorar alterações ou adições ao conteúdo ou para gerar relatórios de descobertas atualizados. Os gatilhos programados são executados em um intervalo definido por você, de 1 a 60 dias.
Próximas etapas
Mais informações sobre como criar, editar e executar jobs e gatilhos de jobs nos seguintes tópicos:
- Como criar jobs de inspeção de proteção de dados sensíveis e acionadores de jobs
- Como medir o risco de reidentificação e divulgação. Aborda jobs de análise de risco.
Além disso, o seguinte guia de início rápido está disponível:
O objeto JobTrigger
Um gatilho de job é representado na API DLP pelo objeto JobTrigger
.
Campos de configuração do gatilho de job
Cada JobTrigger
contém vários campos de configuração, incluindo:
- o nome do gatilho, o nome de exibição e uma descrição;
- uma coleção de objetos
Trigger
, cada um contendo um objetoSchedule
, que define a recorrência da verificação em segundos. - Um objeto
InspectJobConfig
, que contém as informações de configuração do job acionado. - Uma enumeração de
Status
, que indica se o gatilho está ativo no momento; - campos de carimbo de data/hora que representam as datas de criação, atualização e última execução;
- uma coleção de objetos
Error
, se alguma tiver sido encontrada quando o gatilho foi ativado.
Métodos de gatilhos de jobs
Cada objeto JobTrigger
também inclui vários métodos integrados. É possível fazer o seguinte com esses métodos:
- Criar um novo gatilho de job:
projects.jobTriggers.create
- Atualizar um gatilho de job existente:
projects.jobTriggers.patch
- Excluir um gatilho de job existente:
projects.jobTriggers.delete
- Recuperar um gatilho de job atual, incluindo a configuração e o status dele:
projects.jobTriggers.get
- Liste todos os gatilhos de jobs existentes:
projects.jobTriggers.list
Latência do job
Não há objetivos de nível de serviço (SLO) garantidos para jobs e acionadores de jobs. A latência é afetada por vários fatores, incluindo a quantidade de dados a serem verificados, o repositório de armazenamento que está sendo verificado, o tipo e o número de infoTypes que você está verificando, a região onde o job é processado e os recursos de computação disponíveis nessa região. Portanto, a latência dos jobs de inspeção não pode ser determinada com antecedência.
Para ajudar a reduzir a latência do job, tente o seguinte:
- Ative a amostragem se estiver disponível para o job ou o acionador de jobs.
Evite ativar os infoTypes que não são necessários. Embora as opções a seguir sejam úteis em certos cenários, esses infoTypes podem fazer solicitações a serem executadas muito mais lentamente do que as solicitações que não os incluem:
PERSON_NAME
FEMALE_NAME
MALE_NAME
FIRST_NAME
LAST_NAME
DATE_OF_BIRTH
LOCATION
STREET_ADDRESS
ORGANIZATION_NAME
Sempre especifique explicitamente os infoTypes. Não use uma lista de infoTypes vazias.
Se possível, use uma região de processamento diferente.
Se você ainda tiver problemas de latência com jobs depois de tentar essas técnicas,
considere usar solicitações
content.inspect
ou
content.deidentify
em vez de jobs. Esses métodos são cobertos pelo contrato de nível de serviço. Para mais informações, consulte o Contrato de nível de serviço de proteção de dados
sensíveis.
Limitar as verificações apenas a conteúdo novo
É possível configurar seu gatilho de jobs para definir automaticamente a data do período dos arquivos armazenados no Cloud Storage ou no BigQuery. Quando você define o objeto
TimespanConfig
para preenchimento automático, a proteção de dados sensíveis verifica apenas os dados
adicionados ou modificados desde a última execução do acionador:
...
timespan_config {
enable_auto_population_of_timespan_config: true
}
...
Acionar jobs ao carregar arquivos
Além do suporte a acionadores de jobs, que é integrado à proteção de dados sensíveis, o Google Cloud também tem vários componentes que podem ser usados para integrar ou acionar jobs de proteção de dados sensíveis. Por exemplo, é possível usar o Cloud Functions para acionar uma verificação de proteção de dados sensíveis sempre que um arquivo for enviado ao Cloud Storage.
Para informações sobre como configurar essa operação, consulte Como automatizar a classificação dos dados enviados ao Cloud Storage.