Como criar detectores de infoType personalizados

O Cloud Data Loss Prevention (DLP) contém muitos detectores de infoType integrados, mas também é possível criá-los por conta própria. Personalize o comportamento de detecção definindo seus próprios detectores de infoType personalizados, de modo que o Cloud DLP inspecione ou desidentifique os dados confidenciais que correspondem aos padrões especificados. Há três tipos de detectores de infoType personalizados:

  • Os detectores de dicionários personalizados regulares são listas de palavras e frases simples usadas como base para correspondências do Cloud DLP. Use-os quando tiver até centenas de milhares de palavras.
  • Os detectores de dicionários personalizados armazenados são gerados pelo Cloud DLP por meio de listas grandes de palavras ou frases armazenadas no Cloud Storage ou no BigQuery. Use-os quando tiver uma lista grande de até dezenas de milhões de palavras ou frases.
  • As expressões regulares (regex) permitem que o Cloud DLP detecte correspondências com base em um padrão de expressão regular.

Além disso, o Cloud DLP inclui o conceito de regras de inspeção. Com elas, você ajusta os resultados da verificação usando estes itens:

  • Regras de exclusão, que permitem excluir descobertas falsas ou indesejadas adicionando regras a um detector de infoType integrado ou personalizado.
  • Regras de hotword permitem aumentar a quantidade ou a precisão das descobertas retornadas adicionando regras a um detector de infoType integrado ou personalizado.

Para saber mais sobre detectores de infoType personalizados, consulte a página conceitual InfoTypes e detectores de infoType. Para acessar exemplos que podem ser usados ou alterados de acordo com sua necessidade, consulte Exemplos de detectores de infoType personalizados. No restante deste tópico, descrevemos como você pode usar o Cloud DLP para criar seus próprios detectores de infoType personalizados.

Onde usar detectores de infoType personalizados

Os detectores de infoType personalizados são definidos no objeto CustomInfoType. Especifique um CustomInfoType no objeto InspectConfig ao configurar o seguinte:

Visão geral da API

O objeto CustomInfoType permite criar um detector de infoType personalizado para novos conteúdos ou ajustar os resultados retornados por detectores de infoType predefinidos.

O objeto CustomInfoType é composto pelos seguintes campos, que são definidos conforme descrito:

  • "infotype": o nome do detector de infoType personalizado, contido em um objeto InfoType.
  • "likelihood": o valor Likelihood padrão para retornar a este detector de infoType personalizado. Especifique valores Likelihood alternativos em "detectionRules" que substituirão esse Likelihood básico se a descoberta atender aos critérios especificados pela regra. Se você não incluir o campo "likelihood", o detector de infoType personalizado assumirá o padrão VERY_LIKELY. Para mais informações sobre probabilidades, consulte a página de conceito Probabilidade.
  • "detectionRules": um conjunto de objetos DetectionRule a ser aplicado adicionalmente a todas as descobertas desse detector de infoType personalizado. É aqui que você especifica as regras de hotword, como objetos HotwordRule. As regras são aplicadas na ordem em que são especificadas. Esse campo não se aplica a objetos SurrogateType.
  • Um dos seguintes campos, dependendo do tipo de detector de infoType personalizado que você está criando:

    • "dictionary": um objeto Dictionary, que contém uma lista de palavras ou frases para pesquisar.
    • "regex": um objeto Regex, que contém um único padrão que define a expressão regular.
    • "surrogateType": um objeto SurrogateType, se presente, indica que o detector de infoType personalizado é alternativo. Para mais informações sobre como usar detectores de infoType personalizados alternativos, consulte Pseudonimização.

Próximas etapas

Saiba mais sobre a criação de infoTypes personalizados nos seguintes tópicos: