Detectores de infoType personalizados

A proteção de dados sensíveis contém muitos detectores de infoType integrados, mas você também pode criar seus próprios. É possível personalizar o comportamento de detecção definindo seus próprios detectores de infoType personalizados para que a proteção de dados sensíveis inspecione ou desidentifique os dados confidenciais que correspondem aos padrões especificados. Estes são os tipos de detectores de infoType personalizados:

  • Os detectores de dicionários personalizados regulares são listas simples de palavras e frases que a proteção de dados sensíveis faz a correspondência. Use-os quando tiver até centenas de milhares de palavras.
  • Grandes detectores de dicionários personalizados são gerados pela proteção de dados sensíveis usando grandes listas de palavras ou frases armazenadas no Cloud Storage ou no BigQuery. Use detectores de dicionários personalizados grandes quando tiver uma lista grande de palavras ou frases, até dezenas de milhões.
  • Os detectores de expressão regular (regex) permitem que a proteção de dados sensíveis detecte correspondências com base em um padrão de expressão regular.
  • Os detectores de infoType alternativos detectam a saída da transformação de desidentificação da proteção de dados sensíveis CryptoReplaceFfxFpeConfig. Esse detector de infoType personalizado só é usado com o método content:reidentify para reverter a desidentificação com criptografia de preservação de formato (FPE, na sigla em inglês) no modo FFX. Por esse motivo, os substitutos não são descritos em detalhes nesses tópicos. Para mais informações sobre como e quando usar detectores de infoType personalizados alternativos, consulte Pseudonimização.

Além disso, a proteção de dados sensíveis inclui o conceito de regras de inspeção. Elas permitem ajustar os resultados da verificação usando o seguinte:

  • Regras de exclusão, que permitem excluir descobertas falsas ou indesejadas adicionando regras a um detector de infoType integrado ou personalizado.
  • Regras de hotword permitem aumentar a quantidade ou a precisão das descobertas retornadas adicionando regras a um detector de infoType integrado ou personalizado.

Para saber mais sobre detectores de infoType personalizados, consulte a página conceitual InfoTypes e detectores de infoType. Para acessar exemplos que podem ser usados ou alterados de acordo com sua necessidade, consulte Exemplos de detectores de infoType personalizados. No restante deste tópico, descrevemos como usar a proteção de dados sensíveis para criar seus próprios detectores de infoType personalizados.

Onde usar detectores de infoType personalizados

Os detectores de infoType personalizados são definidos no objeto CustomInfoType. Especifique um CustomInfoType no objeto InspectConfig ao configurar o seguinte:

Visão geral da API

O objeto CustomInfoType permite criar um detector de infoType personalizado para novos conteúdos ou ajustar os resultados retornados por detectores de infoType predefinidos.

O objeto CustomInfoType é composto pelos seguintes campos, que são definidos conforme descrito:

  • "infotype": o nome do detector de infoType personalizado, contido em um objeto InfoType.
  • "likelihood": o valor Likelihood padrão para retornar a este detector de infoType personalizado. Especifique valores Likelihood alternativos em "detectionRules" que substituirão esse Likelihood básico se a descoberta atender aos critérios especificados pela regra. Se você não incluir o campo "likelihood", o detector de infoType personalizado assumirá o padrão VERY_LIKELY. Para mais informações sobre probabilidades, consulte a página de conceito Probabilidade.
  • "detectionRules": um conjunto de objetos DetectionRule a ser aplicado adicionalmente a todas as descobertas desse detector de infoType personalizado. É aqui que você especifica as regras de hotword, como objetos HotwordRule. As regras são aplicadas na ordem em que são especificadas. Esse campo não se aplica a objetos SurrogateType.
  • "sensitivityScore": o valor SensitivityScore a ser retornado para esse detector de infoType personalizado. Se você não incluir o campo "sensitivityScore", o detector de infoType personalizado será padronizado como VERY_LIKELY.

    As pontuações de sensibilidade são usadas em perfis de dados. Ao criar o perfil dos dados, a proteção de dados sensíveis usa as pontuações de sensibilidade dos infoTypes para calcular o nível de sensibilidade.

  • Um dos seguintes campos, dependendo do tipo de detector de infoType personalizado que você está criando:

    • "dictionary": um objeto Dictionary, que contém uma lista de palavras ou frases para pesquisar.
    • "regex": um objeto Regex, que contém um único padrão que define a expressão regular.
    • "surrogateType": um objeto SurrogateType, se presente, indica que o detector de infoType personalizado é alternativo. Para mais informações sobre como usar detectores de infoType personalizados alternativos, consulte Pseudonimização.
    • "storedType": uma referência a um objeto StoredInfoType existente. Esse campo é obrigatório ao criar um detector de dicionário personalizado grande. Embora você possa criar detectores de dicionários regulares ou de expressões regulares definindo esse campo, é mais simples criá-los definindo o campo dictionary ou regex, respectivamente.

Próximas etapas

Saiba mais sobre a criação de infoTypes personalizados nos seguintes tópicos: