A Proteção de dados sensíveis contém muitos detectores de infoType integrados, mas você também pode criar os seus. Personalize o comportamento de detecção definindo seus próprios detectores de infoType personalizados, para que a Proteção de dados sensíveis inspecione ou remova a identificação dos dados sensíveis que correspondem aos padrões especificados. Confira abaixo os tipos de detectores de infoType personalizados:
- Os detectores de dicionários personalizados regulares são listas de palavras e frases simples usadas como base para correspondências da Proteção de dados sensíveis. Use-os quando tiver até centenas de milhares de palavras.
- Os detectores de dicionários personalizados grandes são gerados pela Proteção de dados sensíveis usando grandes listas de palavras ou frases armazenadas no Cloud Storage ou no BigQuery. Use detectores de dicionário personalizados grandes quando tiver uma lista grande de palavras ou frases, até dezenas de milhões.
- Os detectores de expressões regulares (regex) permitem que a Proteção de dados sensíveis detecte correspondências com base em um padrão de expressão regular.
- Os detectores de infoType substitutos detectam a saída da transformação de desidentificação
CryptoReplaceFfxFpeConfig
da Proteção de dados sensíveis. Esse detector de infoType personalizado é usado apenas com o métodocontent:reidentify
para reverter a desidentificação usando criptografia de preservação de formato (FPE, na sigla em inglês) no modo FFX. Por esse motivo, os substitutos não são descritos em detalhes nesses tópicos. Para mais informações sobre como e quando usar detectores de infoType personalizados alternativos, consulte Pseudonimização.
Além disso, a Proteção de dados sensíveis inclui o conceito de regras de inspeção, que permitem ajustar os resultados da verificação usando estes itens:
- Regras de exclusão, que permitem excluir descobertas falsas ou indesejadas adicionando regras a um detector de infoType integrado ou personalizado.
- Regras de hotword permitem aumentar a quantidade ou a precisão das descobertas retornadas adicionando regras a um detector de infoType integrado ou personalizado.
Para saber mais sobre detectores de infoType personalizados, consulte a página conceitual InfoTypes e detectores de infoType. Para acessar exemplos que podem ser usados ou alterados de acordo com sua necessidade, consulte Exemplos de detectores de infoType personalizados. O restante deste tópico descreve como usar a Proteção de Dados Sensíveis para criar seus próprios detectores de infoType personalizados.
Onde usar detectores de infoType personalizados
Os detectores de infoType personalizados são definidos no objeto CustomInfoType
. Especifique um CustomInfoType
no objeto InspectConfig
ao configurar o seguinte:
- Inspeção usando
projects.content.inspect
. - Jobs de inspeção dentro de
InspectJobConfig
. - Modelos de inspeção dentro de
InspectTemplate
. - Desidentificação usando
projects.content.deidentify
. - Modelos de desidentificação dentro de
DeidentifyTemplate
. - Reidentificação de conteúdo que foi desidentificado com FPE no modo FFX usando
projects.content.reidentify
. Esse cenário é específico para detectores de infoType personalizados alternativos.
Visão geral da API
O objeto CustomInfoType
permite criar um detector de infoType personalizado para novos conteúdos ou ajustar os resultados retornados por detectores de infoType predefinidos.
O objeto CustomInfoType
é composto pelos seguintes campos, que são definidos conforme descrito:
"infotype"
: o nome do detector de infoType personalizado, contido em um objetoInfoType
."likelihood"
: o valorLikelihood
padrão para retornar a este detector de infoType personalizado. Especifique valoresLikelihood
alternativos em"detectionRules"
que substituirão esseLikelihood
básico se a descoberta atender aos critérios especificados pela regra. Se você não incluir o campo"likelihood"
, o detector de infoType personalizado assumirá o padrãoVERY_LIKELY
. Para mais informações sobre probabilidades, consulte a página de conceito Probabilidade."detectionRules"
: um conjunto de objetosDetectionRule
a ser aplicado adicionalmente a todas as descobertas desse detector de infoType personalizado. É aqui que você especifica as regras de hotword, como objetosHotwordRule
. As regras são aplicadas na ordem em que são especificadas. Esse campo não se aplica a objetosSurrogateType
."sensitivityScore"
: o valorSensitivityScore
a ser retornado para este detector de infoType personalizado. Se você não incluir o campo"sensitivityScore"
, o detector de infoType personalizado vai assumir o padrãoVERY_LIKELY
.Os escores de sensibilidade são usados em perfis de dados. Ao criar o perfil dos seus dados, a Proteção de Dados Sensíveis usa as pontuações de sensibilidade dos infoTypes para calcular o nível de confidencialidade.
Um dos seguintes campos, dependendo do tipo de detector de infoType personalizado que você está criando:
"dictionary"
: um objetoDictionary
, que contém uma lista de palavras ou frases para pesquisar."regex"
: um objetoRegex
, que contém um único padrão que define a expressão regular."surrogateType"
: um objetoSurrogateType
, se presente, indica que o detector de infoType personalizado é alternativo. Para mais informações sobre como usar detectores de infoType personalizados alternativos, consulte Pseudonimização."storedType"
: uma referência a um objetoStoredInfoType
existente. Este campo é obrigatório ao criar um detector de dicionário personalizado grande. Embora seja possível criar detectores de dicionário ou de expressão regular definindo esse campo, é mais simples criar esses detectores definindo o campodictionary
ouregex
, respectivamente.
Próximas etapas
Saiba mais sobre a criação de infoTypes personalizados nos seguintes tópicos:
- Como criar um detector de dicionário personalizado regular: aprenda a criar um detector de infoType personalizado para corresponder às descobertas em uma lista de palavras e frases.
- Como criar um detector de dicionário personalizado grande: aprenda a fazer correspondência com as descobertas em uma lista muito grande de palavras e frases. Os detectores de infoType personalizados armazenados podem fazer correspondências com dezenas de milhões de palavras.
- Como criar um detector de regex personalizado: aprenda a criar um detector de infoType personalizado para corresponder às descobertas em uma expressão regular.
- Como modificar os detectores de InfoType para refinar os resultados da verificação: aprenda a criar modificadores para os detectores de infoType integrados e personalizados que podem ajustar os resultados da verificação.
- Como personalizar a probabilidade de correspondência: aprenda a usar regras de detecção e hotwords para personalizar os valores de probabilidade atribuídos às correspondências de detectores personalizados.
- Exemplos de detectores de infoType personalizados: vários exemplos de definições de detectores de infoType personalizados JSON que você pode usar ou alterar conforme achar adequado.