O Cloud Data Loss Prevention (Cloud DLP) agora faz parte da Proteção de dados sensíveis. O nome da API continua o mesmo: API Cloud Data Loss Prevention (DLP). Para saber mais sobre os serviços que compõem a Proteção de dados sensíveis, consulte Visão geral da Proteção de dados sensíveis.
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
A Proteção de Dados Sensíveis contém muitos detectores de infoType integrados, mas também é possível criar os seus próprios. Personalize o comportamento de detecção definindo seus próprios detectores de infoType personalizados, de modo que a proteção de dados sensíveis inspecione ou remova a identificação dos dados sensíveis que correspondem aos padrões especificados. Estes são os tipos de detectores de infoType personalizados:
Os detectores de dicionários personalizados regulares são listas de palavras e frases simples usadas como base para correspondências da proteção de dados sensíveis. Use-os quando tiver até centenas de milhares de palavras.
Os detectores de dicionários personalizados grandes são gerados pela Proteção de dados sensíveis
usando grandes listas de palavras ou frases armazenadas no Cloud Storage ou no
BigQuery. Use detectores de dicionário personalizados grandes quando tiver uma lista grande de palavras ou frases, até dezenas de milhões.
Os detectores de expressões regulares (regex) permitem que a Proteção de dados sensíveis
detecte correspondências com base em um padrão de expressão regular.
Os detectores de infoType alternativos detectam a saída da transformação de desidentificação da Proteção de dados confidenciais
CryptoReplaceFfxFpeConfig.
Esse detector de infoType personalizado é usado apenas com o método content:reidentify para reverter a desidentificação com criptografia de preservação de formato (FPE, na sigla em inglês) no modo FFX. Por esse motivo, os substitutos não são descritos em detalhes nestes tópicos. Para mais informações sobre como e quando usar detectores de infoType personalizados alternativos, consulte Pseudonimização.
Além disso, a Proteção de dados sensíveis inclui o conceito de regras de inspeção. Com elas, você ajusta os resultados da verificação usando estes itens:
Regras de exclusão, que permitem excluir descobertas falsas ou indesejadas adicionando regras a um detector de infoType integrado ou personalizado.
Regras de hotword permitem aumentar a quantidade ou a precisão das descobertas retornadas adicionando regras a um detector de infoType integrado ou personalizado.
Para saber mais sobre detectores de infoType personalizados, consulte a página conceitual InfoTypes e detectores de infoType. Para acessar exemplos que podem ser usados ou alterados de acordo com sua necessidade, consulte Exemplos de detectores de infoType personalizados. No restante deste tópico, descrevemos como você pode usar a Proteção de Dados Sensíveis para criar seus próprios detectores de infoType personalizados.
Onde usar detectores de infoType personalizados
Os detectores de infoType personalizados são definidos no objeto CustomInfoType. Especifique um CustomInfoType no objeto InspectConfig ao configurar o seguinte:
Reidentificação de conteúdo que foi desidentificado com FPE no modo FFX usando projects.content.reidentify.
Esse cenário é específico para detectores de infoType personalizados alternativos.
Visão geral da API
O objeto CustomInfoType permite criar um detector de infoType personalizado para novos conteúdos ou ajustar os resultados retornados por detectores de infoType predefinidos.
O objeto CustomInfoType é composto pelos seguintes campos, que são definidos conforme descrito:
"infotype": o nome do detector de infoType personalizado, contido em um objeto InfoType.
"likelihood": o valor Likelihood padrão para retornar a este detector de infoType personalizado. Especifique valores Likelihood alternativos em "detectionRules" que substituirão esse Likelihood básico se a descoberta atender aos critérios especificados pela regra. Se você não incluir o campo "likelihood", o detector de infoType personalizado assumirá o padrão VERY_LIKELY. Para mais informações sobre probabilidades, consulte a página de conceito Probabilidade.
"detectionRules": um conjunto de objetos DetectionRule a ser aplicado adicionalmente a todas as descobertas desse detector de infoType personalizado. É aqui que você especifica as regras de hotword, como objetos HotwordRule. As regras são aplicadas na ordem em que são especificadas. Esse campo não se aplica a objetos SurrogateType.
"sensitivityScore": o valor SensitivityScore a ser retornado para esse detector de infoType personalizado. Se você não incluir o campo
"sensitivityScore", o detector de infoType personalizado será definido como
VERY_LIKELY por padrão.
As pontuações de sensibilidade são usadas em perfis de dados. Ao criar perfis dos seus dados, a Proteção de dados sensíveis usa as pontuações de sensibilidade dos infoTypes para calcular o nível de sensibilidade.
Um dos seguintes campos, dependendo do tipo de detector de infoType personalizado que você está criando:
"dictionary": um objeto Dictionary, que contém uma lista de palavras ou frases para pesquisar.
"regex": um objeto Regex, que contém um único padrão que define a expressão regular.
"surrogateType": um objeto SurrogateType, se presente, indica que o detector de infoType personalizado é alternativo. Para mais informações sobre como usar detectores de infoType personalizados alternativos, consulte Pseudonimização.
"storedType": uma referência a um objeto
StoredInfoType
existente. Este campo é obrigatório ao criar um detector de dicionário personalizado grande. Embora seja possível criar detectores de dicionário ou de expressão regular definindo esse campo, é mais simples criar esses detectores definindo os campos dictionary ou regex, respectivamente.
Próximas etapas
Saiba mais sobre a criação de infoTypes personalizados nos seguintes tópicos:
Como criar um detector de dicionário personalizado grande: aprenda a corresponder as descobertas em uma lista muito grande de palavras e frases.
Os detectores de infoType personalizados armazenados podem fazer correspondências com dezenas de milhões de palavras.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-04 UTC."],[],[],null,["# Custom infoType detectors\n\nSensitive Data Protection contains many built-in [infoType\ndetectors](/sensitive-data-protection/docs/concepts-infotypes), but you can also create your own. You can\ncustomize detection behavior by defining your own *custom infoType detectors*,\nso that Sensitive Data Protection will inspect or de-identify sensitive data that\nmatches patterns that you specify. The following are the types of custom\ninfoType detectors:\n\n- *Regular custom dictionary detectors* are simple word and phrase lists that Sensitive Data Protection matches on. Use regular custom dictionary detectors when you have at most several hundred thousand words.\n- *Large custom dictionary detectors* are generated by Sensitive Data Protection using large lists of words or phrases stored in either Cloud Storage or BigQuery. Use large custom dictionary detectors when you have a large list of words or phrases---up to tens of millions.\n- *Regular expression (regex) detectors* enable Sensitive Data Protection to detect matches based on a regular expression pattern.\n- *Surrogate infoType detectors* detect output from Sensitive Data Protection de-identification transformation [`CryptoReplaceFfxFpeConfig`](/sensitive-data-protection/docs/reference/rest/v2/organizations.deidentifyTemplates#cryptoreplaceffxfpeconfig). This custom infoType detector is only used with the [`content:reidentify`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/reidentify) method to reverse de-identification using format-preserving encryption (FPE) in FFX mode. For this reason, surrogates are not extensively described in these topics. For more information about how and when to use surrogate custom infoType detectors, see [Pseudonymization](/sensitive-data-protection/docs/pseudonymization).\n\nIn addition, Sensitive Data Protection includes the concept of *inspection rules*,\nwhich enable you to fine-tune scan results using the following:\n\n- *Exclusion rules* enable you to exclude false or unwanted findings by adding rules to a built-in or custom infoType detector.\n- *Hotword rules* enable you to increase the quantity or accuracy of findings returned by adding rules to a built-in or custom infoType detector.\n\nTo learn more about custom infoType detectors, see the [InfoTypes and infoType\ndetectors](/sensitive-data-protection/docs/concepts-infotypes#custom) concept page. For several examples that\nyou can use or alter as you see fit, see [Examples of custom infoType\ndetectors](/sensitive-data-protection/docs/examples-custom-infotypes). The rest of this topic describes how to\nuse Sensitive Data Protection to create your own custom infoType detectors.\n\nWhere to use custom infoType detectors\n--------------------------------------\n\nCustom infoType detectors are defined in the\n[`CustomInfoType`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#CustomInfoType)\nobject. You specify a `CustomInfoType` in the\n[`InspectConfig`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig)\nobject when configuring the following:\n\n- Inspection using [`projects.content.inspect`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/inspect).\n- Inspection jobs inside [`InspectJobConfig`](/sensitive-data-protection/docs/reference/rest/v2/InspectJobConfig).\n- Inspection templates inside [`InspectTemplate`](/sensitive-data-protection/docs/reference/rest/v2/organizations.inspectTemplates#InspectTemplate).\n- De-identification using [`projects.content.deidentify`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/deidentify).\n- De-identification templates inside [`DeidentifyTemplate`](/sensitive-data-protection/docs/reference/rest/v2/projects.deidentifyTemplates#resource-deidentifytemplate).\n- Re-identification of content that has been de-identified with FPE in FFX mode using [`projects.content.reidentify`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/reidentify). This scenario is specific to surrogate custom infoType detectors.\n\nAPI overview\n------------\n\nThe\n[`CustomInfoType`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#CustomInfoType)\nobject allows you to create a custom infoType detector for new content or to\nfine-tune the results returned by pre-defined infoType detectors.\n\nThe `CustomInfoType` object is comprised of the following fields, which are set\nas described:\n\n- `\"infotype\"`: The name of the custom infoType detector, contained in an [`InfoType`](/sensitive-data-protection/docs/reference/rest/v2/InfoType) object.\n- `\"likelihood\"`: The default [`Likelihood`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#Likelihood) value to return for this custom infoType detector. You can specify alternate `Likelihood` values in `\"detectionRules\"` that will supersede this base `Likelihood` if the finding meets the criteria specified by the rule. If you don't include the `\"likelihood\"` field, the custom infoType detector defaults to `VERY_LIKELY`. For more information about likelihood, see the [Likelihood](/sensitive-data-protection/docs/likelihood) concept page.\n- `\"detectionRules\"`: A set of [`DetectionRule`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#DetectionRule) objects to additionally apply to all findings of this custom infoType detector. This is where you specify hotword rules, as [`HotwordRule`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#HotwordRule) objects. Rules are applied in the order in which they are specified. This field does not apply to `SurrogateType` objects.\n- `\"sensitivityScore\"`: The\n [`SensitivityScore`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#CustomInfoType.FIELDS.sensitivity_score)\n value to return for this custom infoType detector. If you don't include the\n `\"sensitivityScore\"` field, the custom infoType detector defaults to\n `VERY_LIKELY`.\n\n\n Sensitivity scores are used in [data profiles](/sensitive-data-protection/docs/data-profiles). When\n profiling your data, Sensitive Data Protection uses the sensitivity scores of the infoTypes to\n [calculate the sensitivity level](/sensitive-data-protection/docs/sensitivity-risk-calculation).\n\n\n- One of the following fields, depending on the kind of custom infoType\n detector you're creating:\n\n - `\"dictionary\"`: A [`Dictionary`](/sensitive-data-protection/docs/reference/rest/v2/Dictionary) object, which contains a list of words or phrases to search for.\n - `\"regex\"`: A [`Regex`](/sensitive-data-protection/docs/reference/rest/v2/Regex) object, which contains a single pattern defining the regular expression.\n - `\"surrogateType\"`: A [`SurrogateType`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#SurrogateType) object, if present, indicates that the custom infoType detector is a surrogate. For more information about how to use surrogate custom infoType detectors, see [Pseudonymization](/sensitive-data-protection/docs/pseudonymization).\n - `\"storedType\"`: A reference to an existing [`StoredInfoType`](/sensitive-data-protection/docs/reference/rest/v2/projects.locations.storedInfoTypes) object. This field is required when creating a large custom dictionary detector. Although you can create regular dictionary detectors or regular expression detectors by defining this field, it's simpler to create those by defining the `dictionary` field or `regex` field respectively.\n\nNext steps\n----------\n\nLearn more about creating custom infoTypes from the following topics:\n\n- [Creating a regular custom dictionary detector](/sensitive-data-protection/docs/creating-custom-infotypes-dictionary): Learn how to create a custom infoType detector to match findings on a list of words and phrases.\n- [Creating a large custom dictionary detector](/sensitive-data-protection/docs/creating-stored-infotypes): Learn how to match findings on a very large list of words and phrases. Stored custom infoType detectors can match on up to tens of millions of words.\n- [Creating a custom regex detector](/sensitive-data-protection/docs/creating-custom-infotypes-regex): Learn how to create a custom infoType detector to match findings on a regular expression.\n- [Modifying infoType detectors to refine scan results](/sensitive-data-protection/docs/creating-custom-infotypes-rules): Learn how to create modifiers for both built-in and custom infoType detectors that can fine-tune scan results.\n- [Customizing match likelihood](/sensitive-data-protection/docs/creating-custom-infotypes-likelihood): Learn how to use detection rules and hotwords to customize the likelihood values that are assigned to custom detector matches.\n- [Examples of custom infoType detectors](/sensitive-data-protection/docs/examples-custom-infotypes): Several example JSON custom infoType detector definitions that you can use or alter as you see fit."]]