Cloud Data Loss Prevention (Cloud DLP) fait désormais partie de la protection des données sensibles. Le nom de l'API reste le même: API Cloud Data Loss Prevention (DLP). Pour en savoir plus sur les services qui constituent Sensitive Data Protection, consultez la section Présentation de Sensitive Data Protection.
Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Sensitive Data Protection comporte de nombreux détecteurs d'infoTypes intégrés, mais vous pouvez également créer les vôtres. Vous pouvez personnaliser le comportement de détection en définissant vos propres détecteurs d'infoTypes personnalisés. De cette façon, Sensitive Data Protection inspecte ou anonymise les données sensibles correspondant aux modèles que vous spécifiez. Voici les types de détecteurs d'infoTypes personnalisés :
Les détecteurs de dictionnaires personnalisés standards sont de simples listes de mots et d'expressions avec lesquels la protection des données sensibles recherche des correspondances. Utilisez-les lorsque vous disposez tout au plus de quelques centaines de milliers de mots.
Les détecteurs de dictionnaires personnalisés de grande taille sont générés par la protection des données sensibles à l'aide de listes volumineuses de mots ou d'expressions stockées dans Cloud Storage ou BigQuery. Utilisez ces détecteurs de dictionnaire personnalisés de grande taille lorsque vous disposez d'une longue liste de mots ou d'expressions (jusqu'à plusieurs dizaines de millions).
Les détecteurs d'expressions régulières (regex) permettent à la protection des données sensibles de détecter les correspondances basées sur un modèle d'expression régulière.
Les détecteurs d'InfoTypes de substitut détectent la sortie d'une transformation d'anonymisation Sensitive Data ProtectionCryptoReplaceFfxFpeConfig.
Ce détecteur d'infoType personnalisé ne s'utilise qu'avec la méthode content:reidentify pour inverser l'anonymisation à l'aide du chiffrement préservant le format (FPE, Format-Preserving Encryption) en mode FFX. Pour cette raison, les substituts ne sont pas décrits en détail dans ces articles. Pour savoir quand et comment utiliser les détecteurs d'infoTypes personnalisés de type substituts, consultez Pseudonymisation.
En outre, Sensitive Data Protection intègre le concept de règles d'inspection grâce auxquelles vous pouvez affiner les résultats de l'analyse à l'aide des éléments suivants :
L'ajout de règles d'exclusion à un détecteur d'infoTypes intégré ou personnalisé permet d'exclure des résultats faux ou indésirables.
L'ajout de règles relatives aux mots clés à un détecteur d'infoTypes intégré ou personnalisé permet d'augmenter la quantité ou d'améliorer l'exactitude des résultats renvoyés.
Pour en savoir plus sur les détecteurs d'infoTypes personnalisés, consultez la page de présentation des concepts liés aux InfoTypes et détecteurs d'InfoTypes. Pour obtenir des exemples que vous pouvez utiliser ou modifier à votre guise, consultez la page Exemples de détecteurs d'infoTypes personnalisés. La suite de cette page explique comment créer vos propres détecteurs d'infoTypes personnalisés à l'aide de la protection des données sensibles.
Où utiliser les détecteurs d'infoTypes personnalisés
Les détecteurs d'infoTypes personnalisés sont définis dans l'objet CustomInfoType. Vous spécifiez un infoType CustomInfoType dans l'objet InspectConfig lors de la configuration des éléments suivants :
Restauration, dans le contenu, des caractéristiques d'identification anonymisées par chiffrement FPE en mode Firefox à l'aide de projects.content.reidentify.
Ce scénario est spécifique aux détecteurs d'infoTypes personnalisés de type substituts.
Présentation de l'API
L'objet CustomInfoType vous permet de créer un détecteur d'infoType personnalisé pour analyser un nouveau contenu ou affiner les résultats renvoyés par les détecteurs d'infoTypes prédéfinis.
L'objet CustomInfoType comprend les champs ci-dessous définis comme suit :
"infotype" : nom du détecteur d'infoType personnalisé, contenu dans un objet InfoType.
"likelihood" : valeur de probabilité par défaut (Likelihood) à renvoyer pour ce détecteur d'infoType personnalisé. Vous pouvez spécifier d'autres valeurs Likelihood dans les règles "detectionRules" qui remplaceront la valeur Likelihood de base si le résultat répond aux critères spécifiés par la règle. Si vous omettez le champ "likelihood", le détecteur d'infoType personnalisé est définie sur VERY_LIKELY par défaut. Pour en savoir plus sur la probabilité, consultez la page consacrée au concept de probabilité.
"detectionRules" : ensemble d'objets DetectionRule supplémentaires à appliquer à tous les résultats correspondant à ce détecteur d'infoType personnalisé. Il s'agit du champ dans lequel vous spécifiez des règles relatives aux mots clés, sous forme d'objets HotwordRule. Les règles sont appliquées dans l'ordre dans lequel elles sont spécifiées. Ce champ ne s'applique pas aux objets de type SurrogateType.
"sensitivityScore" : valeur SensitivityScore à renvoyer pour ce détecteur d'infoType personnalisé. Si vous n'incluez pas le champ "sensitivityScore", le détecteur d'infoType personnalisé prend par défaut la valeur VERY_LIKELY.
Les scores de sensibilité sont utilisés dans les profils de données. Lorsque vous profilez vos données, la protection des données sensibles utilise les scores de sensibilité des infoTypes pour calculer le niveau de sensibilité.
L'un des champs suivants, selon le type de détecteur d'infoTypes personnalisé que vous créez :
"dictionary" : objet Dictionary contenant une liste de mots ou d'expressions à rechercher.
"regex" : objet Regex contenant un seul modèle définissant l'expression régulière.
"surrogateType" : objet SurrogateType qui, si il est présent, indique que le détecteur d'infoType personnalisé est un substitut. Pour plus d'informations sur l'utilisation des détecteurs d'infoTypes personnalisés de type substituts, consultez la page Pseudonymisation.
"storedType" : référence à un objet StoredInfoType existant. Ce champ est obligatoire lorsque vous créez un détecteur de dictionnaire personnalisé de grande taille. Bien que vous puissiez créer des détecteurs de dictionnaire standards ou des détecteurs d'expressions régulières en définissant ce champ, il est plus simple de les créer en définissant respectivement les champs dictionary ou regex.
Étapes suivantes
Vous pouvez en apprendre davantage sur la création d'infoTypes personnalisés dans les articles suivants :
Créer un détecteur de dictionnaire personnalisé de grande taille : découvrez comment trouver des correspondances sur la base d'une très longue liste de mots et d'expressions.
Les détecteurs d'infoTypes personnalisés stockés peuvent rechercher des correspondances sur plusieurs dizaines de millions de mots.
Personnaliser la probabilité de correspondance : découvrez comment utiliser les règles de détection et les mots clés pour personnaliser les valeurs de probabilité attribuées aux correspondances identifiées par un détecteur personnalisé.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[],[],null,["# Custom infoType detectors\n\nSensitive Data Protection contains many built-in [infoType\ndetectors](/sensitive-data-protection/docs/concepts-infotypes), but you can also create your own. You can\ncustomize detection behavior by defining your own *custom infoType detectors*,\nso that Sensitive Data Protection will inspect or de-identify sensitive data that\nmatches patterns that you specify. The following are the types of custom\ninfoType detectors:\n\n- *Regular custom dictionary detectors* are simple word and phrase lists that Sensitive Data Protection matches on. Use regular custom dictionary detectors when you have at most several hundred thousand words.\n- *Large custom dictionary detectors* are generated by Sensitive Data Protection using large lists of words or phrases stored in either Cloud Storage or BigQuery. Use large custom dictionary detectors when you have a large list of words or phrases---up to tens of millions.\n- *Regular expression (regex) detectors* enable Sensitive Data Protection to detect matches based on a regular expression pattern.\n- *Surrogate infoType detectors* detect output from Sensitive Data Protection de-identification transformation [`CryptoReplaceFfxFpeConfig`](/sensitive-data-protection/docs/reference/rest/v2/organizations.deidentifyTemplates#cryptoreplaceffxfpeconfig). This custom infoType detector is only used with the [`content:reidentify`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/reidentify) method to reverse de-identification using format-preserving encryption (FPE) in FFX mode. For this reason, surrogates are not extensively described in these topics. For more information about how and when to use surrogate custom infoType detectors, see [Pseudonymization](/sensitive-data-protection/docs/pseudonymization).\n\nIn addition, Sensitive Data Protection includes the concept of *inspection rules*,\nwhich enable you to fine-tune scan results using the following:\n\n- *Exclusion rules* enable you to exclude false or unwanted findings by adding rules to a built-in or custom infoType detector.\n- *Hotword rules* enable you to increase the quantity or accuracy of findings returned by adding rules to a built-in or custom infoType detector.\n\nTo learn more about custom infoType detectors, see the [InfoTypes and infoType\ndetectors](/sensitive-data-protection/docs/concepts-infotypes#custom) concept page. For several examples that\nyou can use or alter as you see fit, see [Examples of custom infoType\ndetectors](/sensitive-data-protection/docs/examples-custom-infotypes). The rest of this topic describes how to\nuse Sensitive Data Protection to create your own custom infoType detectors.\n\nWhere to use custom infoType detectors\n--------------------------------------\n\nCustom infoType detectors are defined in the\n[`CustomInfoType`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#CustomInfoType)\nobject. You specify a `CustomInfoType` in the\n[`InspectConfig`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig)\nobject when configuring the following:\n\n- Inspection using [`projects.content.inspect`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/inspect).\n- Inspection jobs inside [`InspectJobConfig`](/sensitive-data-protection/docs/reference/rest/v2/InspectJobConfig).\n- Inspection templates inside [`InspectTemplate`](/sensitive-data-protection/docs/reference/rest/v2/organizations.inspectTemplates#InspectTemplate).\n- De-identification using [`projects.content.deidentify`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/deidentify).\n- De-identification templates inside [`DeidentifyTemplate`](/sensitive-data-protection/docs/reference/rest/v2/projects.deidentifyTemplates#resource-deidentifytemplate).\n- Re-identification of content that has been de-identified with FPE in FFX mode using [`projects.content.reidentify`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/reidentify). This scenario is specific to surrogate custom infoType detectors.\n\nAPI overview\n------------\n\nThe\n[`CustomInfoType`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#CustomInfoType)\nobject allows you to create a custom infoType detector for new content or to\nfine-tune the results returned by pre-defined infoType detectors.\n\nThe `CustomInfoType` object is comprised of the following fields, which are set\nas described:\n\n- `\"infotype\"`: The name of the custom infoType detector, contained in an [`InfoType`](/sensitive-data-protection/docs/reference/rest/v2/InfoType) object.\n- `\"likelihood\"`: The default [`Likelihood`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#Likelihood) value to return for this custom infoType detector. You can specify alternate `Likelihood` values in `\"detectionRules\"` that will supersede this base `Likelihood` if the finding meets the criteria specified by the rule. If you don't include the `\"likelihood\"` field, the custom infoType detector defaults to `VERY_LIKELY`. For more information about likelihood, see the [Likelihood](/sensitive-data-protection/docs/likelihood) concept page.\n- `\"detectionRules\"`: A set of [`DetectionRule`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#DetectionRule) objects to additionally apply to all findings of this custom infoType detector. This is where you specify hotword rules, as [`HotwordRule`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#HotwordRule) objects. Rules are applied in the order in which they are specified. This field does not apply to `SurrogateType` objects.\n- `\"sensitivityScore\"`: The\n [`SensitivityScore`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#CustomInfoType.FIELDS.sensitivity_score)\n value to return for this custom infoType detector. If you don't include the\n `\"sensitivityScore\"` field, the custom infoType detector defaults to\n `VERY_LIKELY`.\n\n\n Sensitivity scores are used in [data profiles](/sensitive-data-protection/docs/data-profiles). When\n profiling your data, Sensitive Data Protection uses the sensitivity scores of the infoTypes to\n [calculate the sensitivity level](/sensitive-data-protection/docs/sensitivity-risk-calculation).\n\n\n- One of the following fields, depending on the kind of custom infoType\n detector you're creating:\n\n - `\"dictionary\"`: A [`Dictionary`](/sensitive-data-protection/docs/reference/rest/v2/Dictionary) object, which contains a list of words or phrases to search for.\n - `\"regex\"`: A [`Regex`](/sensitive-data-protection/docs/reference/rest/v2/Regex) object, which contains a single pattern defining the regular expression.\n - `\"surrogateType\"`: A [`SurrogateType`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#SurrogateType) object, if present, indicates that the custom infoType detector is a surrogate. For more information about how to use surrogate custom infoType detectors, see [Pseudonymization](/sensitive-data-protection/docs/pseudonymization).\n - `\"storedType\"`: A reference to an existing [`StoredInfoType`](/sensitive-data-protection/docs/reference/rest/v2/projects.locations.storedInfoTypes) object. This field is required when creating a large custom dictionary detector. Although you can create regular dictionary detectors or regular expression detectors by defining this field, it's simpler to create those by defining the `dictionary` field or `regex` field respectively.\n\nNext steps\n----------\n\nLearn more about creating custom infoTypes from the following topics:\n\n- [Creating a regular custom dictionary detector](/sensitive-data-protection/docs/creating-custom-infotypes-dictionary): Learn how to create a custom infoType detector to match findings on a list of words and phrases.\n- [Creating a large custom dictionary detector](/sensitive-data-protection/docs/creating-stored-infotypes): Learn how to match findings on a very large list of words and phrases. Stored custom infoType detectors can match on up to tens of millions of words.\n- [Creating a custom regex detector](/sensitive-data-protection/docs/creating-custom-infotypes-regex): Learn how to create a custom infoType detector to match findings on a regular expression.\n- [Modifying infoType detectors to refine scan results](/sensitive-data-protection/docs/creating-custom-infotypes-rules): Learn how to create modifiers for both built-in and custom infoType detectors that can fine-tune scan results.\n- [Customizing match likelihood](/sensitive-data-protection/docs/creating-custom-infotypes-likelihood): Learn how to use detection rules and hotwords to customize the likelihood values that are assigned to custom detector matches.\n- [Examples of custom infoType detectors](/sensitive-data-protection/docs/examples-custom-infotypes): Several example JSON custom infoType detector definitions that you can use or alter as you see fit."]]