Cloud Data Loss Prevention (Cloud DLP) fait désormais partie de la protection des données sensibles. Le nom de l'API reste le même: API Cloud Data Loss Prevention (DLP). Pour en savoir plus sur les services qui constituent Sensitive Data Protection, consultez la section Présentation de Sensitive Data Protection.

Cette page a été traduite par l'API Cloud Translation.

Détecteurs d'infoTypes personnalisés

Sensitive Data Protection comporte de nombreux détecteurs d'infoTypes intégrés, mais vous pouvez également créer les vôtres. Vous pouvez personnaliser le comportement de détection en définissant vos propres détecteurs d'infoTypes personnalisés. De cette façon, Sensitive Data Protection inspecte ou anonymise les données sensibles correspondant aux modèles que vous spécifiez. Voici les types de détecteurs d'infoTypes personnalisés :

Les détecteurs de dictionnaires personnalisés standards sont de simples listes de mots et d'expressions avec lesquels la protection des données sensibles recherche des correspondances. Utilisez-les lorsque vous disposez tout au plus de quelques centaines de milliers de mots.
Les détecteurs de dictionnaires personnalisés de grande taille sont générés par la protection des données sensibles à l'aide de listes volumineuses de mots ou d'expressions stockées dans Cloud Storage ou BigQuery. Utilisez ces détecteurs de dictionnaire personnalisés de grande taille lorsque vous disposez d'une longue liste de mots ou d'expressions (jusqu'à plusieurs dizaines de millions).
Les détecteurs d'expressions régulières (regex) permettent à la protection des données sensibles de détecter les correspondances basées sur un modèle d'expression régulière.
Les détecteurs d'InfoTypes de substitut détectent la sortie d'une transformation d'anonymisation Sensitive Data ProtectionCryptoReplaceFfxFpeConfig. Ce détecteur d'infoType personnalisé ne s'utilise qu'avec la méthode content:reidentify pour inverser l'anonymisation à l'aide du chiffrement préservant le format (FPE, Format-Preserving Encryption) en mode FFX. Pour cette raison, les substituts ne sont pas décrits en détail dans ces articles. Pour savoir quand et comment utiliser les détecteurs d'infoTypes personnalisés de type substituts, consultez Pseudonymisation.

En outre, Sensitive Data Protection intègre le concept de règles d'inspection grâce auxquelles vous pouvez affiner les résultats de l'analyse à l'aide des éléments suivants :

L'ajout de règles d'exclusion à un détecteur d'infoTypes intégré ou personnalisé permet d'exclure des résultats faux ou indésirables.
L'ajout de règles relatives aux mots clés à un détecteur d'infoTypes intégré ou personnalisé permet d'augmenter la quantité ou d'améliorer l'exactitude des résultats renvoyés.

Pour en savoir plus sur les détecteurs d'infoTypes personnalisés, consultez la page de présentation des concepts liés aux InfoTypes et détecteurs d'InfoTypes. Pour obtenir des exemples que vous pouvez utiliser ou modifier à votre guise, consultez la page Exemples de détecteurs d'infoTypes personnalisés. La suite de cette page explique comment créer vos propres détecteurs d'infoTypes personnalisés à l'aide de la protection des données sensibles.

Où utiliser les détecteurs d'infoTypes personnalisés

Les détecteurs d'infoTypes personnalisés sont définis dans l'objet CustomInfoType. Vous spécifiez un infoType CustomInfoType dans l'objet InspectConfig lors de la configuration des éléments suivants :

Inspection à l'aide de projects.content.inspect
Tâches d'inspection dans InspectJobConfig
Modèles d'inspection dans InspectTemplate
Anonymisation à l'aide de projects.content.deidentify
Modèles d'anonymisation dans DeidentifyTemplate
Restauration, dans le contenu, des caractéristiques d'identification anonymisées par chiffrement FPE en mode Firefox à l'aide de projects.content.reidentify. Ce scénario est spécifique aux détecteurs d'infoTypes personnalisés de type substituts.

Présentation de l'API

L'objet CustomInfoType vous permet de créer un détecteur d'infoType personnalisé pour analyser un nouveau contenu ou affiner les résultats renvoyés par les détecteurs d'infoTypes prédéfinis.

L'objet CustomInfoType comprend les champs ci-dessous définis comme suit :

"infotype" : nom du détecteur d'infoType personnalisé, contenu dans un objet InfoType.
"likelihood" : valeur de probabilité par défaut (Likelihood) à renvoyer pour ce détecteur d'infoType personnalisé. Vous pouvez spécifier d'autres valeurs Likelihood dans les règles "detectionRules" qui remplaceront la valeur Likelihood de base si le résultat répond aux critères spécifiés par la règle. Si vous omettez le champ "likelihood", le détecteur d'infoType personnalisé est définie sur VERY_LIKELY par défaut. Pour en savoir plus sur la probabilité, consultez la page consacrée au concept de probabilité.
"detectionRules" : ensemble d'objets DetectionRule supplémentaires à appliquer à tous les résultats correspondant à ce détecteur d'infoType personnalisé. Il s'agit du champ dans lequel vous spécifiez des règles relatives aux mots clés, sous forme d'objets HotwordRule. Les règles sont appliquées dans l'ordre dans lequel elles sont spécifiées. Ce champ ne s'applique pas aux objets de type SurrogateType.
"sensitivityScore" : valeur SensitivityScore à renvoyer pour ce détecteur d'infoType personnalisé. Si vous n'incluez pas le champ "sensitivityScore", le détecteur d'infoType personnalisé prend par défaut la valeur VERY_LIKELY.

Les scores de sensibilité sont utilisés dans les profils de données. Lorsque vous profilez vos données, la protection des données sensibles utilise les scores de sensibilité des infoTypes pour calculer le niveau de sensibilité.
L'un des champs suivants, selon le type de détecteur d'infoTypes personnalisé que vous créez :
- "dictionary" : objet Dictionary contenant une liste de mots ou d'expressions à rechercher.
- "regex" : objet Regex contenant un seul modèle définissant l'expression régulière.
- "surrogateType" : objet SurrogateType qui, si il est présent, indique que le détecteur d'infoType personnalisé est un substitut. Pour plus d'informations sur l'utilisation des détecteurs d'infoTypes personnalisés de type substituts, consultez la page Pseudonymisation.
- "storedType" : référence à un objet StoredInfoType existant. Ce champ est obligatoire lorsque vous créez un détecteur de dictionnaire personnalisé de grande taille. Bien que vous puissiez créer des détecteurs de dictionnaire standards ou des détecteurs d'expressions régulières en définissant ce champ, il est plus simple de les créer en définissant respectivement les champs dictionary ou regex.

Étapes suivantes

Vous pouvez en apprendre davantage sur la création d'infoTypes personnalisés dans les articles suivants :

Créer un détecteur de dictionnaire personnalisé standard : découvrez comment créer un détecteur d'infoTypes personnalisé pour rechercher des correspondances sur la base d'une liste de mots et d'expressions.
Créer un détecteur de dictionnaire personnalisé de grande taille : découvrez comment trouver des correspondances sur la base d'une très longue liste de mots et d'expressions. Les détecteurs d'infoTypes personnalisés stockés peuvent rechercher des correspondances sur plusieurs dizaines de millions de mots.
Créer un détecteur d'expression régulière personnalisé : découvrez comment créer un détecteur d'infoTypes personnalisé pour rechercher des correspondances sur la base d'une expression régulière.
Modifier des détecteurs d'infoTypes pour affiner les résultats de l'analyse : découvrez comment créer des modificateurs pour les détecteurs d'infoTypes intégrés et personnalisés afin de vous aider à affiner les résultats de l'analyse.
Personnaliser la probabilité de correspondance : découvrez comment utiliser les règles de détection et les mots clés pour personnaliser les valeurs de probabilité attribuées aux correspondances identifiées par un détecteur personnalisé.
Exemples de détecteurs d'infoTypes personnalisés : plusieurs exemples de définitions JSON de détecteurs d'infoTypes personnalisés à utiliser ou modifier à votre guise.