Cloud Data Loss Prevention (Cloud DLP) fait désormais partie de la protection des données sensibles. Le nom de l'API reste le même: API Cloud Data Loss Prevention (API DLP). Pour en savoir plus sur les services qui composent la protection des données sensibles, consultez Présentation de la protection des données sensibles.

Détecteurs d'infoTypes personnalisés

La protection des données sensibles comporte de nombreux détecteurs d'infoTypes intégrés, mais vous pouvez également créer les vôtres. Vous pouvez personnaliser le comportement de détection en définissant vos propres détecteurs d'infoTypes personnalisés afin que la protection des données sensibles inspecte ou anonymise les données sensibles correspondant aux modèles que vous spécifiez. Voici les types de détecteurs d'infoTypes personnalisés:

Les détecteurs de dictionnaires personnalisés standards sont de simples listes de mots et d'expressions dont se basent la protection des données sensibles. Utilisez-les lorsque vous disposez tout au plus de quelques centaines de milliers de mots.
Les détecteurs de dictionnaires personnalisés volumineux sont générés par la protection des données sensibles à l'aide de listes volumineuses de mots ou d'expressions stockés dans Cloud Storage ou BigQuery. Utilisez des détecteurs de dictionnaires personnalisés de grande taille lorsque vous avez une longue liste de mots ou d'expressions (jusqu'à plusieurs dizaines de millions).
Les détecteurs d'expressions régulières permettent à la protection des données sensibles de détecter les correspondances basées sur un modèle d'expression régulière.
Les détecteurs d'infoTypes de substitution détectent le résultat de la transformation d'anonymisation de la protection des données sensibles CryptoReplaceFfxFpeConfig. Ce détecteur d'infoType personnalisé n'est utilisé qu'avec la méthode content:reidentify pour inverser l'anonymisation à l'aide du chiffrement préservant le format (FPE) en mode FFX. Pour cette raison, les substituts ne sont pas décrits en détail dans ces articles. Pour savoir quand et comment utiliser les détecteurs d'infoTypes personnalisés de type substituts, consultez la page Pseudonymisation.

De plus, la protection des données sensibles inclut le concept de règles d'inspection, qui vous permettent d'affiner les résultats de l'analyse à l'aide des éléments suivants:

L'ajout de règles d'exclusion à un détecteur d'infoTypes intégré ou personnalisé permet d'exclure des résultats faux ou indésirables.
L'ajout de règles relatives aux mots clés à un détecteur d'infoTypes intégré ou personnalisé permet d'augmenter la quantité ou d'améliorer l'exactitude des résultats renvoyés.

Pour en savoir plus sur les détecteurs d'infoTypes personnalisés, consultez la page de présentation des concepts liés aux InfoTypes et détecteurs d'InfoTypes. Pour obtenir des exemples que vous pouvez utiliser ou modifier à votre guise, consultez la page Exemples de détecteurs d'infoTypes personnalisés. Le reste de cette rubrique explique comment utiliser la protection des données sensibles pour créer vos propres détecteurs d'infoTypes personnalisés.

Où utiliser les détecteurs d'infoTypes personnalisés

Les détecteurs d'infoTypes personnalisés sont définis dans l'objet CustomInfoType. Vous spécifiez un infoType CustomInfoType dans l'objet InspectConfig lors de la configuration des éléments suivants :

Inspection à l'aide de projects.content.inspect
Tâches d'inspection dans InspectJobConfig
Modèles d'inspection dans InspectTemplate
Anonymisation à l'aide de projects.content.deidentify
Modèles d'anonymisation dans DeidentifyTemplate
Restauration, dans le contenu, des caractéristiques d'identification anonymisées par chiffrement FPE en mode Firefox à l'aide de projects.content.reidentify. Ce scénario est spécifique aux détecteurs d'infoTypes personnalisés de type substituts.

Présentation de l'API

L'objet CustomInfoType vous permet de créer un détecteur d'infoType personnalisé pour analyser un nouveau contenu ou affiner les résultats renvoyés par les détecteurs d'infoTypes prédéfinis.

L'objet CustomInfoType comprend les champs ci-dessous définis comme suit :

"infotype" : nom du détecteur d'infoType personnalisé, contenu dans un objet InfoType.
"likelihood" : valeur de probabilité par défaut (Likelihood) à renvoyer pour ce détecteur d'infoType personnalisé. Vous pouvez spécifier d'autres valeurs Likelihood dans les règles "detectionRules" qui remplaceront la valeur Likelihood de base si le résultat répond aux critères spécifiés par la règle. Si vous omettez le champ "likelihood", le détecteur d'infoType personnalisé est définie sur VERY_LIKELY par défaut. Pour en savoir plus sur la probabilité, consultez la page consacrée au concept de probabilité.
"detectionRules" : ensemble d'objets DetectionRule supplémentaires à appliquer à tous les résultats correspondant à ce détecteur d'infoType personnalisé. Il s'agit du champ dans lequel vous spécifiez des règles relatives aux mots clés, sous forme d'objets HotwordRule. Les règles sont appliquées dans l'ordre dans lequel elles sont spécifiées. Ce champ ne s'applique pas aux objets de type SurrogateType.
"sensitivityScore": valeur SensitivityScore à renvoyer pour ce détecteur d'infoType personnalisé. Si vous n'incluez pas le champ "sensitivityScore", le détecteur d'infoType personnalisé est défini par défaut sur VERY_LIKELY.

Les scores de sensibilité sont utilisés dans les profils de données. Lors du profilage des données, la protection des données sensibles utilise les scores de sensibilité des infoTypes pour calculer le niveau de sensibilité.
L'un des champs suivants, selon le type de détecteur d'infoTypes personnalisé que vous créez :
- "dictionary" : objet Dictionary contenant une liste de mots ou d'expressions à rechercher.
- "regex" : objet Regex contenant un seul modèle définissant l'expression régulière.
- "surrogateType" : objet SurrogateType qui, si il est présent, indique que le détecteur d'infoType personnalisé est un substitut. Pour plus d'informations sur l'utilisation des détecteurs d'infoTypes personnalisés de type substituts, consultez la page Pseudonymisation.
- "storedType": référence à un objet StoredInfoType existant. Ce champ est obligatoire lorsque vous créez un détecteur de dictionnaire personnalisé volumineux. Bien que vous puissiez créer des détecteurs de dictionnaires réguliers ou des détecteurs d'expressions régulières en définissant ce champ, il est plus simple de les créer en définissant respectivement le champ dictionary ou le champ regex.

Étapes suivantes

Vous pouvez en apprendre davantage sur la création d'infoTypes personnalisés dans les articles suivants :

Créer un détecteur de dictionnaire personnalisé standard : découvrez comment créer un détecteur d'infoTypes personnalisé pour rechercher des correspondances sur la base d'une liste de mots et d'expressions.
Créer un détecteur de dictionnaire personnalisé volumineux : découvrez comment mettre en correspondance des résultats sur une très longue liste de mots et d'expressions. Les détecteurs d'infoTypes personnalisés stockés peuvent rechercher des correspondances sur plusieurs dizaines de millions de mots.
Créer un détecteur d'expression régulière personnalisé : découvrez comment créer un détecteur d'infoTypes personnalisé pour rechercher des correspondances sur la base d'une expression régulière.
Modifier des détecteurs d'infoTypes pour affiner les résultats de l'analyse : découvrez comment créer des modificateurs pour les détecteurs d'infoTypes intégrés et personnalisés afin de vous aider à affiner les résultats de l'analyse.
Personnaliser la probabilité de correspondance : découvrez comment utiliser les règles de détection et les mots clés pour personnaliser les valeurs de probabilité attribuées aux correspondances identifiées par un détecteur personnalisé.
Exemples de détecteurs d'infoTypes personnalisés : plusieurs exemples de définitions JSON de détecteurs d'infoTypes personnalisés à utiliser ou modifier à votre guise.