La protection des données sensibles comporte de nombreux détecteurs d'infoTypes intégrés, mais vous pouvez également créer les vôtres. Vous pouvez personnaliser le comportement de détection en définissant vos propres détecteurs d'infoTypes personnalisés. De cette façon, la protection des données sensibles inspecte ou anonymise les données sensibles correspondant aux modèles que vous spécifiez. Voici les types de détecteurs d'infoTypes personnalisés:
- Les détecteurs de dictionnaires personnalisés standards sont de simples listes de mots et d'expressions avec lesquels la protection des données sensibles recherche des correspondances. Utilisez-les lorsque vous disposez tout au plus de quelques centaines de milliers de mots.
- Les détecteurs de dictionnaires personnalisés de grande taille sont générés par la protection des données sensibles à l'aide de listes volumineuses de mots ou d'expressions stockés dans Cloud Storage ou BigQuery. Utilisez des détecteurs de dictionnaire personnalisés de grande taille lorsque vous disposez d'une longue liste de mots ou d'expressions (jusqu'à plusieurs dizaines de millions).
- Les détecteurs d'expressions régulières (regex) permettent à la protection des données sensibles de détecter les correspondances basées sur un modèle d'expression régulière.
- Les détecteurs d'infotypes de substitution détectent la sortie de la transformation d'anonymisation de la protection des données sensibles
CryptoReplaceFfxFpeConfig
. Ce détecteur d'infoType personnalisé ne s'utilise qu'avec la méthodecontent:reidentify
pour inverser l'anonymisation à l'aide du chiffrement préservant le format (FPE, Format-Preserving Encryption) en mode Firefox. C'est pourquoi les substituts ne sont pas décrits en détail dans ces articles. Pour obtenir plus d'informations et déterminer quand et comment utiliser les détecteurs d'infoTypes personnalisés de type substituts, consultez la page sur la Pseudonymisation.
En outre, Sensitive Data Protection intègre le concept de règles d'inspection grâce auxquelles vous pouvez affiner les résultats de l'analyse à l'aide des éléments suivants:
- L'ajout de règles d'exclusion à un détecteur d'infoTypes intégré ou personnalisé permet d'exclure des résultats faux ou indésirables.
- L'ajout de règles relatives aux mots clés à un détecteur d'infoTypes intégré ou personnalisé permet d'augmenter la quantité ou d'améliorer l'exactitude des résultats renvoyés.
Pour en savoir plus sur les détecteurs d'infoTypes personnalisés, consultez la page de présentation des concepts liés aux InfoTypes et détecteurs d'InfoTypes. Pour obtenir des exemples que vous pouvez utiliser ou modifier à votre guise, consultez la page Exemples de détecteurs d'infoTypes personnalisés. La suite de cette page explique comment utiliser la protection des données sensibles pour créer vos propres détecteurs d'infoTypes personnalisés.
Où utiliser les détecteurs d'infoTypes personnalisés
Les détecteurs d'infoTypes personnalisés sont définis dans l'objet CustomInfoType
. Vous spécifiez un infoType CustomInfoType
dans l'objet InspectConfig
lors de la configuration des éléments suivants :
- Inspection à l'aide de
projects.content.inspect
- Tâches d'inspection dans
InspectJobConfig
- Modèles d'inspection dans
InspectTemplate
- Anonymisation à l'aide de
projects.content.deidentify
- Modèles d'anonymisation dans
DeidentifyTemplate
- Restauration, dans le contenu, des caractéristiques d'identification anonymisées par chiffrement FPE en mode Firefox à l'aide de
projects.content.reidentify
. Ce scénario est spécifique aux détecteurs d'infoTypes personnalisés de type substituts.
Présentation de l'API
L'objet CustomInfoType
vous permet de créer un détecteur d'infoType personnalisé pour analyser un nouveau contenu ou affiner les résultats renvoyés par les détecteurs d'infoTypes prédéfinis.
L'objet CustomInfoType
comprend les champs ci-dessous définis comme suit :
"infotype"
: nom du détecteur d'infoType personnalisé, contenu dans un objetInfoType
."likelihood"
: valeur de probabilité par défaut (Likelihood
) à renvoyer pour ce détecteur d'infoType personnalisé. Vous pouvez spécifier d'autres valeursLikelihood
dans les règles"detectionRules"
qui remplaceront la valeurLikelihood
de base si le résultat répond aux critères spécifiés par la règle. Si vous omettez le champ"likelihood"
, le détecteur d'infoType personnalisé est définie surVERY_LIKELY
par défaut. Pour en savoir plus sur la probabilité, consultez la page consacrée au concept de probabilité."detectionRules"
: ensemble d'objetsDetectionRule
supplémentaires à appliquer à tous les résultats correspondant à ce détecteur d'infoType personnalisé. Il s'agit du champ dans lequel vous spécifiez des règles relatives aux mots clés, sous forme d'objetsHotwordRule
. Les règles sont appliquées dans l'ordre dans lequel elles sont spécifiées. Ce champ ne s'applique pas aux objets de typeSurrogateType
."sensitivityScore"
: valeurSensitivityScore
à renvoyer pour ce détecteur d'infoType personnalisé. Si vous n'incluez pas le champ"sensitivityScore"
, le détecteur d'infoType personnalisé est défini surVERY_LIKELY
par défaut.Les scores de sensibilité sont utilisés dans les profils de données. Lorsque vous créez un profil de vos données, la protection des données sensibles utilise les scores de sensibilité des infoTypes pour calculer le niveau de sensibilité.
L'un des champs suivants, selon le type de détecteur d'infoTypes personnalisé que vous créez :
"dictionary"
: objetDictionary
contenant une liste de mots ou d'expressions à rechercher."regex"
: objetRegex
contenant un seul modèle définissant l'expression régulière."surrogateType"
: objetSurrogateType
qui, si il est présent, indique que le détecteur d'infoType personnalisé est un substitut. Pour plus d'informations sur l'utilisation des détecteurs d'infoTypes personnalisés de type substituts, consultez la page Pseudonymisation."storedType"
: référence à un objetStoredInfoType
existant. Ce champ est obligatoire lors de la création d'un détecteur de dictionnaire personnalisé de grande taille. Bien que vous puissiez créer des détecteurs de dictionnaire ou d'expression régulière en définissant ce champ, il est plus simple de les créer en définissant respectivement le champdictionary
ouregex
.
Étapes suivantes
Vous pouvez en apprendre davantage sur la création d'infoTypes personnalisés dans les articles suivants :
- Créer un détecteur de dictionnaire personnalisé standard : découvrez comment créer un détecteur d'infoTypes personnalisé pour rechercher des correspondances sur la base d'une liste de mots et d'expressions.
- Créer un détecteur de dictionnaire personnalisé de grande taille : découvrez comment trouver des correspondances sur la base d'une très longue liste de mots et d'expressions. Les détecteurs d'infoTypes personnalisés stockés peuvent rechercher des correspondances sur plusieurs dizaines de millions de mots.
- Créer un détecteur d'expression régulière personnalisé : découvrez comment créer un détecteur d'infoTypes personnalisé pour rechercher des correspondances sur la base d'une expression régulière.
- Modifier des détecteurs d'infoTypes pour affiner les résultats de l'analyse : découvrez comment créer des modificateurs pour les détecteurs d'infoTypes intégrés et personnalisés afin de vous aider à affiner les résultats de l'analyse.
- Personnaliser la probabilité de correspondance : découvrez comment utiliser les règles de détection et les mots clés pour personnaliser les valeurs de probabilité attribuées aux correspondances identifiées par un détecteur personnalisé.
- Exemples de détecteurs d'infoTypes personnalisés : plusieurs exemples de définitions JSON de détecteurs d'infoTypes personnalisés à utiliser ou modifier à votre guise.