Détecteurs d'infoTypes personnalisés

La protection des données sensibles comporte de nombreux détecteurs d'infoTypes intégrés, mais vous pouvez également créer les vôtres. Vous pouvez personnaliser le comportement de détection en définissant vos propres détecteurs d'infoTypes personnalisés. De cette façon, la protection des données sensibles inspecte ou anonymise les données sensibles correspondant aux modèles que vous spécifiez. Voici les types de détecteurs d'infoTypes personnalisés:

  • Les détecteurs de dictionnaires personnalisés standards sont de simples listes de mots et d'expressions avec lesquels la protection des données sensibles recherche des correspondances. Utilisez-les lorsque vous disposez tout au plus de quelques centaines de milliers de mots.
  • Les détecteurs de dictionnaires personnalisés de grande taille sont générés par la protection des données sensibles à l'aide de listes volumineuses de mots ou d'expressions stockés dans Cloud Storage ou BigQuery. Utilisez des détecteurs de dictionnaire personnalisés de grande taille lorsque vous disposez d'une longue liste de mots ou d'expressions (jusqu'à plusieurs dizaines de millions).
  • Les détecteurs d'expressions régulières (regex) permettent à la protection des données sensibles de détecter les correspondances basées sur un modèle d'expression régulière.
  • Les détecteurs d'infotypes de substitution détectent la sortie de la transformation d'anonymisation de la protection des données sensibles CryptoReplaceFfxFpeConfig. Ce détecteur d'infoType personnalisé ne s'utilise qu'avec la méthode content:reidentify pour inverser l'anonymisation à l'aide du chiffrement préservant le format (FPE, Format-Preserving Encryption) en mode Firefox. C'est pourquoi les substituts ne sont pas décrits en détail dans ces articles. Pour obtenir plus d'informations et déterminer quand et comment utiliser les détecteurs d'infoTypes personnalisés de type substituts, consultez la page sur la Pseudonymisation.

En outre, Sensitive Data Protection intègre le concept de règles d'inspection grâce auxquelles vous pouvez affiner les résultats de l'analyse à l'aide des éléments suivants:

  • L'ajout de règles d'exclusion à un détecteur d'infoTypes intégré ou personnalisé permet d'exclure des résultats faux ou indésirables.
  • L'ajout de règles relatives aux mots clés à un détecteur d'infoTypes intégré ou personnalisé permet d'augmenter la quantité ou d'améliorer l'exactitude des résultats renvoyés.

Pour en savoir plus sur les détecteurs d'infoTypes personnalisés, consultez la page de présentation des concepts liés aux InfoTypes et détecteurs d'InfoTypes. Pour obtenir des exemples que vous pouvez utiliser ou modifier à votre guise, consultez la page Exemples de détecteurs d'infoTypes personnalisés. La suite de cette page explique comment utiliser la protection des données sensibles pour créer vos propres détecteurs d'infoTypes personnalisés.

Où utiliser les détecteurs d'infoTypes personnalisés

Les détecteurs d'infoTypes personnalisés sont définis dans l'objet CustomInfoType. Vous spécifiez un infoType CustomInfoType dans l'objet InspectConfig lors de la configuration des éléments suivants :

Présentation de l'API

L'objet CustomInfoType vous permet de créer un détecteur d'infoType personnalisé pour analyser un nouveau contenu ou affiner les résultats renvoyés par les détecteurs d'infoTypes prédéfinis.

L'objet CustomInfoType comprend les champs ci-dessous définis comme suit :

  • "infotype" : nom du détecteur d'infoType personnalisé, contenu dans un objet InfoType.
  • "likelihood" : valeur de probabilité par défaut (Likelihood) à renvoyer pour ce détecteur d'infoType personnalisé. Vous pouvez spécifier d'autres valeurs Likelihood dans les règles "detectionRules" qui remplaceront la valeur Likelihood de base si le résultat répond aux critères spécifiés par la règle. Si vous omettez le champ "likelihood", le détecteur d'infoType personnalisé est définie sur VERY_LIKELY par défaut. Pour en savoir plus sur la probabilité, consultez la page consacrée au concept de probabilité.
  • "detectionRules" : ensemble d'objets DetectionRule supplémentaires à appliquer à tous les résultats correspondant à ce détecteur d'infoType personnalisé. Il s'agit du champ dans lequel vous spécifiez des règles relatives aux mots clés, sous forme d'objets HotwordRule. Les règles sont appliquées dans l'ordre dans lequel elles sont spécifiées. Ce champ ne s'applique pas aux objets de type SurrogateType.
  • "sensitivityScore": valeur SensitivityScore à renvoyer pour ce détecteur d'infoType personnalisé. Si vous n'incluez pas le champ "sensitivityScore", le détecteur d'infoType personnalisé est défini sur VERY_LIKELY par défaut.

    Les scores de sensibilité sont utilisés dans les profils de données. Lorsque vous créez un profil de vos données, la protection des données sensibles utilise les scores de sensibilité des infoTypes pour calculer le niveau de sensibilité.

  • L'un des champs suivants, selon le type de détecteur d'infoTypes personnalisé que vous créez :

    • "dictionary" : objet Dictionary contenant une liste de mots ou d'expressions à rechercher.
    • "regex" : objet Regex contenant un seul modèle définissant l'expression régulière.
    • "surrogateType" : objet SurrogateType qui, si il est présent, indique que le détecteur d'infoType personnalisé est un substitut. Pour plus d'informations sur l'utilisation des détecteurs d'infoTypes personnalisés de type substituts, consultez la page Pseudonymisation.
    • "storedType": référence à un objet StoredInfoType existant. Ce champ est obligatoire lors de la création d'un détecteur de dictionnaire personnalisé de grande taille. Bien que vous puissiez créer des détecteurs de dictionnaire ou d'expression régulière en définissant ce champ, il est plus simple de les créer en définissant respectivement le champ dictionary ou regex.

Étapes suivantes

Vous pouvez en apprendre davantage sur la création d'infoTypes personnalisés dans les articles suivants :