Détecteurs d'infoTypes personnalisés

La protection des données sensibles comporte de nombreux détecteurs d'infoTypes intégrés, mais vous pouvez également créer les vôtres. Vous pouvez personnaliser le comportement de détection en définissant vos propres détecteurs d'infoTypes personnalisés afin que la protection des données sensibles inspecte ou anonymise les données sensibles correspondant aux modèles que vous spécifiez. Voici les types de détecteurs d'infoTypes personnalisés:

  • Les détecteurs de dictionnaires personnalisés standards sont de simples listes de mots et d'expressions dont se basent la protection des données sensibles. Utilisez-les lorsque vous disposez tout au plus de quelques centaines de milliers de mots.
  • Les détecteurs de dictionnaires personnalisés volumineux sont générés par la protection des données sensibles à l'aide de listes volumineuses de mots ou d'expressions stockés dans Cloud Storage ou BigQuery. Utilisez des détecteurs de dictionnaires personnalisés de grande taille lorsque vous avez une longue liste de mots ou d'expressions (jusqu'à plusieurs dizaines de millions).
  • Les détecteurs d'expressions régulières permettent à la protection des données sensibles de détecter les correspondances basées sur un modèle d'expression régulière.
  • Les détecteurs d'infoTypes de substitution détectent le résultat de la transformation d'anonymisation de la protection des données sensibles CryptoReplaceFfxFpeConfig. Ce détecteur d'infoType personnalisé n'est utilisé qu'avec la méthode content:reidentify pour inverser l'anonymisation à l'aide du chiffrement préservant le format (FPE) en mode FFX. Pour cette raison, les substituts ne sont pas décrits en détail dans ces articles. Pour savoir quand et comment utiliser les détecteurs d'infoTypes personnalisés de type substituts, consultez la page Pseudonymisation.

De plus, la protection des données sensibles inclut le concept de règles d'inspection, qui vous permettent d'affiner les résultats de l'analyse à l'aide des éléments suivants:

  • L'ajout de règles d'exclusion à un détecteur d'infoTypes intégré ou personnalisé permet d'exclure des résultats faux ou indésirables.
  • L'ajout de règles relatives aux mots clés à un détecteur d'infoTypes intégré ou personnalisé permet d'augmenter la quantité ou d'améliorer l'exactitude des résultats renvoyés.

Pour en savoir plus sur les détecteurs d'infoTypes personnalisés, consultez la page de présentation des concepts liés aux InfoTypes et détecteurs d'InfoTypes. Pour obtenir des exemples que vous pouvez utiliser ou modifier à votre guise, consultez la page Exemples de détecteurs d'infoTypes personnalisés. Le reste de cette rubrique explique comment utiliser la protection des données sensibles pour créer vos propres détecteurs d'infoTypes personnalisés.

Où utiliser les détecteurs d'infoTypes personnalisés

Les détecteurs d'infoTypes personnalisés sont définis dans l'objet CustomInfoType. Vous spécifiez un infoType CustomInfoType dans l'objet InspectConfig lors de la configuration des éléments suivants :

Présentation de l'API

L'objet CustomInfoType vous permet de créer un détecteur d'infoType personnalisé pour analyser un nouveau contenu ou affiner les résultats renvoyés par les détecteurs d'infoTypes prédéfinis.

L'objet CustomInfoType comprend les champs ci-dessous définis comme suit :

  • "infotype" : nom du détecteur d'infoType personnalisé, contenu dans un objet InfoType.
  • "likelihood" : valeur de probabilité par défaut (Likelihood) à renvoyer pour ce détecteur d'infoType personnalisé. Vous pouvez spécifier d'autres valeurs Likelihood dans les règles "detectionRules" qui remplaceront la valeur Likelihood de base si le résultat répond aux critères spécifiés par la règle. Si vous omettez le champ "likelihood", le détecteur d'infoType personnalisé est définie sur VERY_LIKELY par défaut. Pour en savoir plus sur la probabilité, consultez la page consacrée au concept de probabilité.
  • "detectionRules" : ensemble d'objets DetectionRule supplémentaires à appliquer à tous les résultats correspondant à ce détecteur d'infoType personnalisé. Il s'agit du champ dans lequel vous spécifiez des règles relatives aux mots clés, sous forme d'objets HotwordRule. Les règles sont appliquées dans l'ordre dans lequel elles sont spécifiées. Ce champ ne s'applique pas aux objets de type SurrogateType.
  • "sensitivityScore": valeur SensitivityScore à renvoyer pour ce détecteur d'infoType personnalisé. Si vous n'incluez pas le champ "sensitivityScore", le détecteur d'infoType personnalisé est défini par défaut sur VERY_LIKELY.

    Les scores de sensibilité sont utilisés dans les profils de données. Lors du profilage des données, la protection des données sensibles utilise les scores de sensibilité des infoTypes pour calculer le niveau de sensibilité.

  • L'un des champs suivants, selon le type de détecteur d'infoTypes personnalisé que vous créez :

    • "dictionary" : objet Dictionary contenant une liste de mots ou d'expressions à rechercher.
    • "regex" : objet Regex contenant un seul modèle définissant l'expression régulière.
    • "surrogateType" : objet SurrogateType qui, si il est présent, indique que le détecteur d'infoType personnalisé est un substitut. Pour plus d'informations sur l'utilisation des détecteurs d'infoTypes personnalisés de type substituts, consultez la page Pseudonymisation.
    • "storedType": référence à un objet StoredInfoType existant. Ce champ est obligatoire lorsque vous créez un détecteur de dictionnaire personnalisé volumineux. Bien que vous puissiez créer des détecteurs de dictionnaires réguliers ou des détecteurs d'expressions régulières en définissant ce champ, il est plus simple de les créer en définissant respectivement le champ dictionary ou le champ regex.

Étapes suivantes

Vous pouvez en apprendre davantage sur la création d'infoTypes personnalisés dans les articles suivants :