Inspection d'images et masquage du contenu sensible

La protection des données sensibles peut détecter et masquer le texte sensible d'une image en fonction des critères que vous spécifiez.

À l'aide des détecteurs d'infoTypes et de la reconnaissance optique des caractères (OCR), la protection des données sensibles inspecte une image encodée en base64 pour détecter du texte et détecte les données sensibles présentes dans le texte. Il peut ensuite renvoyer des informations sur l'emplacement des données sensibles dans l'image ou masquer ces dernières par un rectangle opaque.

L'inspection et le masquage sont deux actions distinctes :

  • Inspection: la protection des données sensibles inspecte l'image encodée en base64 que vous lui fournissez afin de détecter les intoTypes spécifiés. Elle retourne ensuite une réponse incluant les infoTypes détectés, ainsi qu'un ou plusieurs groupes de valeurs (chaque groupe est composé d'un ensemble de coordonnées de pixels et de dimensions). Les ensembles de coordonnées de pixels et les valeurs de dimension indiquent respectivement la position du coin inférieur gauche et la taille des cadres de délimitation. Chaque cadre de délimitation correspond à tout ou partie d'un résultat lié à la protection des données sensibles.
  • Masquage: la protection des données sensibles inspecte l'image encodée en base64 que vous lui fournissez afin de détecter les infoTypes spécifiés. La protection des données sensibles masque toutes les données sensibles identifiées à l'aide de rectangles opaques. Enfin, il renvoie une image masquée, encodée en base64 dans le même format que celui de l'image d'origine. Vous pouvez également configurer la couleur des cadres de masquage dans la requête.

À propos de l'inspection

L'inspection des images par la protection des données sensibles prend une image encodée en base64, reconnaît tout texte dans l'image, puis recherche toutes les données qui correspondent à ses critères d'inspection dans le texte. Enfin, la protection des données sensibles renvoie les emplacements des données sensibles détectées.

Prenons l'exemple suivant : Cette image est un exemple de fichier image type généré à partir de la numérisation d'un document papier.

Image d'origine non masquée.
Image d'origine non masquée (cliquez pour agrandir).

Si vous demandez à l'équipe chargée de la protection des données sensibles d'inspecter cette image à la recherche de numéros de sécurité sociale américains, elle suit le processus illustré dans le schéma suivant.

Processus d'inspection d'images.
Processus d'inspection d'images (cliquez pour agrandir).
  1. L'image encodée en base64 est diffusée vers la protection des données sensibles à l'aide de la méthode content.inspect.
  2. Grâce à la reconnaissance optique des caractères (OCR), la protection des données sensibles reconnaît le texte contenu dans le document.
  3. La protection des données sensibles analyse le texte reconnu à l'aide de la configuration de détection des données sensibles que vous avez définie précédemment et identifie les éventuelles correspondances.
  4. La fonctionnalité de protection des données sensibles renvoie les coordonnées et les dimensions des régions de l'image dans lesquelles elle a détecté des données sensibles selon vos critères de détection.

Les coordonnées renvoyées indiquent où se trouvent les données sensibles. Sachez que la protection des données sensibles utilise souvent plusieurs champs pour indiquer l'emplacement d'une seule instance de données sensibles dans l'image. Cela s'applique particulièrement lorsque le texte est écrit à la main, comme dans cet exemple.

Si la protection des données sensibles ne trouve pas de données dans l'image correspondant à vos critères de détection, elle renvoie une réponse HTTP 200 vide et réussie.

À propos du masquage

Le processus de masquage d'une image est identique à celui de l'inspection d'image, mais comporte une étape supplémentaire. Une fois que la protection des données sensibles a identifié le ou les emplacements des données sensibles dans l'image, au lieu de renvoyer les coordonnées des zones contenant les données, elle remplit ces zones sur l'image et renvoie une image masquée encodée en base64.

Reprenons l'image d'origine de la section précédente. Si vous demandez au service de protection des données sensibles de masquer tous les numéros de sécurité sociale américains de l'image, celle-ci sera soumise au processus illustré dans le schéma suivant.

Processus de masquage des images.
Processus de masquage des images (cliquez pour agrandir).
  1. L'image encodée en base64 est diffusée vers la protection des données sensibles à l'aide de la méthode image.redact.
  2. Grâce à la reconnaissance optique des caractères (OCR), la protection des données sensibles reconnaît le texte contenu dans le document.
  3. La protection des données sensibles analyse le texte reconnu à l'aide de la configuration de détection des données sensibles que vous avez définie précédemment et identifie les éventuelles correspondances.
  4. La protection des données sensibles masque toutes les données sensibles détectées en les recouvrant d'un rectangle opaque. Il encode ensuite l'image en base64 et la renvoie dans la réponse à la requête.

Si la protection des données sensibles ne détecte aucune donnée dans l'image correspondant à vos critères de détection, elle renvoie l'image encodée en base64 telle quelle.

Étapes suivantes