Bildprüfung und -entfernung

Mit dem Schutz sensibler Daten kann ein Image anhand von Kriterien, die Sie angeben, auf vertraulichen Text geprüft und daraus entfernt werden.

Mit infoType-Detektoren und optischer Zeichenerkennung (OCR) prüft der Schutz sensibler Daten ein base64-codiertes Bild auf Text und erkennt sensible Daten im Text. Es kann dann Informationen über den Speicherort sensibler Daten im Bild zurückgeben oder die sensiblen Daten durch Maskieren mit einem undurchsichtigen Rechteck entfernen.

Das Inspizieren und Entfernen sind zwei separate Vorgänge:

  • Prüfung: Der Schutz sensibler Daten prüft das übertragene base64-codierte Image auf die angegebenen infoTypes. Dann gibt es die erkannten infoTypes zurück, zusammen mit einem oder mehreren Sätzen von Pixelkoordinaten und Dimensionen. Jeder Satz von Pixelkoordinaten- und Dimensionswerten zeigt jeweils die untere linke Ecke und die Maße der Begrenzungsrahmen an. Jeder Begrenzungsrahmen entspricht einem Ergebnis zum Schutz sensibler Daten ganz oder teilweise.
  • Entfernen: Der Schutz sensibler Daten prüft das übertragene base64-codierte Bild auf die angegebenen infoTypes. Der Schutz sensibler Daten entfernt alle gefundenen sensiblen Daten durch Maskierung mit undurchsichtigen Rechtecken. Das Ausgabeformat des bearbeiteten base64-codierten Bilds entspricht dem des ursprünglichen Bildformats. Sie können in der Anfrage auch die Farbe der Maskierung festlegen.

So funktioniert die Inspektion

Die Bildprüfung beim Schutz sensibler Daten verwendet ein base64-codiertes Bild, erkennt jeglichen Text im Bild und durchsucht den Text nach Daten, die den Prüfungskriterien entsprechen. Schließlich gibt der Schutz sensibler Daten die Standorte aller erkannten sensiblen Daten zurück.

Betrachten Sie das folgende Bild. Dieses Bild ist ein Beispiel für eine typische Bilddatei, die aus dem Scan eines Papierdokuments erstellt wurde.

Ursprüngliches, nicht bearbeitetes Bild.
Ursprüngliches, nicht entferntes Bild (zum Vergrößern klicken).

Wenn Sie den Schutz sensibler Daten anweisen, dieses Image auf US-Sozialversicherungsnummern zu prüfen, durchläuft es den in der folgenden Abbildung dargestellten Prozess.

Bildinspektionsprozess.
Bildinspektion (zum Vergrößern klicken).
  1. Das base64-codierte Bild wird mit der Methode content.inspect an den Schutz sensibler Daten gestreamt.
  2. Mithilfe der optischen Zeichenerkennung (OCR) erkennt der Schutz sensibler Daten Text im Dokument.
  3. Der Schutz sensibler Daten scannt den erkannten Text mithilfe der zuvor festgelegten Konfiguration zur Erkennung sensibler Daten und identifiziert alle Übereinstimmungen.
  4. Der Schutz sensibler Daten gibt die Koordinaten und Abmessungen der Regionen im Bild zurück, in denen sensible Daten gemäß Ihren Erkennungskriterien gefunden wurden.

Die zurückgegebenen Koordinaten geben an, wo die sensiblen Daten zu finden sind. Beachten Sie, dass beim Schutz sensibler Daten häufig mehrere Felder verwendet werden, um anzugeben, wo sich eine einzelne Instanz sensibler Daten im Image befindet. Dies gilt insbesondere, wenn der Text handgeschrieben ist, wie in diesem Beispiel.

Wenn der Schutz sensibler Daten keine Daten im Bild findet, die Ihren Erkennungskriterien entsprechen, wird eine leere, erfolgreiche HTTP 200-Antwort zurückgegeben.

Inhalte entfernen

Das Entfernen der Daten entspricht der Bildinspektion, erweitert um einen zusätzlichen Schritt. Sobald der Schutz sensibler Daten den Ort bzw. die Speicherorte sensibler Daten im Bild identifiziert hat, füllt er diese Bereiche im Bild aus, anstatt die Koordinaten der Bereiche mit den Daten zurückzugeben. Es wird ein base64-codiertes Bild zurückgegeben.

Betrachten Sie noch einmal das Originalbild aus dem vorherigen Abschnitt. Wenn Sie den Schutz sensibler Daten anweisen, alle US-Sozialversicherungsnummer aus dem Bild zu entfernen, durchläuft er das in der folgenden Abbildung dargestellte Verfahren.

Prozess zum Entfernen von Bildern.
Prozess zum Entfernen von Bildern (zum Vergrößern klicken).
  1. Das base64-codierte Bild wird mit der Methode image.redact an den Schutz sensibler Daten gestreamt.
  2. Mithilfe der optischen Zeichenerkennung (OCR) erkennt der Schutz sensibler Daten Text im Dokument.
  3. Der Schutz sensibler Daten scannt den erkannten Text mithilfe der zuvor festgelegten Konfiguration zur Erkennung sensibler Daten und identifiziert alle Übereinstimmungen.
  4. Der Schutz sensibler Daten entfernt alle erkannten sensiblen Daten, indem sie sie mit einem undurchsichtigen Rechteck verdeckt. Anschließend wird das Bild in base64 codiert und in der Anfrageantwort zurückgegeben.

Wenn der Schutz sensibler Daten keine Daten im Bild findet, die Ihren Erkennungskriterien entsprechen, wird das base64-codierte Bild unverändert zurückgegeben.

Nächste Schritte