Bildprüfung und -entfernung

Der Schutz sensibler Daten kann ein Bild nach von Ihnen festgelegten Kriterien auf sensiblen Text prüfen und diesen aus dem Bild entfernen.

Mithilfe von infoType-Detektoren und optischer Zeichenerkennung (OCR) prüft der Schutz sensibler Daten ein base64 Bild auf Text und erkennt sensible Daten im Text. Es kann dann Informationen über den Speicherort sensibler Daten im Bild zurückgeben oder die sensiblen Daten durch Maskieren mit einem undurchsichtigen Rechteck entfernen.

Das Inspizieren und Entfernen sind zwei separate Vorgänge:

  • Prüfung: Sensitive Data Protection prüft das übertragene base64-codierte Bild auf die angegebenen infoTypes. Dann gibt es die erkannten infoTypes zurück, zusammen mit einem oder mehreren Sätzen von Pixelkoordinaten und Dimensionen. Jeder Satz von Pixelkoordinaten- und Dimensionswerten zeigt jeweils die untere linke Ecke und die Maße der Begrenzungsrahmen an. Jeder Markierungsrahmen entspricht einem Ergebnis des Schutzes sensibler Daten vollständig oder teilweise.
  • Entfernen: Der Schutz sensibler Daten prüft das übertragene base64-codierte Bild auf die angegebenen infoTypes. Sensitive Data Protection entfernt sensible Daten durch Maskierung mit undurchsichtigen Rechtecken. Das Ausgabeformat des bearbeiteten base64-codierten Bilds entspricht dem des ursprünglichen Bildformats. Sie können in der Anfrage auch die Farbe der Maskierung festlegen.

So funktioniert die Inspektion

Bei der Bildinspektion für den Schutz sensibler Daten wird ein base64-codiertes Bild verwendet. Text im Bild wird erkannt und dann auf Daten geprüft, die den Erkennungskriterien entsprechen. Schließlich gibt der Schutz sensibler Daten die Positionen aller erkannten sensiblen Daten zurück.

Betrachten Sie das folgende Bild. Dieses Bild ist ein Beispiel für eine typische Bilddatei, die aus dem Scan eines Papierdokuments erstellt wurde.

Originalbild ohne entfernte Daten.
Originalbild ohne entfernte Daten (zum Vergrößern anklicken)

Wenn Sie den Schutz sensibler Daten anweisen, dieses Bild auf US-Sozialversicherungsnummern zu prüfen, durchläuft es den in der folgenden Abbildung dargestellten Prozess.

Bildinspektion
Bildinspektion (zum Vergrößern anklicken)
  1. Das base64-codierte Bild wird mit der Methode content.inspect an Sensitive Data Protection gestreamt.
  2. Mithilfe der optischen Zeichenerkennung (Optical Character Recognition, OCR) erkennt der Schutz sensibler Daten Text im Dokument.
  3. Sensitive Data Protection scannt den erkannten Text mithilfe der zuvor von Ihnen festgelegten Konfiguration für die sensible Datenerkennung und identifiziert Übereinstimmungen.
  4. Der Schutz sensibler Daten gibt die Koordinaten und Dimensionen der Regionen im Bild zurück, in denen sensible Daten gemäß Ihren Erkennungskriterien gefunden wurden.

Die zurückgegebenen Koordinaten geben an, wo die sensiblen Daten zu finden sind. Der Schutz sensibler Daten markiert häufig mehrere Felder, auch wenn sensible Daten im Bild nur einmal vorkommen. Dies gilt insbesondere, wenn der Text handgeschrieben ist, wie in diesem Beispiel.

Wenn der Schutz vor sensiblen Daten keine Daten im Bild findet, die den Erkennungskriterien entsprechen, wird eine die korrekte Verarbeitung bestätigende HTTP 200-Antwort ohne Inhalt zurückgegeben.

Inhalte entfernen

Das Entfernen der Daten entspricht der Bildinspektion, erweitert um einen zusätzlichen Schritt. Wenn der Schutz sensibler Daten ermittelt hat, wo sich im Bild sensible Daten befinden, werden die Koordinaten der entsprechenden Bereiche nicht zurückgegeben, sondern abgedeckt, und es wird ein base64-codiertes Bild ausgegeben.

Betrachten Sie noch einmal das Originalbild aus dem vorherigen Abschnitt. Wenn Sie den Schutz sensibler Daten anweisen, alle US-amerikanischen Sozialversicherungsnummern aus dem Bild zu entfernen, durchläuft es das in der folgenden Abbildung gezeigte Verfahren.

Verfahren zum Entfernen von Bildern
Verfahren zum Entfernen von Bildern (zum Vergrößern klicken)
  1. Das base64-codierte Bild wird mit der Methode image.redact an Sensitive Data Protection gestreamt.
  2. Mithilfe der optischen Zeichenerkennung (Optical Character Recognition, OCR) erkennt der Schutz sensibler Daten Text im Dokument.
  3. Sensitive Data Protection scannt den erkannten Text mithilfe der zuvor von Ihnen festgelegten Konfiguration für die sensible Datenerkennung und identifiziert Übereinstimmungen.
  4. Der Schutz sensibler Daten deckt erkannte sensible Daten mit einem undurchsichtigen Rechteck ab und macht sie so unkenntlich. Anschließend wird das Bild in base64 codiert und in der Anfrageantwort zurückgegeben.

Wenn der Schutz sensibler Daten keine Daten im Bild findet, die den Erkennungskriterien entsprechen, wird das base64-codierte Bild unverändert zurückgegeben.

Nächste Schritte