Der Schutz sensibler Daten kann ein Bild nach von Ihnen festgelegten Kriterien auf sensiblen Text prüfen und diesen aus dem Bild entfernen.
Mithilfe von infoType-Detektoren und optischer Zeichenerkennung (OCR) prüft der Schutz sensibler Daten ein base64 Bild auf Text und erkennt sensible Daten im Text. Es kann dann Informationen über den Speicherort sensibler Daten im Bild zurückgeben oder die sensiblen Daten durch Maskieren mit einem undurchsichtigen Rechteck entfernen.
Das Inspizieren und Entfernen sind zwei separate Vorgänge:
- Prüfung: Sensitive Data Protection prüft das übertragene base64-codierte Bild auf die angegebenen infoTypes. Dann gibt es die erkannten infoTypes zurück, zusammen mit einem oder mehreren Sätzen von Pixelkoordinaten und Dimensionen. Jeder Satz von Pixelkoordinaten- und Dimensionswerten zeigt jeweils die untere linke Ecke und die Maße der Begrenzungsrahmen an. Jeder Markierungsrahmen entspricht einem Ergebnis des Schutzes sensibler Daten vollständig oder teilweise.
- Entfernen: Der Schutz sensibler Daten prüft das übertragene base64-codierte Bild auf die angegebenen infoTypes. Sensitive Data Protection entfernt sensible Daten durch Maskierung mit undurchsichtigen Rechtecken. Das Ausgabeformat des bearbeiteten base64-codierten Bilds entspricht dem des ursprünglichen Bildformats. Sie können in der Anfrage auch die Farbe der Maskierung festlegen.
So funktioniert die Inspektion
Bei der Bildinspektion für den Schutz sensibler Daten wird ein base64-codiertes Bild verwendet. Text im Bild wird erkannt und dann auf Daten geprüft, die den Erkennungskriterien entsprechen. Schließlich gibt der Schutz sensibler Daten die Positionen aller erkannten sensiblen Daten zurück.
Betrachten Sie das folgende Bild. Dieses Bild ist ein Beispiel für eine typische Bilddatei, die aus dem Scan eines Papierdokuments erstellt wurde.
Wenn Sie den Schutz sensibler Daten anweisen, dieses Bild auf US-Sozialversicherungsnummern zu prüfen, durchläuft es den in der folgenden Abbildung dargestellten Prozess.
- Das base64-codierte Bild wird mit der Methode
content.inspect
an Sensitive Data Protection gestreamt. - Mithilfe der optischen Zeichenerkennung (Optical Character Recognition, OCR) erkennt der Schutz sensibler Daten Text im Dokument.
- Sensitive Data Protection scannt den erkannten Text mithilfe der zuvor von Ihnen festgelegten Konfiguration für die sensible Datenerkennung und identifiziert Übereinstimmungen.
- Der Schutz sensibler Daten gibt die Koordinaten und Dimensionen der Regionen im Bild zurück, in denen sensible Daten gemäß Ihren Erkennungskriterien gefunden wurden.
Die zurückgegebenen Koordinaten geben an, wo die sensiblen Daten zu finden sind. Der Schutz sensibler Daten markiert häufig mehrere Felder, auch wenn sensible Daten im Bild nur einmal vorkommen. Dies gilt insbesondere, wenn der Text handgeschrieben ist, wie in diesem Beispiel.
Wenn der Schutz vor sensiblen Daten keine Daten im Bild findet, die den Erkennungskriterien entsprechen, wird eine die korrekte Verarbeitung bestätigende HTTP 200-Antwort ohne Inhalt zurückgegeben.
Inhalte entfernen
Das Entfernen der Daten entspricht der Bildinspektion, erweitert um einen zusätzlichen Schritt. Wenn der Schutz sensibler Daten ermittelt hat, wo sich im Bild sensible Daten befinden, werden die Koordinaten der entsprechenden Bereiche nicht zurückgegeben, sondern abgedeckt, und es wird ein base64-codiertes Bild ausgegeben.
Betrachten Sie noch einmal das Originalbild aus dem vorherigen Abschnitt. Wenn Sie den Schutz sensibler Daten anweisen, alle US-amerikanischen Sozialversicherungsnummern aus dem Bild zu entfernen, durchläuft es das in der folgenden Abbildung gezeigte Verfahren.
- Das base64-codierte Bild wird mit der Methode
image.redact
an Sensitive Data Protection gestreamt. - Mithilfe der optischen Zeichenerkennung (Optical Character Recognition, OCR) erkennt der Schutz sensibler Daten Text im Dokument.
- Sensitive Data Protection scannt den erkannten Text mithilfe der zuvor von Ihnen festgelegten Konfiguration für die sensible Datenerkennung und identifiziert Übereinstimmungen.
- Der Schutz sensibler Daten deckt erkannte sensible Daten mit einem undurchsichtigen Rechteck ab und macht sie so unkenntlich. Anschließend wird das Bild in base64 codiert und in der Anfrageantwort zurückgegeben.
Wenn der Schutz sensibler Daten keine Daten im Bild findet, die den Erkennungskriterien entsprechen, wird das base64-codierte Bild unverändert zurückgegeben.
Nächste Schritte
- Weitere Informationen zum Prüfen von Bildern auf sensible Daten mit dem Schutz sensibler Daten
- Weitere Informationen zum Entfernen sensibler Daten aus Bildern mit Sensitive Data Protection
- Weitere Informationen zum Erstellen einer de-identifizierten Kopie von Daten im Speicher