Bildinspektion und -entfernung

Cloud Data Loss Prevention (DLP) kann anhand von Kriterien, die Sie angeben, nach sensiblem Text in einem Bild suchen und dieses entfernen.

Mithilfe von infoType-Detektoren und optischer Zeichenerkennung (OCR) prüft Cloud DLP ein base64-codiertes Bild auf Text und erkennt sensible Daten im Text. Es kann dann Informationen über den Speicherort sensibler Daten im Bild zurückgeben oder die sensiblen Daten durch Maskieren mit einem undurchsichtigen Rechteck entfernen.

Das Inspizieren und Entfernen sind zwei separate Vorgänge:

  • Inspektion: Cloud DLP prüft das übertragene base64-codierte Bild auf die angegebenen infoTypes. Dann gibt es die erkannten infoTypes zurück, zusammen mit einem oder mehreren Sätzen von Pixelkoordinaten und Dimensionen. Jeder Satz von Pixelkoordinaten- und Dimensionswerten zeigt jeweils die untere linke Ecke und die Maße der Begrenzungsrahmen an. Jeder Markierungsrahmen entspricht einem Cloud DLP-Ergebnis vollständig oder teilweise.
  • Entfernen: Cloud DLP prüft das übertragene base64-codierte Bild auf die angegebenen infoTypes. Cloud DLP entfernt sensible Daten durch Maskierung mit undurchsichtigen Rechtecken. Das Ausgabeformat des bearbeiteten base64-codierten Bilds entspricht dem des ursprünglichen Bildformats. Sie können in der Anfrage auch die Farbe der Maskierung festlegen.

So funktioniert die Inspektion

Bei der Cloud DLP-Bildinspektion wird ein base64-codiertes Bild verwendet. Text im Bild wird erkannt und dann auf Daten geprüft, die den Erkennungskriterien entsprechen. Schließlich gibt Cloud DLP die Positionen aller erkannten sensiblen Daten zurück.

Betrachten Sie das folgende Bild. Dieses Bild ist ein Beispiel für eine typische Bilddatei, die aus einem Scan eines Papierdokuments generiert wurde.

Ursprüngliches, nicht korrigiertes Bild (zum Vergrößern klicken)

Wenn Sie Cloud DLP anweisen, dieses Image auf US-Sozialversicherungsnummern zu prüfen, durchläuft es den in der folgenden Abbildung dargestellten Prozess.

Bildinspektion (zum Vergrößern klicken)
  1. Das base64-codierte Bild wird mit der Methode content.inspect an Cloud DLP gestreamt.
  2. Mithilfe von optischer Zeichenerkennung (OCR) erkennt Cloud DLP Text im Dokument.
  3. Cloud DLP scannt den erkannten Text mit der zuvor festgelegten Konfiguration für die Erkennung sensibler Daten und ermittelt alle Übereinstimmungen.
  4. Cloud DLP gibt die Koordinaten und Dimensionen der Regionen im Bild zurück, in denen sensible Daten gemäß Ihren Erkennungskriterien gefunden wurden.

Die zurückgegebenen Koordinaten geben an, wo die sensiblen Daten zu finden sind. Cloud DLP markiert häufig mehrere Felder, auch wenn sensible Daten im Bild nur einmal vorkommen. Dies gilt insbesondere, wenn der Text handgeschrieben ist, wie in diesem Beispiel.

Wenn Cloud DLP keine Daten im Bild findet, die den Erkennungskriterien entsprechen, wird eine die korrekte Verarbeitung bestätigende HTTP 200-Antwort ohne Inhalt zurückgegeben.

So werden die Daten entfernt

Das Entfernen der Daten entspricht der Bildinspektion, erweitert um einen zusätzlichen Schritt. Wenn Cloud DLP ermittelt hat, wo sich im Bild sensible Daten befinden, werden die Koordinaten der entsprechenden Bereiche nicht zurückgegeben, sondern abgedeckt, und es wird ein base64-codiertes Bild ausgegeben.

Betrachten Sie noch einmal das Originalbild aus dem vorherigen Abschnitt. Wenn Sie Cloud DLP anweisen, alle US-amerikanischen Sozialversicherungsnummern aus dem Bild zu entfernen, durchläuft es das in der folgenden Abbildung gezeigte Verfahren.

Verfahren zum Entfernen von Bildern (zum Vergrößern klicken)
  1. Das base64-codierte Bild wird mit der Methode image.redact an Cloud DLP gestreamt.
  2. Mithilfe von optischer Zeichenerkennung (OCR) erkennt Cloud DLP Text im Dokument.
  3. Cloud DLP scannt den erkannten Text mit der zuvor festgelegten Konfiguration für die Erkennung sensibler Daten und ermittelt alle Übereinstimmungen.
  4. Cloud DLP deckt erkannte sensible Daten mit einem undurchsichtigen Rechteck ab und macht sie so unkenntlich. Anschließend wird das Bild in base64 codiert und in der Anfrageantwort zurückgegeben.

Wenn Cloud DLP keine Daten im Bild findet, die den Erkennungskriterien entsprechen, wird das base64-codierte Bild unverändert zurückgegeben.

Weitere Informationen