Klassifizieren, Entfernen und De-Identifikation

Der Schutz sensibler Daten hilft Ihnen dabei, sensible Daten zu ermitteln, zu verwalten und zu schützen. Mit dem Schutz sensibler Daten können Sie sensible Daten, die in textbasierten Inhalten und Bildern enthalten sind, leicht klassifizieren und entfernen. Dies gilt auch für Inhalte, die in Speicher-Repositories von Google Cloud gespeichert sind.

Textklassifizierung

Ausgangspunkt ist die folgende Texteingabe:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Die Ausgabe ist eine Liste von Ergebnissen, die in die folgenden Kategorien gegliedert sind:

Die Beispielausgabe ist in der folgenden Tabelle dargestellt.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

Automatisches Entfernen von Text

Beim automatischen Entfernen erhalten Sie anstelle einer Ergebnisliste direkt eine Ausgabe, bei der die sensiblen Daten bereits entfernt sind.

Beispieleingabe für automatisches Entfernen:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Beispielausgabe unter Verwendung des Platzhalters "***":

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

Bildklassifizierung

Beim Schutz sensibler Daten wird die optische Zeichenerkennung (OCR) verwendet, um Text vor der Klassifizierung zu erkennen. Ähnlich wie bei der Textklassifizierung gibt sie Ergebnisse zurück, fügt hier aber auch einen Markierungsrahmen um den Bereich ein, der den betreffenden Text enthält.

Speicherklassifizierung

Bei der Speicherklassifizierung werden Daten gescannt, die in Cloud Storage, Firestore im Datastore-Modus (Datastore) und BigQuery gespeichert sind. Anstatt Daten zum Schutz sensibler Daten zu streamen, geben Sie in Ihrer Anfrage den Speicherort für den Cloud Storage-Bucket, die Datastore-Art oder die BigQuery-Tabelle an, die vom Schutz sensibler Daten gescannt werden soll.

Beim Scannen von Dateien an Cloud Storage-Speicherorten unterstützt der Schutz sensibler Daten das Scannen von Binär-, Text-, Bild-, Microsoft Word-, Microsoft Excel-, Microsoft PowerPoint-, PDF- und Apache Avro-Dateien. Eine Liste der Dateiendungen der Dateitypen in Cloud Storage, die vom Schutz sensibler Daten gescannt werden können, finden Sie auf der API-Referenzseite für FileType. Dateitypen, die nicht erkannt werden, werden als Binärdateien gescannt.

Die Ergebnisse des Scans können entweder in einer neuen BigQuery-Tabelle gespeichert oder in einem Pub/Sub-Thema veröffentlicht werden. Von dort aus können Sie die integrierten BigQuery-Tools verwenden, um Rich-SQL-Analysen oder Tools wie Looker Studio zum Erstellen von Berichten auszuführen.

Weitere Informationen zum Scannen von Speicher-Repositories auf sensible Daten mithilfe des Schutzes sensibler Daten finden Sie unter Speicher und Datenbanken auf sensible Daten prüfen.

Weitere Informationen zur Anzeige von Scanergebnissen mit anderen Google Cloud-Tools finden Sie unter Ergebnisse vom Schutz sensibler Daten analysieren und Berichte erstellen.

Nächste Schritte