Sensitive Data Protection unterstützt Sie bei der Erkennung, Verwaltung und dem Schutz sensibler Daten. Mit dem Schutz sensibler Daten können Sie sensible Daten, die in Texten und Bildern enthalten sind, leicht klassifizieren und entfernen. Dies gilt auch für Inhalte in Speicher-Repositories der Google Cloud.
Textklassifizierung
Ausgangspunkt ist die folgende Texteingabe:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
Die Ausgabe ist eine Liste von Ergebnissen, die in die folgenden Kategorien gegliedert sind:
InfoType
Likelihood
Offset
(wo im String der potenzielleInfoType
gefunden wurde)
Die Beispielausgabe ist in der folgenden Tabelle dargestellt.
InfoType |
Likelihood |
Offset |
---|---|---|
US_HEALTHCARE_NPI |
VERY_LIKELY |
122 |
EMAIL_ADDRESS |
LIKELY |
72 |
US_DRIVERS_LICENSE_NUMBER |
LIKELY |
155 |
CANADA_BC_PHN |
VERY_UNLIKELY |
122 |
UK_TAXPAYER_REFERENCE |
VERY_UNLIKELY |
122 |
CANADA_PASSPORT |
VERY_UNLIKELY |
155 |
Automatisches Entfernen von Text
Beim automatischen Entfernen erhalten Sie anstelle einer Ergebnisliste direkt eine Ausgabe, bei der die sensiblen Daten bereits entfernt sind.
Beispieleingabe für automatisches Entfernen:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
Beispielausgabe unter Verwendung des Platzhalters "***":
Please update my records with the following information: Email address: *** National Provider Identifier: *** Driver's license: ***
Bildklassifizierung
Der Schutz sensibler Daten verwendet die OCR-Technologie (Optical Character Recognition), um Text vor der Klassifizierung zu erkennen. Ähnlich wie bei der Textklassifizierung gibt sie Ergebnisse zurück, fügt hier aber auch einen Markierungsrahmen um den Bereich ein, der den betreffenden Text enthält.
Speicherklassifizierung
Bei der Speicherklassifizierung werden Daten gescannt, die in Cloud Storage, Firestore im Datastore-Modus (Datenspeicher) und BigQuery gespeichert sind. Anstatt Daten an den Dienst „Schutz sensibler Daten“ zu streamen, geben Sie in Ihrer Anfrage den Speicherort des Cloud Storage-Buckets, des Datastore-Typs oder der BigQuery-Tabelle an, die der Dienst „Schutz sensibler Daten“ scannen soll.
Beim Scannen von Dateien an Cloud Storage-Speicherorten unterstützt der Schutz sensibler Daten das Scannen von Binär-, Text-, Bild-, Microsoft Word-, Microsoft Excel-, Microsoft PowerPoint-, PDF- und Apache Avro-Dateien. Eine Liste der Dateiendungen von Dateitypen in Cloud Storage, die vom Schutz sensibler Daten gescannt werden können, finden Sie auf der API-Referenzseite für FileType
.
Dateitypen, die nicht erkannt werden, werden als Binärdateien gescannt.
Die Ergebnisse des Scans können entweder in einer neuen BigQuery-Tabelle gespeichert oder in einem Pub/Sub-Thema veröffentlicht werden. Von dort aus können Sie mithilfe der integrierten BigQuery-Tools Rich-SQL-Analysen ausführen oder Tools wie Looker Studio verwenden, um Berichte zu erstellen.
Weitere Informationen zum Scannen von Speicher-Repositories auf sensible Daten mithilfe des Schutzes sensibler Daten finden Sie unter Speicher und Datenbanken auf sensible Daten prüfen.
Weitere Informationen über die Anzeige von Scanergebnissen mit anderen Google Cloud-Tools finden Sie unter Ergebnisse des Schutzes sensibler Daten analysieren und Berichte erstellen.
Nächste Schritte
- Bildinspektion und Entfernen von Daten aus Bildern
- Weitere Informationen zu Transformationsmethoden, die Sie mit dem Schutz sensibler Daten verwenden können
- Sehen Sie sich das Codelab zum Entfernen sensibler Daten mit Sensitive Data Protection an.
- Weitere Informationen zum Erstellen einer de-identifizierten Kopie von Daten im Speicher