Der Schutz sensibler Daten hilft Ihnen dabei, sensible Daten zu ermitteln, zu verwalten und zu schützen. Mit dem Schutz sensibler Daten können Sie sensible Daten, die in textbasierten Inhalten und Bildern enthalten sind, leicht klassifizieren und entfernen. Dies gilt auch für Inhalte, die in Speicher-Repositories von Google Cloud gespeichert sind.
Textklassifizierung
Ausgangspunkt ist die folgende Texteingabe:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
Die Ausgabe ist eine Liste von Ergebnissen, die in die folgenden Kategorien gegliedert sind:
InfoType
Likelihood
Offset
(wo im String der potenzielleInfoType
gefunden wurde)
Die Beispielausgabe ist in der folgenden Tabelle dargestellt.
InfoType |
Likelihood |
Offset |
---|---|---|
US_HEALTHCARE_NPI |
VERY_LIKELY |
122 |
EMAIL_ADDRESS |
LIKELY |
72 |
US_DRIVERS_LICENSE_NUMBER |
LIKELY |
155 |
CANADA_BC_PHN |
VERY_UNLIKELY |
122 |
UK_TAXPAYER_REFERENCE |
VERY_UNLIKELY |
122 |
CANADA_PASSPORT |
VERY_UNLIKELY |
155 |
Automatisches Entfernen von Text
Beim automatischen Entfernen erhalten Sie anstelle einer Ergebnisliste direkt eine Ausgabe, bei der die sensiblen Daten bereits entfernt sind.
Beispieleingabe für automatisches Entfernen:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
Beispielausgabe unter Verwendung des Platzhalters "***":
Please update my records with the following information: Email address: *** National Provider Identifier: *** Driver's license: ***
Bildklassifizierung
Beim Schutz sensibler Daten wird die optische Zeichenerkennung (OCR) verwendet, um Text vor der Klassifizierung zu erkennen. Ähnlich wie bei der Textklassifizierung gibt sie Ergebnisse zurück, fügt hier aber auch einen Markierungsrahmen um den Bereich ein, der den betreffenden Text enthält.
Speicherklassifizierung
Bei der Speicherklassifizierung werden Daten gescannt, die in Cloud Storage, Firestore im Datastore-Modus (Datastore) und BigQuery gespeichert sind. Anstatt Daten zum Schutz sensibler Daten zu streamen, geben Sie in Ihrer Anfrage den Speicherort für den Cloud Storage-Bucket, die Datastore-Art oder die BigQuery-Tabelle an, die vom Schutz sensibler Daten gescannt werden soll.
Beim Scannen von Dateien an Cloud Storage-Speicherorten unterstützt der Schutz sensibler Daten das Scannen von Binär-, Text-, Bild-, Microsoft Word-, Microsoft Excel-, Microsoft PowerPoint-, PDF- und Apache Avro-Dateien. Eine Liste der Dateiendungen der Dateitypen in Cloud Storage, die vom Schutz sensibler Daten gescannt werden können, finden Sie auf der API-Referenzseite für FileType
.
Dateitypen, die nicht erkannt werden, werden als Binärdateien gescannt.
Die Ergebnisse des Scans können entweder in einer neuen BigQuery-Tabelle gespeichert oder in einem Pub/Sub-Thema veröffentlicht werden. Von dort aus können Sie die integrierten BigQuery-Tools verwenden, um Rich-SQL-Analysen oder Tools wie Looker Studio zum Erstellen von Berichten auszuführen.
Weitere Informationen zum Scannen von Speicher-Repositories auf sensible Daten mithilfe des Schutzes sensibler Daten finden Sie unter Speicher und Datenbanken auf sensible Daten prüfen.
Weitere Informationen zur Anzeige von Scanergebnissen mit anderen Google Cloud-Tools finden Sie unter Ergebnisse vom Schutz sensibler Daten analysieren und Berichte erstellen.
Nächste Schritte
- Bildinspektion und Entfernen von Daten aus Bildern
- Weitere Informationen zu Transformationsmethoden, die Sie beim Schutz sensibler Daten verwenden können
- Codelab Sensible Daten mit dem Schutz sensibler Daten entfernen durcharbeiten
- Weitere Informationen zum Erstellen einer de-identifizierten Kopie von Daten im Speicher.