Ergebnisse aus dem Data Profiler korrigieren

Auf dieser Seite wird beschrieben, wie Sie Ergebnisse aus Datenprofilen korrigieren können.

Hohes Datenrisiko

Spalten oder Tabellen mit hohem Datenrisiko enthalten Hinweise auf vertrauliche Informationen ohne zusätzlichen Schutz. Um den Datenrisikowert zu verringern, sollten Sie folgende Möglichkeiten in Betracht ziehen:

  • Bei Spalten, die sensible Daten enthalten, wenden Sie ein BigQuery-Richtlinien-Tag an, um den Zugriff auf Konten mit bestimmten Zugriffsrechten einzuschränken.

    Bevor Sie diese Änderung vornehmen, muss Ihr Dienst-Agent die Berechtigungen haben, die zum Erstellen von Profilen mit Einschränkungen auf Spaltenebene erforderlich sind. Andernfalls zeigt Cloud DLP einen Fehler an. Weitere Informationen finden Sie unter Fehlerbehebung bei Datenprofilen.

  • De-identifizieren Sie die sensiblen Rohdaten mit De-Identifikationstechniken wie der Maskierung und Tokenisierung.

  • Wenn Daten mit hohem Risiko nicht benötigt werden, sollten Sie die sensiblen Spalten entfernen.

Hoher Wert für freien Text

Eine Spalte mit einem hohen kostenlosen Textwert, insbesondere solche mit Beweisen für mehrere infoTypes (z. B. PHONE_NUMBER, US_SOCIAL_SECURITY_NUMBER und DATE_OF_BIRTH) können unstrukturierte Daten und Instanzen mit personenidentifizierbaren Informationen enthalten (PII). Diese Spalte kann ein Notiz- oder Kommentarfeld sein. Freitext stellt ein potenzielles Risiko dar. In solchen Feldern könnte zum Beispiel "Customer geboren am 1. Januar 1985" eingegeben werden.

Cloud DLP wurde für die Verarbeitung unstrukturierter Daten entwickelt. Damit Sie diese Art von Daten besser verstehen, sollten Sie Folgendes tun:

  • Führen Sie eine On-Demand-Prüfung der BigQuery-Tabelle aus, um die Zeilen oder Zellen zu identifizieren, in denen sich personenidentifizierbare Informationen befinden könnten.

  • De-identifizieren Sie die sensiblen Rohdaten mit Methoden wie der Maskierung und Tokenisierung.

Nächste Schritte