Ergebnisse aus dem Data Profiler korrigieren

Auf dieser Seite wird beschrieben, wie Sie Ergebnisse aus Datenprofilen korrigieren können.

Hohes Datenrisiko

Daten-Assets mit hohem Datenrisiko enthalten Hinweise auf vertrauliche Informationen ohne zusätzlichen Schutz. Um den Datenrisikowert zu verringern, sollten Sie folgende Möglichkeiten in Betracht ziehen:

  • Bei BigQuery-Spalten, die sensible Daten enthalten, wenden Sie ein BigQuery-Richtlinien-Tag an, um den Zugriff auf Konten mit bestimmten Zugriffsrechten einzuschränken.

    Bevor Sie diese Änderung vornehmen, muss Ihr Dienst-Agent die Berechtigungen haben, die zum Erstellen von Profilen mit Einschränkungen auf Spaltenebene erforderlich sind. Andernfalls wird ein Fehler angezeigt. Weitere Informationen finden Sie unter Fehlerbehebung bei Datenprofilen.

  • De-identifizieren Sie die sensiblen Rohdaten mit De-Identifikationstechniken wie der Maskierung und Tokenisierung.

  • Wenn Daten mit hohem Risiko nicht benötigt werden, sollten Sie sie entfernen.

Hoher Wert für freien Text

Eine Spalte mit einem hohen Wert für freien Text, insbesondere solche mit Beweisen für mehrere infoTypes (z. B. PHONE_NUMBER, US_SOCIAL_SECURITY_NUMBER und DATE_OF_BIRTH) können unstrukturierte Daten und Instanzen mit personenidentifizierbaren Informationen enthalten (PII). Diese Spalte kann ein Notiz- oder Kommentarfeld sein. Freitext stellt ein potenzielles Risiko dar. In solchen Feldern könnte zum Beispiel "Customer geboren am 1. Januar 1985" eingegeben werden.

Sensitive Data Protection wurde für die Verarbeitung unstrukturierter Daten entwickelt. Damit Sie diese Art von Daten besser verstehen, sollten Sie Folgendes tun:

  • Bei BigQuery- und Cloud Storage-Daten können Sie die genauen Speicherorte der personenidentifizierbaren Informationen ermitteln, indem Sie eine On-Demand-Prüfung auf die BigQuery-Tabelle oder den Cloud Storage-Bucket ausführen.

  • De-identifizieren Sie die sensiblen Rohdaten mit Methoden wie der Maskierung und Tokenisierung.

Nächste Schritte