Referenz zu Messwerten

Auf dieser Seite werden alle Messwerte aufgelistet und beschrieben, die in Datenprofilen erfasst werden.

Es gibt drei Arten von Datenprofilen: Projektdatenprofile, Tabellendatenprofile und Spaltendatenprofile.

Projektdatenprofile

Jedes Projektdatenprofil enthält die folgenden Felder. Die Werte für diese Felder werden basierend auf den Ressourcen, die innerhalb des Projekts profiliert werden, aggregiert.

Statistiken

Projektdatenprofile liefern folgende Informationen:

Datenrisiko
Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Vertraulichkeit
Punktzahl, die die Vertraulichkeitsstufe für dieses Projekt angibt. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.

Metadaten

Projektdatenprofile enthalten die folgenden Metadaten:

Zuletzt generiertes Profil
Datum und Uhrzeit der letzten Generierung des Profils.
Projekt-ID
ID des Projekts, für das ein Profil erstellt wurde.
Ressourcenname
Vollständig qualifizierter Name des Datenprofils.
Status
Symbol, das den Status des Profilerstellungsvorgangs angibt.

Tabellendatenprofile

Jedes Tabellendatenprofil hat folgende Felder:

Statistiken

Tabellendatenprofile liefern folgende Informationen:

Datenrisiko
Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Vertraulichkeit
Punktzahl, die die Vertraulichkeitsstufe für diese Tabelle angibt. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.

Metadaten

Tabellendatenprofile enthalten die folgenden Metadaten:

Datenbank
Die Datenbank, die die Tabelle enthält, für die ein Profil erstellt wurde. Dieses Feld gilt nur für die Cloud SQL-Erkennung.
Dataset-ID
ID des Datasets, das diese Tabelle enthält.
Verschlüsselung
Gibt an, ob die Verschlüsselung für diese Tabelle von Google oder Ihrer Organisation verwaltet wird.
Ablaufzeit
Optional. Die Zeit, zu der diese Tabelle abläuft.
Anzahl der fehlgeschlagenen Spalten
Anzahl der in dieser Tabelle aufgrund eines Fehlers übersprungenen Spalten.
Snapshot der Inspektionskonfiguration
Snapshot der Inspektionsvorlage, die beim Generieren des Profils verwendet wurde. Weitere Informationen finden Sie unter Datenprofil-Snapshots.
Instanz
Die Instanz, die die Tabelle enthält, für die das Profil erstellt wurde. Dieses Feld gilt nur für die Cloud SQL-Erkennung.
Zuletzt generiertes Profil
Datum und Uhrzeit der letzten Generierung des Profils.
Letzte Aktualisierung in BigQuery
Datum und Uhrzeit der letzten Änderung dieser Tabelle.
Projekt-ID
ID des Projekts, das diese Tabelle enthält.
Öffentlich

Gibt an, ob diese Tabelle für alle oder nur bestimmte Nutzer verfügbar ist.

Ressourcenlabels

Labels der Tabelle bei der Generierung des Profils.

Ressourcen-Tags

Tags der Tabelle bei der Generierung des Profils.

Ressourcenname

Vollständig qualifizierter Name des Datenprofils.

Zeilenanzahl

Anzahl der Zeilen in dieser Tabelle bei der Erstellung des Profils.

Anzahl der gescannten Spalten

Die Anzahl der Spalten, für die in dieser Tabelle ein Profil erstellt wurde.

Dienstkonto

Anzahl der Dienstkonten mit IAM-Berechtigungen für den Zugriff auf diese Tabelle.

Status

Gibt an, ob das Profil erfolgreich generiert wurde.

Tabellen-ID

ID dieser Tabelle.

Zeitpunkt der Tabellenerstellung

Datum und Uhrzeit der Tabellenerstellung.

Tabellengröße

Die Größe dieser Tabelle bei der Erstellung des Profils.

Typ

Die Art der Entdeckung.

Spaltendatenprofile

Jedes Spaltendatenprofil enthält die folgenden Felder:

Statistiken

Spaltendatenprofile liefern folgende Informationen:

Datenrisiko
Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Vertraulichkeit
Punktzahl, die die Vertraulichkeitsstufe für diese Spalte angibt. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Vorhergesagter infoType

Wenn ein einzelner integrierter oder benutzerdefinierter infoType in der Spalte deutlich überwiegt, wird dieses Feld im Rahmen des Schutzes vertraulicher Daten auf diesen infoType festgelegt. Andernfalls hat dieses Feld keinen Wert.

Eine Liste aller in der Spalte erkannten infoTypes finden Sie im Feld Andere infoTypes.

Der Schutz sensibler Daten sucht nur nach den infoTypes, die Sie in der Inspektionsvorlage angegeben haben. Daher können nur diese infoTypes im Feld Vorhergesagter infoType angezeigt werden. Wenn die Spalte beispielsweise E-Mail-Adressen enthält, Sie aber den infoType-Detektor EMAIL_ADDRESS nicht in Ihre Inspektionsvorlage eingefügt haben, wird EMAIL_ADDRESS hier nicht angezeigt.

Wenn die Spaltendaten überwiegend mit mehreren eng verwandten infoTypes übereinstimmen, die zur selben allgemeinen Kategorie gehören, wird in Sensitive Data Protection für dieses Feld der allgemeinere infoType festgelegt. Wenn die Spalte beispielsweise hauptsächlich eine Mischung aus den infoTypes PASSPORT, AUSTRALIA_PASSPORT und CANADA_PASSPORT enthält, wird das Feld Vorhergesagter infoType auf PASSPORT festgelegt. Im Feld Andere infoTypes sehen Sie die spezifischeren infoTypes und ihre geschätzte Verbreitung.

Andere infoTypes

In der Spalte erkannte infoTypes, die nicht stark genug sind, um als vorhergesagter infoType der Spalte betrachtet zu werden. Weitere Informationen finden Sie in diesem Dokument unter Vorhergesagter infoType.

Für Datenprofile, die nach dem 13. Oktober 2022 generiert wurden, hat jeder in diesem Feld aufgeführte infoType eine geschätzte Prävalenz. Die geschätzte Verbreitung ist ein ungefährer Prozentsatz der Nicht-Null-Zeilen, in denen der infoType erkannt wurde.

Angenommen, Sie haben eine Spalte mit den folgenden Messwerten:

  • Vorhergesagter infoType:FDA_CODE
  • Andere infoTypes:PERSON_NAME (2%), STREET_ADDRESS (1%)

In diesem Beispiel gibt es einen starken Hinweis darauf, dass die Spalte FDA-Codes enthält. Der Schutz sensibler Daten hat außerdem ergeben, dass etwa 2% der Zeilen mit nicht nullwertigen Werten in der Spalte Personennamen und 1% Straßenadressen enthalten könnten.

Der Schutz sensibler Daten sucht nur nach den infoTypes, die Sie in der Inspektionsvorlage angegeben haben. Daher können nur diese infoTypes im Feld Andere infoTypes angezeigt werden. Wenn die Spalte beispielsweise E-Mail-Adressen enthält, Sie aber den infoType-Detektor EMAIL_ADDRESS nicht in Ihre Inspektionsvorlage eingefügt haben, enthält dieses Feld EMAIL_ADDRESS nicht.

Geschätzter Nullanteil

Der ungefähre Anteil der Nullwerte in dieser Spalte, kategorisiert als „hoch“, „mittel“, „niedrig“ oder „sehr niedrig“. Dieser Wert ist hoch, wenn ein großer Anteil der Einträge in dieser Spalte null ist.

Geschätzte Eindeutigkeit

Eine Schätzung, wie viele Daten in dieser Spalte eindeutig sind, kategorisiert als „hoch“, „mittel“ oder „niedrig“. Ein hoher Eindeutigkeitsgrad deutet darauf hin, dass die Spalte eindeutige Werte enthält. Ein hoher Anteil an eindeutigen Werten kann darauf hinweisen, dass die Spalte Kennungen enthält.

Ein niedriger Eindeutigkeitsgrad deutet darauf hin, dass die Spalte viele häufig vorkommende Werte wie Enums oder boolesche Werte enthält.

Wenn der Schutz sensibler Daten feststellt, dass nicht genügend Zeilen in der Tabelle vorhanden sind, um diesen Messwert zu berechnen, ist dieser Wert leer.

Wert für freien Text

Die Wahrscheinlichkeit, dass diese Spalte Freitext enthält. Ein Wert nahe 1 gibt an, dass die Spalte wahrscheinlich Freitext oder Natural Language-Text enthält. Mögliche Werte reichen von 0 bis 1.

Ein hoher Wert für freien Text kann die Datenrisiko- und Vertraulichkeitsstufen einer Spalte erhöhen.

Metadaten

Spaltendatenprofile enthalten die folgenden Metadaten:

Datenbank
Die Datenbank, die die Tabelle mit der Spalte enthält, für die ein Profil erstellt wurde. Dieses Feld gilt nur für die Cloud SQL-Erfassung.
Datentyp
Datentyp des Inhalts dieser Spalte.
Dataset-ID
ID des Datasets, das diese Tabellenspalte enthält.
Feld-ID
Name der Spalte.
Instanz
Die Instanz, die die Tabelle mit der Spalte enthält, für die das Profil erstellt wurde. Dieses Feld gilt nur für die Cloud SQL-Erfassung.
Instanzstandort
Speicherort der Instanz, die die Tabelle mit der geprofileten Spalte enthält. Dieses Feld gilt nur für die Cloud SQL-Erkennung.
Zuletzt generiertes Profil
Datum und Uhrzeit der letzten Generierung des Profils.
Richtlinien-Tags
Gibt an, ob ein Richtlinien-Tag auf die Spalte angewendet wird. Informationen zu Best Practices für die Verwendung von Richtlinien-Tags finden Sie unter Richtlinien-Tags in BigQuery verwenden.
Projekt-ID
ID des Projekts, das diese Tabellenspalte enthält.
Ressourcenname
Vollständig qualifizierter Name des Datenprofils.
Status
Symbol, das den Status des Profilerstellungsvorgangs angibt.
Tabellen-ID
ID der Tabelle, die diese Spalte enthält.

Dateispeicherdatenprofile

Beim Schutz sensibler Daten wird der Begriff Dateispeicher für einen Dateispeicher-Bucket verwendet.

Jedes Datenprofil für Dateispeicher enthält die folgenden Felder.

Statistiken

Dateispeicherdatenprofile liefern folgende Informationen:

Datenrisiko
Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Dateicluster
Bietet eine Zusammenfassung für jeden Dateicluster, der beim Erstellen des Profils für diesen Dateispeicher erkannt wurde. Weitere Informationen zu den einzelnen Zusammenfassungen finden Sie auf dieser Seite unter Zusammenfassungen von Dateiclustern.
Vertraulichkeit
Punktzahl, die die Vertraulichkeitsstufe für diesen Dateispeicher angibt. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.

Metadaten

Dateispeicherdatenprofile enthalten die folgenden Metadaten:

Standorte für Datenspeicher

Wenn Sie ein Profil für einen Cloud Storage-Bucket mit zwei Regionen erstellt haben, werden in diesem Feld die beiden Regionen aufgeführt.

Wenn Sie ein Profil für einen Amazon S3-Bucket erstellt haben, ist dies die AWS-Region, in der der Bucket gespeichert ist.

Verschlüsselung

Gibt an, ob die Verschlüsselung für diesen Dateispeicher von Google oder Ihrer Organisation verwaltet wird.

Dateispeichertyp

Die Art der Daten, die profiliert wurden: Cloud Storage-Daten oder Amazon S3-Daten.

Dateispeicherpfad

Der Name des Dateispeichers.

Snapshot der Inspektionskonfiguration

Snapshot der Inspektionsvorlage, die beim Generieren des Profils verwendet wurde. Weitere Informationen finden Sie unter Datenprofil-Snapshots.

Standorttyp

Speicherort des Dateispeichers: region, dual-region oder multi-region.

Profil zuerst erstellt am

Datum und Uhrzeit der ersten Erstellung des Profils.

Profil zuletzt erstellt

Datum und Uhrzeit der letzten Generierung des Profils.

Übergeordnete ID

Die Ressource, zu der die Daten gehören, für die ein Profil erstellt wurde.

  • Wenn das Datenprofil für eine Google Cloud-Ressource gilt, ist dies die ID des Projekts, das die Daten enthält.
  • Wenn das Datenprofil für einen Amazon S3-Bucket gilt, ist dies die ID des AWS-Kontos, das den Bucket enthält.
Öffentlich

Gibt an, ob dieser Dateispeicher für alle Nutzer verfügbar ist oder auf bestimmte Nutzer beschränkt ist.

Ressourcenlabels

Labels des Dateispeichers zum Zeitpunkt der Profilgenerierung.

Ressourcen-Tags

Tags des Dateispeichers bei der Generierung des Profils.

Ressourcenstandort

Region oder Multiregion, die den Dateispeicher enthält.

Wenn Sie ein Cloud Storage-Bucket mit zwei Regionen profiliert haben, hängt dieser Wert davon ab, ob der Bucket in einer vordefinierten Dual-Region gespeichert ist:

  • Bei vordefinierten Dual-Regionen wird dieser Wert von Sensitive Data Protection auf den vordefinierten Namen der Dual-Region festgelegt.
  • Bei standardmäßigen dualen Regionen wird dieser Wert von Sensitive Data Protection auf die Multi-Region festgelegt, die die dualen Regionen enthält. Informationen dazu, wie Regionen auf Multiregionen zugeordnet werden, finden Sie unter Duale Regionen.
Ressourcenname

Vollständig qualifizierter Name des Datenprofils.

Status

Gibt an, ob das Profil erfolgreich generiert wurde.

Dateiclusterzusammenfassungen

Wenn ein Datenprofil für den Dateispeicher generiert wird, werden die Dateien in Dateicluster gruppiert. Sensitive Data Protection bietet eine Zusammenfassung für jeden Dateicluster.

Jede Dateiclusterübersicht enthält die folgenden Felder:

Datenrisiko
Mit den Daten in diesem Dateicluster verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Fehler
Alle Fehler, die beim Generieren des Datenprofils für den Dateispeicher erkannt wurden.
Gescannte Dateiendungen
Liste der Dateitypen, die erkannt und gescannt wurden, um das Datenprofil des Dateispeichers zu generieren.
Gefundene Dateiendungen
Liste der erkannten, aber nicht unbedingt gescannten Dateitypen.
infoTypes
Liste der integrierten und benutzerdefinierten infoTypes, die in diesem Dateicluster erkannt wurden.
Vertraulichkeit
Punktzahl, die die Vertraulichkeitsstufe für diesen Dateicluster angibt. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Typ
Gibt die Kategorie der Dateien in diesem Cluster an. Weitere Informationen zu allen unterstützten Dateiclustern finden Sie unter Dateicluster.