Referenz zu Messwerten

Auf dieser Seite werden alle Messwerte aufgelistet und beschrieben, die in Datenprofilen erfasst werden.

Es gibt drei Arten von Datenprofilen: Projektdatenprofile, Tabellendatenprofile und Spaltendatenprofile.

Projektdatenprofile

Jedes Projektdatenprofil enthält die folgenden Felder. Die Werte für diese Felder werden basierend auf den Ressourcen, die innerhalb des Projekts profiliert werden, aggregiert.

Statistiken

Projektdatenprofile bieten folgende Informationen:

Datenrisiko
Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Sensitivity (Vertraulichkeit)
Punktzahl, die die Vertraulichkeitsstufe für dieses Projekt angibt. Weitere Informationen finden Sie unter Empfindlichkeits- und Datenrisikostufen.

Metadaten

Projektdatenprofile enthalten die folgenden Metadaten:

Zuletzt generiertes Profil
Datum und Uhrzeit der letzten Generierung des Profils
Projekt-ID
ID des Projekts, für das ein Profil erstellt wurde.
Ressourcenname
Vollständig qualifizierter Name des Datenprofils.
Status
Symbol, das den Status des Profilerstellungsvorgangs angibt.

Tabellendatenprofile

Jedes Tabellendatenprofil hat folgende Felder:

Statistiken

Tabellendatenprofile bieten folgende Informationen:

Datenrisiko
Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Sensitivity (Vertraulichkeit)
Punktzahl, die die Vertraulichkeitsstufe für diese Tabelle angibt. Weitere Informationen finden Sie unter Empfindlichkeits- und Datenrisikoniveaus.

Metadaten

Tabellendatenprofile enthalten die folgenden Metadaten:

Dataset-ID
ID des Datasets, das diese Tabelle enthält.
Verschlüsselung
Gibt an, ob die Verschlüsselung für diese Tabelle von Google oder Ihrer Organisation verwaltet wird.
Ablaufzeit
Optional. Die Zeit, zu der diese Tabelle abläuft.
Anzahl der fehlgeschlagenen Spalten
Anzahl der in dieser Tabelle aufgrund eines Fehlers übersprungenen Spalten.
Snapshot der Inspektionskonfiguration
Snapshot der Inspektionsvorlage, die beim Generieren des Profils verwendet wurde. Weitere Informationen finden Sie unter Datenprofil-Snapshots.
Zuletzt generiertes Profil
Datum und Uhrzeit der letzten Generierung des Profils
Letzte Aktualisierung in BigQuery
Datum und Uhrzeit der letzten Änderung der Tabelle.
Projekt-ID
ID des Projekts, das diese Tabelle enthält.
Öffentlich
Gibt an, ob diese Tabelle für alle oder nur bestimmte Nutzer verfügbar ist.
Ressourcenlabels
Labels der Tabelle bei der Generierung des Profils.
Ressourcenname
Vollständig qualifizierter Name des Datenprofils.
Zeilenanzahl
Anzahl der Zeilen in dieser Tabelle bei der Erstellung des Profils.
Anzahl der gescannten Spalten
Anzahl der Spalten, für die in dieser Tabelle ein Profil erstellt wurde.
Dienstkonto
Anzahl der Dienstkonten mit IAM-Berechtigungen für den Zugriff auf diese Tabelle.
Status
Gibt an, ob das Profil erfolgreich generiert wurde.
Tabellen-ID
ID dieser Tabelle.
Zeitpunkt der Tabellenerstellung
Datum und Uhrzeit der Tabellenerstellung
Tabellengröße
Die Größe dieser Tabelle bei der Erstellung des Profils.

Spaltendatenprofile

Jedes Spaltendatenprofil enthält die folgenden Felder:

Statistiken

Spaltendatenprofile bieten folgende Informationen:

Datenrisiko
Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Sensitivity (Vertraulichkeit)
Punktzahl für die Empfindlichkeitsstufe dieser Spalte. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Vorhergesagter infoType

Wenn ein einzelner integrierter oder benutzerdefinierter infoType in der Spalte deutlich überwiegt, legt Cloud DLP dieses Feld auf diesen infoType fest. Andernfalls hat dieses Feld keinen Wert.

Eine Liste aller in der Spalte erkannten infoTypes finden Sie im Feld Andere infoTypes.

Cloud DLP sucht nur nach den infoTypes, die Sie in der Inspektionsvorlage angegeben haben. Daher können nur diese infoTypes im Feld Predicted infoType angezeigt werden. Wenn die Spalte beispielsweise E-Mail-Adressen enthält, Sie jedoch den infoType-Detektor EMAIL_ADDRESS nicht in Ihre Inspektionsvorlage eingefügt haben, enthält dieses Feld nicht EMAIL_ADDRESS.

In diesem Dokument wird auf Andere infoTypes eingegangen.

Andere infoTypes

Die in der Spalte erkannten infoTypes, die nicht stark genug sind, um als vorhergesagter infoType dieser Spalte zu gelten, werden berücksichtigt. In diesem Dokument finden Sie Vorhersage-info.

Für Datenprofile, die nach dem 13. Oktober 2022 generiert wurden, hat jeder in diesem Feld aufgeführte infoType eine geschätzte Verbreitung. Die geschätzte Verbreitung ist ein ungefährer Prozentsatz von Nicht-Null-Zeilen, in denen der infoType erkannt wurde.

Angenommen, Sie haben eine Spalte mit den folgenden Messwerten:

  • Prognostizierter infoType: FDA_CODE
  • Andere infoTypes: PERSON_NAME (2%), STREET_ADDRESS (1%)

In diesem Beispiel gibt es einen klaren Hinweis darauf, dass die Spalte FDA-Codes enthält. Cloud DLP hat außerdem festgestellt, dass etwa 2% der Nicht-Null-Zeilen in der Spalte Personennamen und 1% Adressen enthalten können.

Cloud DLP sucht nur nach den infoTypes, die Sie in der Inspektionsvorlage angegeben haben. Daher können nur diese infoTypes im Feld Other infoTypes angezeigt werden. Wenn die Spalte beispielsweise E-Mail-Adressen enthält, Sie den infoType-Detektor EMAIL_ADDRESS aber nicht in Ihre Inspektionsvorlage eingefügt haben, enthält dieses Feld nicht EMAIL_ADDRESS.

Geschätzter Nullanteil

Ungefährer Anteil der Nullwerte in dieser Spalte, die als hoch, mittel, niedrig oder sehr niedrig kategorisiert sind. Dieser Wert ist hoch, wenn ein großer Anteil der Einträge in dieser Spalte null ist.

Geschätzte Eindeutigkeit

Eine Schätzung, wie viele der Daten in dieser Spalte eindeutig, hoch, mittel oder niedrig sind. Eine hohe Eindeutigkeitsstufe deutet darauf hin, dass die Spalte eindeutige Werte enthält. Eine hohe Präsenz eindeutiger Werte kann darauf hinweisen, dass die Spalte Kennungen enthält.

Eine niedrige Eindeutigkeitsstufe deutet darauf hin, dass die Spalte viele gängige Werte wie Enums oder boolesche Werte enthält.

Wenn Cloud DLP feststellt, dass nicht genügend Zeilen in der Tabelle vorhanden sind, um diesen Messwert zu berechnen, ist dieser Wert leer.

Wert für freien Text

Die Wahrscheinlichkeit, dass diese Spalte Freitext enthält. Ein Wert nahe 1 gibt an, dass die Spalte wahrscheinlich Freitext oder Natural Language-Text enthält. Mögliche Werte reichen von 0 bis 1.

Ein hoher Wert für freien Text kann die Datenrisiko- und Vertraulichkeitsstufen einer Spalte erhöhen.

Metadaten

Spaltendatenprofile enthalten die folgenden Metadaten:

Datentyp
Datentyp des Inhalts dieser Spalte.
Dataset-ID
ID des Datasets, das diese Tabellenspalte enthält.
Feld-ID
Name der Spalte.
Zuletzt generiertes Profil
Datum und Uhrzeit der letzten Generierung des Profils
Richtlinien-Tags
Gibt an, ob ein Richtlinien-Tag auf die Spalte angewendet wird. Informationen zu Best Practices für die Verwendung von Richtlinien-Tags finden Sie unter Richtlinien-Tags in BigQuery verwenden.
Projekt-ID
ID des Projekts, das diese Tabellenspalte enthält.
Ressourcenname
Vollständig qualifizierter Name des Datenprofils.
Status
Symbol, das den Status des Profilerstellungsvorgangs angibt.
Tabellen-ID
ID der Tabelle, die diese Spalte enthält.