Auf dieser Seite werden alle Messwerte aufgelistet und beschrieben, die in Datenprofilen erfasst werden.
Es gibt drei Arten von Datenprofilen: Projektdatenprofile, Tabellendatenprofile und Spaltendatenprofile.
Projektdatenprofile
Jedes Projektdatenprofil enthält die folgenden Felder. Die Werte für diese Felder werden basierend auf den Ressourcen, die innerhalb des Projekts profiliert werden, aggregiert.
Statistiken
Projektdatenprofile bieten die folgenden Informationen:
- Datenrisiko
- Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
- Sensitivity (Vertraulichkeit)
- Punktzahl, die die Vertraulichkeitsstufe für dieses Projekt angibt. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Metadaten
Projektdatenprofile bieten die folgenden Metadaten:
- Zuletzt generiertes Profil
- Datum und Uhrzeit der letzten Erstellung des Profils
- Projekt-ID
- ID des Projekts, für das ein Profil erstellt wurde.
- Ressourcenname
- Vollständig qualifizierter Name des Datenprofils.
- Status
- Symbol, das den Status des Profilerstellungsvorgangs angibt.
Tabellendatenprofile
Jedes Tabellendatenprofil hat folgende Felder:
Statistiken
Tabellendatenprofile bieten die folgenden Informationen:
- Datenrisiko
- Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
- Sensitivity (Vertraulichkeit)
- Punktzahl, die die Vertraulichkeitsstufe für diese Tabelle angibt. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Metadaten
Tabellendatenprofile bieten die folgenden Metadaten:
- Datenbank
- Die Datenbank mit der Tabelle, für die ein Profil erstellt wurde. Dieses Feld gilt nur für die Cloud SQL-Erkennung.
- Dataset-ID
- ID des Datasets, das diese Tabelle enthält.
- Verschlüsselung
- Gibt an, ob die Verschlüsselung für diese Tabelle von Google oder Ihrer Organisation verwaltet wird.
- Ablaufzeit
- Optional. Die Zeit, zu der diese Tabelle abläuft.
- Anzahl der fehlgeschlagenen Spalten
- Anzahl der in dieser Tabelle aufgrund eines Fehlers übersprungenen Spalten.
- Snapshot der Inspektionskonfiguration
- Snapshot der Inspektionsvorlage, die beim Generieren des Profils verwendet wurde. Weitere Informationen finden Sie unter Datenprofil-Snapshots.
- Instanz
- Die Instanz mit der Tabelle, für die ein Profil erstellt wurde. Dieses Feld gilt nur für die Cloud SQL-Erkennung.
- Zuletzt generiertes Profil
- Datum und Uhrzeit der letzten Erstellung des Profils
- Letzte Aktualisierung in BigQuery
- Datum und Uhrzeit der letzten Änderung dieser Tabelle
- Projekt-ID
- ID des Projekts, das diese Tabelle enthält.
- Öffentlich
- Gibt an, ob diese Tabelle für alle oder nur bestimmte Nutzer verfügbar ist.
- Ressourcenlabels
- Labels der Tabelle bei der Generierung des Profils.
- Ressourcenname
- Vollständig qualifizierter Name des Datenprofils.
- Zeilenanzahl
- Anzahl der Zeilen in dieser Tabelle bei der Erstellung des Profils.
- Anzahl der gescannten Spalten
- Anzahl der Spalten, für die in dieser Tabelle ein Profil erstellt wurde.
- Dienstkonto
- Anzahl der Dienstkonten mit IAM-Berechtigungen für den Zugriff auf diese Tabelle.
- Status
- Angabe, ob das Profil erfolgreich erstellt wurde.
- Tabellen-ID
- ID dieser Tabelle.
- Zeitpunkt der Tabellenerstellung
- Datum und Uhrzeit, zu der die Tabelle erstellt wurde
- Tabellengröße
- Die Größe dieser Tabelle zum Zeitpunkt der Profilerstellung.
- Typ
- Die durchgeführte Art der Erkennung.
Spaltendatenprofile
Jedes Spaltendatenprofil enthält die folgenden Felder:
Statistiken
Spaltendatenprofile bieten folgende Informationen:
- Datenrisiko
- Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
- Sensitivity (Vertraulichkeit)
- Punktzahl, die die Sensibilitätsstufe für diese Spalte angibt. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
- Vorhergesagter infoType
Wenn ein einzelner integrierter oder benutzerdefinierter infoType in der Spalte deutlich überwiegt, legt der Schutz sensibler Daten dieses Feld auf diesen infoType fest. Andernfalls enthält dieses Feld keinen Wert.
Eine Liste aller in der Spalte erkannten infoTypes finden Sie im Feld Andere infoTypes.
Beim Schutz sensibler Daten werden nur die infoTypes gescannt, die Sie in der Inspektionsvorlage angegeben haben. Daher können nur diese infoTypes im Feld Vorhergesagter infoType angezeigt werden. Wenn die Spalte beispielsweise E-Mail-Adressen enthält, Sie aber den infoType-Detektor
EMAIL_ADDRESS
nicht in Ihre Inspektionsvorlage aufgenommen haben, enthält dieses Feld nichtEMAIL_ADDRESS
.In diesem Dokument finden Sie unter Andere infoTypes.
- Andere infoTypes
In der Spalte erkannte infoTypes, die nicht stark genug sind, um als prognostizierter infoType dieser Spalte zu gelten. In diesem Dokument finden Sie unter Vorhergesagter infoType.
Bei Datenprofilen, die nach dem 13. Oktober 2022 erstellt wurden, hat jeder in diesem Feld aufgeführte infoType eine geschätzte Verbreitung. Die geschätzte Verbreitung ist ein ungefährer Prozentsatz der Nicht-Null-Zeilen, in denen der infoType erkannt wurde.
Angenommen, Sie haben eine Spalte mit den folgenden Messwerten:
- Vorhergesagter infoType:
FDA_CODE
- Andere infoTypes:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
In diesem Beispiel gibt es einen starken Hinweis darauf, dass die Spalte FDA-Codes enthält. Der Schutz sensibler Daten hat außerdem festgestellt, dass etwa 2% der Nicht-Null-Zeilen in der Spalte Personennamen und 1% Adressen enthalten können.
Beim Schutz sensibler Daten werden nur die infoTypes gescannt, die Sie in der Inspektionsvorlage angegeben haben. Daher können nur diese infoTypes im Feld Andere infoTypes angezeigt werden. Wenn die Spalte beispielsweise E-Mail-Adressen enthält, Sie aber den infoType-Detektor
EMAIL_ADDRESS
nicht in Ihre Inspektionsvorlage aufgenommen haben, enthält dieses Feld nichtEMAIL_ADDRESS
.- Vorhergesagter infoType:
- Geschätzter Nullanteil
Ungefährer Anteil von Nullwerten in dieser Spalte, kategorisiert als hoch, mittel, niedrig oder sehr niedrig. Dieser Wert ist hoch, wenn ein großer Teil der Einträge in dieser Spalte null ist.
- Geschätzte Eindeutigkeit
Eine Schätzung, wie viele der Daten in dieser Spalte eindeutig sind und als hoch, mittel oder niedrig kategorisiert sind. Ein hoher Eindeutigkeitsgrad deutet darauf hin, dass die Spalte eindeutige Werte enthält. Eine hohe Präsenz eindeutiger Werte kann darauf hindeuten, dass die Spalte Kennungen enthält.
Ein niedriger Eindeutigkeitsgrad deutet darauf hin, dass die Spalte viele gängige Werte wie Enums oder boolesche Werte enthält.
Wenn der Schutz sensibler Daten feststellt, dass nicht genügend Zeilen in der Tabelle vorhanden sind, um diesen Messwert zu berechnen, ist dieser Wert leer.
- Wert für freien Text
Die Wahrscheinlichkeit, dass diese Spalte Freitext enthält. Ein Wert nahe 1 gibt an, dass die Spalte wahrscheinlich Freitext oder Natural Language-Text enthält. Mögliche Werte reichen von 0 bis 1.
Ein hoher Wert für freien Text kann die Datenrisiko- und Vertraulichkeitsstufen einer Spalte erhöhen.
Metadaten
Spaltendatenprofile bieten die folgenden Metadaten:
- Datenbank
- Die Datenbank mit der Tabellenspalte, für die ein Profil erstellt wurde. Dieses Feld gilt nur für die Cloud SQL-Erkennung.
- Datentyp
- Datentyp des Inhalts dieser Spalte.
- Dataset-ID
- ID des Datasets, das diese Tabellenspalte enthält.
- Feld-ID
- Name der Spalte.
- Instanz
- Die Instanz mit der Tabellenspalte, für die ein Profil erstellt wurde. Dieses Feld gilt nur für die Cloud SQL-Erkennung.
- Instanzstandort
- Speicherort der Instanz mit der Tabellenspalte, für die ein Profil erstellt wurde. Dieses Feld gilt nur für die Cloud SQL-Erkennung.
- Zuletzt generiertes Profil
- Datum und Uhrzeit der letzten Erstellung des Profils
- Richtlinien-Tags
- Gibt an, ob ein Richtlinien-Tag auf die Spalte angewendet wird. Informationen zu Best Practices für die Verwendung von Richtlinien-Tags finden Sie unter Richtlinien-Tags in BigQuery verwenden.
- Projekt-ID
- ID des Projekts, das diese Tabellenspalte enthält.
- Ressourcenname
- Vollständig qualifizierter Name des Datenprofils.
- Status
- Symbol, das den Status des Profilerstellungsvorgangs angibt.
- Tabellen-ID
- ID der Tabelle, die diese Spalte enthält.