Auf dieser Seite werden alle Messwerte aufgelistet und beschrieben, die in Datenprofilen erfasst werden.
Es gibt drei Arten von Datenprofilen: Projektdatenprofile, Tabellendatenprofile und Spaltendatenprofile.
Projektdatenprofile
Jedes Projektdatenprofil enthält die folgenden Felder. Die Werte für diese Felder werden basierend auf den Ressourcen, die innerhalb des Projekts profiliert werden, aggregiert.
Statistiken
Projektdatenprofile liefern folgende Informationen:
- Datenrisiko
- Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
- Vertraulichkeit
- Punktzahl, die die Vertraulichkeitsstufe für dieses Projekt angibt. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Metadaten
Projektdatenprofile enthalten die folgenden Metadaten:
- Zuletzt generiertes Profil
- Datum und Uhrzeit der letzten Generierung des Profils.
- Projekt-ID
- ID des Projekts, für das ein Profil erstellt wurde.
- Ressourcenname
- Vollständig qualifizierter Name des Datenprofils.
- Status
- Symbol, das den Status des Profilerstellungsvorgangs angibt.
Tabellendatenprofile
Jedes Tabellendatenprofil hat folgende Felder:
Statistiken
Tabellendatenprofile liefern die folgenden Informationen:
- Datenrisiko
- Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
- Vertraulichkeit
- Punktzahl, die die Vertraulichkeitsstufe für diese Tabelle angibt. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Metadaten
Tabellendatenprofile enthalten die folgenden Metadaten:
- Datenbank
- Die Datenbank, die die Tabelle enthält, für die ein Profil erstellt wurde. Dieses Feld gilt nur für die Cloud SQL-Ermittlung.
- Dataset-ID
- ID des Datasets, das diese Tabelle enthält.
- Verschlüsselung
- Gibt an, ob die Verschlüsselung für diese Tabelle von Google oder Ihrer Organisation verwaltet wird.
- Ablaufzeit
- Optional. Die Zeit, zu der diese Tabelle abläuft.
- Anzahl der fehlgeschlagenen Spalten
- Anzahl der in dieser Tabelle aufgrund eines Fehlers übersprungenen Spalten.
- Snapshot der Inspektionskonfiguration
- Snapshot der Inspektionsvorlage, die beim Generieren des Profils verwendet wurde. Weitere Informationen finden Sie unter Datenprofil-Snapshots.
- Instanz
- Die Instanz, die die profilierte Tabelle enthält. Dieses Feld gilt nur für die Cloud SQL-Ermittlung.
- Zuletzt generiertes Profil
- Datum und Uhrzeit der letzten Generierung des Profils.
- Letzte Aktualisierung in BigQuery
- Datum und Uhrzeit der letzten Änderung an dieser Tabelle.
- Projekt-ID
- ID des Projekts, das diese Tabelle enthält.
- Öffentlich
Gibt an, ob diese Tabelle für alle oder nur bestimmte Nutzer verfügbar ist.
- Ressourcenlabels
Labels der Tabelle bei der Generierung des Profils.
- Ressourcen-Tags
Tags der Tabelle bei der Generierung des Profils.
- Ressourcenname
Vollständig qualifizierter Name des Datenprofils.
- Zeilenanzahl
Anzahl der Zeilen in dieser Tabelle bei der Erstellung des Profils.
- Anzahl der gescannten Spalten
Die Anzahl der Spalten, für die in dieser Tabelle ein Profil erstellt wurde.
- Dienstkonto
Anzahl der Dienstkonten mit IAM-Berechtigungen für den Zugriff auf diese Tabelle.
- Status
Gibt an, ob das Profil erfolgreich generiert wurde.
- Tabellen-ID
ID dieser Tabelle.
- Zeitpunkt der Tabellenerstellung
Datum und Uhrzeit der Tabellenerstellung.
- Tabellengröße
Die Größe dieser Tabelle bei der Erstellung des Profils.
- Typ
Die Art der Erkennung, die durchgeführt wurde.
Spaltendatenprofile
Jedes Spaltendatenprofil enthält die folgenden Felder:
Statistiken
Spaltendatenprofile liefern die folgenden Informationen:
- Datenrisiko
- Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
- Vertraulichkeit
- Punktzahl, die die Vertraulichkeitsstufe für diese Spalte angibt. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
- Vorhergesagter infoType
Wenn ein einzelner integrierter oder benutzerdefinierter infoType in der Spalte deutlich überwiegt, wird dieses Feld von Sensitive Data Protection auf diesen infoType festgelegt. Andernfalls hat dieses Feld keinen Wert.
Eine Liste aller in der Spalte erkannten infoTypes finden Sie im Feld Andere infoTypes.
Der Schutz sensibler Daten sucht nur nach den infoTypes, die Sie in der Inspektionsvorlage angegeben haben. Daher können nur diese infoTypes im Feld Vorhergesagter infoType angezeigt werden. Wenn die Spalte beispielsweise E-Mail-Adressen enthält, Sie aber den infoType-Detektor
EMAIL_ADDRESS
nicht in Ihre Inspektionsvorlage eingefügt haben, enthält dieses Feld nichtEMAIL_ADDRESS
.Wenn die Spaltendaten überwiegend mit mehreren eng verwandten infoTypes übereinstimmen, die zur selben allgemeinen Kategorie gehören, wird dieses Feld in Sensitive Data Protection auf den allgemeineren infoType festgelegt. Wenn die Spalte beispielsweise hauptsächlich eine Mischung aus den infoTypes
PASSPORT
,AUSTRALIA_PASSPORT
undCANADA_PASSPORT
enthält, wird das Feld Vorhergesagter infoType aufPASSPORT
festgelegt. Im Feld Andere infoTypes werden die spezifischeren infoTypes und ihre geschätzte Verbreitung angezeigt.- Andere infoTypes
In der Spalte erkannte infoTypes, die kein stark genuges Signal haben, um als vorhergesagter infoType der Spalte betrachtet zu werden. Weitere Informationen finden Sie in diesem Dokument unter Vorhergesagter infoType.
Für Datenprofile, die nach dem 13. Oktober 2022 generiert wurden, hat jeder in diesem Feld aufgeführte infoType eine geschätzte Häufigkeit. Die geschätzte Verbreitung ist ein ungefährer Prozentsatz der Nicht-Null-Zeilen, in denen der infoType erkannt wurde.
Angenommen, Sie haben eine Spalte mit den folgenden Messwerten:
- Vorhergesagter infoType:
FDA_CODE
- Andere infoTypes:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
In diesem Beispiel gibt es einen starken Hinweis darauf, dass die Spalte FDA-Codes enthält. Mit dem Schutz sensibler Daten wurde außerdem ermittelt, dass etwa 2% der Zeilen, die nicht null sind, in der Spalte möglicherweise Personennamen und 1% möglicherweise Straßenadressen enthalten.
Der Schutz sensibler Daten sucht nur nach den infoTypes, die Sie in der Inspektionsvorlage angegeben haben. Daher können nur diese infoTypes im Feld Andere infoTypes angezeigt werden. Wenn die Spalte beispielsweise E-Mail-Adressen enthält, Sie aber den infoType-Detektor
EMAIL_ADDRESS
nicht in Ihre Inspektionsvorlage eingefügt haben, enthält dieses Feld nichtEMAIL_ADDRESS
.- Vorhergesagter infoType:
- Geschätzter Nullanteil
Ungefährer Anteil von Nullwerten in dieser Spalte, kategorisiert als „hoch“, „mittel“, „niedrig“ oder „sehr niedrig“. Dieser Wert ist hoch, wenn ein großer Teil der Einträge in dieser Spalte null ist.
- Geschätzte Eindeutigkeit
Eine Schätzung, wie viele Daten in dieser Spalte eindeutig sind. Die Werte werden als „hoch“, „mittel“ oder „niedrig“ kategorisiert. Ein hoher Eindeutigkeitsgrad deutet darauf hin, dass die Spalte eindeutige Werte enthält. Ein hoher Anteil eindeutiger Werte kann darauf hindeuten, dass die Spalte Kennungen enthält.
Ein niedriger Eindeutigkeitsgrad deutet darauf hin, dass die Spalte viele häufig vorkommende Werte wie Enums oder boolesche Werte enthält.
Wenn die Funktion zum Schutz sensibler Daten feststellt, dass nicht genügend Zeilen in der Tabelle vorhanden sind, um diesen Messwert zu berechnen, ist dieser Wert leer.
- Wert für freien Text
Die Wahrscheinlichkeit, dass diese Spalte Freitext enthält. Ein Wert nahe 1 gibt an, dass die Spalte wahrscheinlich Freitext oder Natural Language-Text enthält. Mögliche Werte reichen von 0 bis 1.
Ein hoher Wert für freien Text kann die Datenrisiko- und Vertraulichkeitsstufen einer Spalte erhöhen.
Metadaten
Spaltendatenprofile enthalten die folgenden Metadaten:
- Datenbank
- Die Datenbank, die die Tabellenspalte enthält, für die ein Profil erstellt wurde. Dieses Feld gilt nur für die Cloud SQL-Ermittlung.
- Datentyp
- Datentyp des Inhalts dieser Spalte.
- Dataset-ID
- ID des Datasets, das diese Tabellenspalte enthält.
- Feld-ID
- Name der Spalte.
- Instanz
- Die Instanz, die die profilierte Tabellenspalte enthält. Dieses Feld gilt nur für die Cloud SQL-Ermittlung.
- Instanzstandort
- Speicherort der Instanz, die die profilierte Tabellenspalte enthält. Dieses Feld gilt nur für die Cloud SQL-Erkennung.
- Zuletzt generiertes Profil
- Datum und Uhrzeit der letzten Generierung des Profils.
- Richtlinien-Tags
- Gibt an, ob ein Richtlinien-Tag auf die Spalte angewendet wird. Informationen zu Best Practices für die Verwendung von Richtlinien-Tags finden Sie unter Richtlinien-Tags in BigQuery verwenden.
- Projekt-ID
- ID des Projekts, das diese Tabellenspalte enthält.
- Ressourcenname
- Vollständig qualifizierter Name des Datenprofils.
- Status
- Symbol, das den Status des Profilerstellungsvorgangs angibt.
- Tabellen-ID
- ID der Tabelle, die diese Spalte enthält.
Datenprofile für Dateispeicher
Beim Schutz sensibler Daten wird der Begriff Dateispeicher für einen Bucket oder Container für die Dateispeicherung verwendet.
Jedes Profil für Dateispeicherdaten enthält die folgenden Felder.
Statistiken
Datenprofile für Dateispeicher liefern die folgenden Informationen:
- Datenrisiko
- Mit den Daten im aktuellen Zustand verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
- Dateicluster
- Enthält eine Zusammenfassung für jeden Dateicluster, der beim Erstellen des Profils für diesen Dateispeicher erkannt wurde. Weitere Informationen zu den einzelnen Zusammenfassungen finden Sie auf dieser Seite unter Zusammenfassungen von Dateiclustern.
- Vertraulichkeit
- Punktzahl, die die Vertraulichkeitsstufe für diesen Dateispeicher angibt. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
Metadaten
Datenprofile für Dateispeicher enthalten die folgenden Metadaten:
- Standorte für Datenspeicher
Wenn Sie ein Profil für einen Cloud Storage-Bucket mit zwei Regionen erstellt haben, werden in diesem Feld die beiden Regionen aufgeführt.
Wenn Sie ein Dateispeicher aus einem anderen Cloud-Anbieter profiliert haben, ist dieser Wert die Region, in der der Cloud-Anbieter den Dateispeicher speichert.
- Verschlüsselung
Gibt an, ob die Verschlüsselung für diesen Dateispeicher von Google oder Ihrer Organisation verwaltet wird.
- Dateispeichertyp
Die Quelle der profilierten Daten: Cloud Storage, Amazon S3 oder Azure Blob Storage.
- Dateispeicherpfad
Der Name des Dateispeichers.
- Snapshot der Inspektionskonfiguration
Snapshot der Inspektionsvorlage, die beim Generieren des Profils verwendet wurde. Weitere Informationen finden Sie unter Datenprofil-Snapshots.
- Standorttyp
Typ des Speicherorts, an dem der Dateispeicher gespeichert wird:
region
,dual-region
odermulti-region
.- Profil zuerst erstellt am
Datum und Uhrzeit der erstmaligen Erstellung des Profils.
- Profil zuletzt erstellt
Datum und Uhrzeit der letzten Generierung des Profils.
- Übergeordnete ID
Die Ressource, zu der die Daten gehören, für die ein Profil erstellt wurde.
- Wenn das Datenprofil für eine Google Cloud -Ressource gilt, ist dies die ID des Projekts, das die Daten enthält.
- Wenn das Datenprofil für einen Amazon S3-Bucket ist, ist dies die ID des AWS-Kontos, das den Bucket enthält.
- Wenn das Datenprofil für einen Azure Blob Storage-Container ist, ist dies die ID des Azure-Abos, das den Container enthält.
- Öffentlich
Gibt an, ob dieser Dateispeicher für alle oder nur bestimmte Nutzer verfügbar ist.
- Ressourcenlabels
Labels, die der Dateispeicher bei der Profilgenerierung hatte.
- Ressourcen-Tags
Tags, die der Dateispeicher bei der Generierung des Profils hatte.
- Ressourcenstandort
Die Region oder Multiregion, die den Dateispeicher enthält.
Wenn Sie ein Profil für einen Cloud Storage-Bucket mit zwei Regionen erstellt haben, hängt dieser Wert davon ab, ob der Bucket in einer vordefinierten Dual-Region gespeichert ist:
- Bei vordefinierten Dual-Regionen wird dieser Wert von Sensitive Data Protection auf den Namen der vordefinierten Dual-Region festgelegt.
- Bei Standard-Dual-Regionen wird dieser Wert von Sensitive Data Protection auf die Multiregion festgelegt, die die Dual-Regionen enthält. Informationen dazu, wie Regionen Multiregionen zugeordnet werden, finden Sie unter Duale Regionen.
- Ressourcenname
Vollständig qualifizierter Name des Datenprofils.
- Status
Gibt an, ob das Profil erfolgreich generiert wurde.
Zusammenfassungen von Dateiclustern
Wenn ein Datenprofil für einen Dateispeicher generiert wird, werden die Dateien in Dateicluster gruppiert. Sensitive Data Protection bietet eine Zusammenfassung für jeden Dateicluster.
Jede Dateiclusterzusammenfassung enthält die folgenden Felder:
- Datenrisiko
- Mit den Daten in diesem Dateicluster verbundene Risikostufe. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
- Fehler
- Alle Fehler, die beim Generieren des Datenprofils für den Dateispeicher erkannt wurden.
- Gescannte Dateiendungen
- Liste der Dateitypen, die erkannt und gescannt wurden, um das Dateispeicher-Datenprofil zu erstellen.
- Gesehene Dateiendungen
- Liste der erkannten, aber nicht unbedingt gescannten Dateitypen.
- infoTypes
- Liste der integrierten und benutzerdefinierten infoTypes, die in diesem Dateicluster erkannt wurden.
- Vertraulichkeit
- Punktzahl, die die Vertraulichkeitsstufe für diesen Dateicluster angibt. Weitere Informationen finden Sie unter Vertraulichkeits- und Datenrisikostufen.
- Typ
Gibt die Kategorie der Dateien in diesem Cluster an. Weitere Informationen zu allen unterstützten Dateiclustern finden Sie unter Unterstützte Dateicluster bei Ermittlungsvorgängen.