Auf dieser Seite wird der Inhalt einer Tabelle mit Transformationsdetails beschrieben und es werden Beispielabfragen bereitgestellt, die Sie darauf ausführen können.
Wenn Sie Daten im Speicher de-identifizieren, können Sie den Prüfjob so konfigurieren, dass Details zu jeder durchgeführten Transformation angegeben werden. Der Schutz sensibler Daten schreibt diese Details in eine von Ihnen angegebene BigQuery-Tabelle. In diesem Dokument wird diese Tabelle als Tabelle mit Transformationsdetails bezeichnet.
Inhalt einer Tabelle mit Transformationsdetails
In diesem Abschnitt werden die Inhalte der Tabelle mit den Transformationsdetails aufgeführt und beschrieben.
ressource_name
Der Name des Inspektionsjobs, mit dem die Transformation abgeschlossen wurde.
container_name
Die Datei mit den transformierten Daten.
Transformation
Details zur Transformation. Dieses Feld enthält die folgenden Eigenschaften:
- Typ
Die Transformationsmethode, die der Schutz sensibler Daten auf das Ergebnis angewendet hat. Im Folgenden sind einige mögliche Werte aufgeführt:
- description
Eine Stringdarstellung der Transformation. Der Wert ist die Ausgabe eines
toString()
-Aufrufs an die Protokoll-Buffer-NachrichtPrimitiveTransformation
für alle Arten von Transformationen mit Ausnahme vonRecordSuppression
. Wenn die Transformationsmethode die Ausblendung von Datensätzen ist, ist dieses Feld leer.- Bedingung
Eine Stringdarstellung der
RecordCondition
für die Transformation. Dieses Feld wird nur festgelegt, wenn anhand einer Datensatzbedingung ermittelt wurde, ob die Transformation für den Schutz sensibler Daten angewendet werden muss. Beispiele:(age_field <= 18)
(zip_field exists)
(zip_field == 01234) && (age_field <= 18) && (city_field exists)
- infoType
Details zur Art der Informationen, die im Ergebnis erkannt wurden. Dieses Feld enthält die folgenden Eigenschaften:
- name
- Name der vordefinierten oder benutzerdefinierten
infoType
. - Version
- -Version der
infoType
.
status_details
Details zum Status der Transformation. Wenn die Transformation fehlgeschlagen ist, wird in diesem Feld die Ursache angegeben. Dieses Feld enthält die folgenden Eigenschaften:
- result_status_type
Ein Code, der den Status des Umwandlungsversuchs angibt. Folgende Werte sind möglich:
STATE_TYPE_UNSPECIFIED
: Der Schutz sensibler Daten konnte den Status der Transformation nicht ermitteln.INVALID_TRANSFORM
: Der Schutz sensibler Daten konnte die Befundbeschreibung nicht ändern.METADATA_UNRETRIEVABLE
: In den benutzerdefinierten Metadaten einer Datei wurde ein Ergebnis gefunden. Beim Schreiben der transformierten Datei konnten die Metadaten nicht vom Schutz sensibler Daten abgerufen werden.SUCCESS
: Die Transformation war erfolgreich.
- Details
Zusätzliche Statusdetails. Dieses Feld entspricht den in
Status
definierten Spezifikationen. Dieses Feld enthält die folgenden Eigenschaften:- Code
- Fehlercode
- Nachricht
- Fehlermeldung
- Details
- Eine Liste von Meldungen, die die Fehlerdetails enthalten.
transformed_bytes
Die Anzahl der Byte, die mit Sensitive Data Protection transformiert wurden. Wenn die Transformation fehlgeschlagen ist oder keine Inhalte transformiert werden konnten, ist der Wert 0
.
transformation_location
Details zum Speicherort der Transformation.
Im folgenden JSON-Beispiel für einen Transformationsort wurde vom Schutz sensibler Daten eine infoType-Transformation ausgeführt:
{
"finding_id": "2022-05-23T23:51:29.775337Z831678185946560283",
"record_transformation": null,
"container_type": "TRANSFORM_BODY"
}
Im folgenden JSON-Beispiel für einen Transformationsort wurde durch den Schutz sensibler Daten eine Datensatztransformation durchgeführt:
{
"finding_id": null,
"record_transformation": {
"field_id": {
"name": " \"Name\""
},
"container_timestamp": {
"timestamp": null,
"seconds": "1654796423",
"nanos": "763000000"
},
"container_version": "1654796423733485"
},
"container_type": "TRANSFORM_TABLE"
}
}
Wie die Beispiele zeigen, wird in Sensitive Data Protection je nach Art der durchgeführten Transformation entweder finding_id
oder record_transformation
eingefügt.
Die beiden Felder schließen sich gegenseitig aus.
- finding_id
- Dieses Feld wird festgelegt, wenn der Schutz sensibler Daten eine Infotyptransformation durchgeführt hat. Jede Ergebnis-ID entspricht einem Eintrag in der Ergebnistabelle. Die Ausgabetabelle mit den Ergebnissen enthält alle Ergebnisse, die der Schutz sensibler Daten während der Prüfung erkannt hat. Diese Tabelle wird nur erstellt, wenn Sie Ihren Inspektionsjob so konfiguriert haben, dass Ergebnisse in BigQuery gespeichert werden.
- record_transformation
Dieses Feld wird festgelegt, wenn der Schutz sensibler Daten eine Datensatztransformation für tabellarische Daten durchgeführt hat. Dieses Feld enthält die folgenden Eigenschaften:
- field_id
- Die Tabellenspalte, die das Ergebnis enthält.
- container_timestamp
- Zeitstempel der letzten Änderung der Datei.
- container_version
- Generierungsnummer der Datei, die das Ergebnis enthält.
- container_type
Informationen zur Funktionsweise der Daten, die den Befund enthalten. Folgende Werte sind möglich:
TRANSFORM_UNKNOWN_CONTAINER
: Der Schutz sensibler Daten konnte den Datentyp nicht ermitteln, der das Ergebnis enthält.TRANSFORM_BODY
: Der Sensitive Data Protection-Filter hat den Hinweis im Text einer Datei gefunden.TRANSFORM_METADATA
: Der Sensitive Data Protection-Filter hat den Hinweis in den Metadaten einer Datei gefunden.TRANSFORM_TABLE
: Der Sensitive Data Protection-Algorithmus hat den Fehler in der Tabelle erkannt.
Beispielabfragen
Im Folgenden finden Sie Beispiele für Abfragen, die Sie auf die Tabelle mit den Transformationsdetails ausführen können. Informationen zum Abfragen einer BigQuery-Tabelle finden Sie unter Interaktive Abfragen ausführen.
Alle fehlgeschlagenen Transformationen auswählen
SELECT *
FROM `PROJECT_ID.DATASET_ID.TABLE_ID`
WHERE status_details.result_status_type != "SUCCESS";
Ersetzen Sie Folgendes:
PROJECT_ID
: die ID des Projekts, das die Tabelle mit den Transformationsdetails enthält.DATASET_ID
: die ID des BigQuery-Datasets, das die Tabelle mit den Transformationsdetails enthält.TABLE_ID
: die ID der Tabelle mit den Transformationsdetails.
Anzahl der Dateien mit Transformationsfehlern zählen
SELECT COUNT(DISTINCT(container_name))
FROM `PROJECT_ID.DATASET_ID.TABLE_ID`
WHERE status_details.result_status_type != "SUCCESS";
Alle Transformationen auswählen, bei denen die Zeichenmaskierung verwendet wurde
SELECT resource_name, container_name, info_type.name
FROM `PROJECT_ID.DATASET_ID.TABLE_ID`,
UNNEST(transformation) AS tr
WHERE tr.type LIKE "CHARACTER_MASK";
Nächste Schritte
- Weitere Informationen zum Entfernen von Personenidentitäten aus gespeicherten Daten
- Informationen zum Entfernen von Personenidentitäten aus gespeicherten Daten mit der Google Cloud Console
- Informationen zum De-Identifizieren sensibler Daten, die in Cloud Storage gespeichert sind, mit der DLP API
- Sehen Sie sich das Codelab zum Erstellen einer de-identifizierten Kopie von Daten in Cloud Storage an.
- Weitere Informationen zu Transformationen zur De-Identifikation