Referenz zu Transformationsdetails

Auf dieser Seite wird der Inhalt einer Tabelle mit Transformationsdetails beschrieben und es werden Beispielabfragen bereitgestellt, die Sie darauf ausführen können.

Wenn Sie Daten im Speicher de-identifizieren, können Sie den Prüfjob so konfigurieren, dass Details zu jeder durchgeführten Transformation angegeben werden. Der Schutz sensibler Daten schreibt diese Details in eine von Ihnen angegebene BigQuery-Tabelle. In diesem Dokument wird diese Tabelle als Tabelle mit Transformationsdetails bezeichnet.

Inhalt einer Tabelle mit Transformationsdetails

In diesem Abschnitt werden die Inhalte der Tabelle mit den Transformationsdetails aufgeführt und beschrieben.

ressource_name

Der Name des Inspektionsjobs, mit dem die Transformation abgeschlossen wurde.

container_name

Die Datei mit den transformierten Daten.

Transformation

Details zur Transformation. Dieses Feld enthält die folgenden Eigenschaften:

Typ

Die Transformationsmethode, die der Schutz sensibler Daten auf das Ergebnis angewendet hat. Im Folgenden sind einige mögliche Werte aufgeführt:

description

Eine Stringdarstellung der Transformation. Der Wert ist die Ausgabe eines toString()-Aufrufs an die PrimitiveTransformation-Protokollbuffernachricht für alle Arten von Transformationen mit Ausnahme einer RecordSuppression. Wenn die Transformationsmethode die Ausblendung von Datensätzen ist, ist dieses Feld leer.

Bedingung

Eine Stringdarstellung der RecordCondition für die Transformation. Dieses Feld wird nur festgelegt, wenn anhand einer Datensatzbedingung ermittelt wurde, ob die Transformation für den Schutz sensibler Daten angewendet werden muss. Beispiele:

  • (age_field <= 18)
  • (zip_field exists)
  • (zip_field == 01234) && (age_field <= 18) && (city_field exists)
infoType

Details zur Art der Informationen, die im Ergebnis erkannt wurden. Dieses Feld enthält die folgenden Eigenschaften:

name
Name der vordefinierten oder benutzerdefinierten infoType.
Version
-Version der infoType.

status_details

Details zum Status der Transformation. Wenn die Transformation fehlgeschlagen ist, wird in diesem Feld die Ursache angegeben. Dieses Feld enthält die folgenden Eigenschaften:

result_status_type

Ein Code, der den Status des Umwandlungsversuchs angibt. Folgende Werte sind möglich:

  • STATE_TYPE_UNSPECIFIED: Der Schutz sensibler Daten konnte den Status der Transformation nicht ermitteln.
  • INVALID_TRANSFORM: Der Schutz sensibler Daten konnte die Befundbeschreibung nicht ändern.
  • METADATA_UNRETRIEVABLE: In den benutzerdefinierten Metadaten einer Datei wurde ein Ergebnis gefunden. Beim Schreiben der transformierten Datei konnten die Metadaten nicht mit dem Schutz sensibler Daten abgerufen werden.
  • SUCCESS: Die Transformation war erfolgreich.
Details

Zusätzliche Statusdetails. Dieses Feld entspricht den in Status definierten Spezifikationen. Dieses Feld enthält die folgenden Eigenschaften:

Code
Fehlercode
Nachricht
Fehlermeldung
Details
Eine Liste von Meldungen, die die Fehlerdetails enthalten.

transformed_bytes

Die Anzahl der Byte, die mit Sensitive Data Protection transformiert wurden. Wenn die Transformation fehlgeschlagen ist oder keine Inhalte transformiert werden konnten, ist der Wert 0.

transformation_location

Details zum Speicherort der Transformation.

Im folgenden JSON-Beispiel für einen Transformationsort wurde vom Schutz sensibler Daten eine infoType-Transformation ausgeführt:

{
    "finding_id": "2022-05-23T23:51:29.775337Z831678185946560283",
    "record_transformation": null,
    "container_type": "TRANSFORM_BODY"
}

Im folgenden JSON-Beispiel für einen Transformationsort wurde durch den Schutz sensibler Daten eine Datensatztransformation durchgeführt:

{
    "finding_id": null,
    "record_transformation": {
      "field_id": {
        "name": " \"Name\""
      },
      "container_timestamp": {
        "timestamp": null,
        "seconds": "1654796423",
        "nanos": "763000000"
      },
      "container_version": "1654796423733485"
    },
    "container_type": "TRANSFORM_TABLE"
  }
}

Wie die Beispiele zeigen, wird in Sensitive Data Protection je nach Art der durchgeführten Transformation entweder finding_id oder record_transformation eingefügt. Die beiden Felder schließen sich gegenseitig aus.

finding_id
Dieses Feld wird festgelegt, wenn vom Schutz sensibler Daten eine Infotyptransformation ausgeführt wurde. Jede Ergebnis-ID entspricht einem Eintrag in der Ergebnistabelle. Die Ausgabetabelle mit den Ergebnissen enthält alle Ergebnisse, die der Schutz sensibler Daten während der Prüfung erkannt hat. Diese Tabelle wird nur erstellt, wenn Sie Ihren Inspektionsjob so konfiguriert haben, dass Ergebnisse in BigQuery gespeichert werden.
record_transformation

Dieses Feld wird festgelegt, wenn der Schutz sensibler Daten eine Datensatztransformation für tabellarische Daten durchgeführt hat. Dieses Feld enthält die folgenden Eigenschaften:

field_id
Die Tabellenspalte, die das Ergebnis enthält.
container_timestamp
Zeitstempel der letzten Änderung der Datei.
container_version
Generierungsnummer der Datei, die das Ergebnis enthält.
container_type

Informationen zur Funktionsweise der Daten, die den Befund enthalten. Folgende Werte sind möglich:

  • TRANSFORM_UNKNOWN_CONTAINER: Der Schutz sensibler Daten konnte den Datentyp nicht ermitteln, der das Ergebnis enthält.
  • TRANSFORM_BODY: Der Sensitive Data Protection-Filter hat den Hinweis im Text einer Datei gefunden.
  • TRANSFORM_METADATA: Der Sensitive Data Protection-Filter hat den Hinweis in den Metadaten einer Datei gefunden.
  • TRANSFORM_TABLE: Der Sensitive Data Protection-Algorithmus hat den Fehler in der Tabelle erkannt.

Beispielabfragen

Im Folgenden finden Sie Beispiele für Abfragen, die Sie auf die Tabelle mit den Transformationsdetails ausführen können. Informationen zum Abfragen einer BigQuery-Tabelle finden Sie unter Interaktive Abfragen ausführen.

Alle fehlgeschlagenen Transformationen auswählen

SELECT *
    FROM `PROJECT_ID.DATASET_ID.TABLE_ID`
    WHERE status_details.result_status_type != "SUCCESS";

Ersetzen Sie Folgendes:

  • PROJECT_ID: die ID des Projekts, das die Tabelle mit den Transformationsdetails enthält.
  • DATASET_ID: die ID des BigQuery-Datasets, das die Tabelle mit den Transformationsdetails enthält.
  • TABLE_ID: die ID der Tabelle mit den Transformationsdetails.

Anzahl der Dateien mit Transformationsfehlern zählen

SELECT COUNT(DISTINCT(container_name))
    FROM `PROJECT_ID.DATASET_ID.TABLE_ID`
    WHERE status_details.result_status_type != "SUCCESS";

Alle Transformationen auswählen, bei denen die Zeichenmaskierung verwendet wurde

SELECT resource_name, container_name, info_type.name
    FROM `PROJECT_ID.DATASET_ID.TABLE_ID`,
    UNNEST(transformation) AS tr
    WHERE tr.type LIKE "CHARACTER_MASK";

Nächste Schritte