Zeilen codieren und decodieren

Auf dieser Seite wird erläutert, wie Sie Zeilen codieren und decodieren, wenn Sie Daten im Wrangler-Arbeitsbereich von Cloud Data Fusion Studio vorbereiten.

Zeile codieren

Sie können die Basiscodierung von Daten verwenden, um Daten in Umgebungen zu speichern oder zu übertragen, die aus historischen Gründen auf US-ASCII-Daten beschränkt sind. Sie können es in neuen Anwendungen ohne diese alten Einschränkungen verwenden, da es die Manipulation von Objekten mit Texteditoren ermöglicht.

Sie können die folgenden Codierungsschemata, die auf RFC-4648 basieren, auf alle Werte in einer Spalte anwenden:

  • Base32
  • Base64
  • Hex
  • URL

Beim Codieren generiert Wrangler eine neue Spalte mit einem Namen im folgenden Format: <column>_encode_<type> except for url-encode.

In Cloud Data Fusion gelten für die Spaltenwerte die folgenden Regeln:

  • Wenn die Spalte null ist, ist die Ergebnisspalte auch null.
  • Wenn die ausgewählte Spalte in der Zeile nicht gefunden wird, wird die Zeile übersprungen.
  • Wenn der Spaltenwert keinen String- oder Byte-Datentyp hat, schlägt die Transformation fehl und es wird ein Fehler angezeigt.

Unterstützte Codierungsoptionen

Wrangler unterstützt die folgenden Codierungsoptionen:

Base64-Codierung
Mit der Option Base64 wird die encode64-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit codierten Werten erstellt.
Base32-Codierung
Mit der Option Base32 wird die encode32-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit codierten Werten erstellt.
Hexadezimal codieren
Mit der Option Hex wird die encode_hex-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit codierten Werten erstellt.
URL codieren
Mit der Option URL wird die url-encode-Anweisung als Transformationsschritt in das Rezept eingefügt und die aktuelle Spalte codiert.

Zeile decodieren

Sie können die Basisdekodierung von Daten verwenden, um Daten in Umgebungen zu speichern oder zu übertragen, die aus Altgründen auf US-ASCII-Daten beschränkt sind. Sie können es in neuen Anwendungen ohne diese alten Einschränkungen verwenden, da es die Manipulation von Objekten mit Texteditoren ermöglicht.

Sie können die folgenden Dekodierungsschemata, die auf RFC-4648 basieren, auf jeden Wert in einer Spalte anwenden:

  • Base32
  • Base64
  • Hex
  • URL

Beim Dekodieren generiert Wrangler eine neue Spalte mit einem Namen im folgenden Format: <column>_encode_<type>, mit Ausnahme von url-decode.

In Cloud Data Fusion gelten für die Spaltenwerte die folgenden Regeln:

  • Wenn die Spalte null ist, ist die Ergebnisspalte auch null.
  • Wenn die ausgewählte Spalte in der Zeile nicht gefunden wird, wird die Zeile übersprungen.
  • Wenn der Spaltenwert nicht die Datentypen „String“ oder „Byte-Array“ enthält, schlägt der Vorgang fehl.

Unterstützte Dekodierungsoptionen

Wrangler unterstützt die folgenden Codierungsoptionen:

Base64-Decodierung
Mit der Option base64 wird die decode64-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit den decodierten Werten erstellt.
Base32 decodieren
Mit der Option base32 wird die decode32-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit den decodierten Werten erstellt.
Hexadezimalwert decodieren
Mit der Option Hex wird die decode hex-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit den decodierten Werten erstellt.
URL decodieren
Mit der Option URL wird die Direktive url-decode als Transformationsschritt in das Rezept eingefügt und die aktuelle Spalte decodiert.

Nächste Schritte