Zeilen codieren und decodieren

Auf dieser Seite wird erläutert, wie Sie Zeilen codieren und decodieren können, wenn Sie Daten im Wrangler-Arbeitsbereich von Cloud Data Fusion Studio vorbereiten.

Zeile codieren

Sie können die Basiscodierung von Daten verwenden, um Daten in Umgebungen zu speichern oder zu übertragen. die aus alten Gründen auf US-ASCII-Daten beschränkt sind. Sie können es in neue Anwendungen ohne diese alten Einschränkungen, Bearbeitung von Objekten mit Texteditoren.

Sie können die folgenden Codierungsschemata, die auf RFC-4648 basieren, auf alle Werte in einer Spalte anwenden:

  • Base32
  • Base64
  • Hex
  • URL

Beim Codieren generiert Wrangler eine neue Spalte mit einem Namen in folgendem Format: <column>_encode_<type> except for url-encode.

Cloud Data Fusion wendet für die Spaltenwerte die folgenden Regeln an:

  • Wenn die Spalte null ist, ist die Ergebnisspalte auch null.
  • Wenn die ausgewählte Spalte nicht in der Zeile gefunden wird, wird die Zeile übersprungen.
  • Wenn der Spaltenwert keinen String- oder Byte-Datentyp hat, schlägt die Transformation fehl, und ein Fehler wird angezeigt.

Unterstützte Codierungsoptionen

Wrangler unterstützt die folgenden Codierungsoptionen:

base64 codieren
Die Option Base64 fügt die Anweisung encode64 als Transformationsschritt hinzu an das Schema an und erstellt eine neue Spalte mit codierten Werten.
Base32-Codierung
Mit der Option Base32 wird die encode32-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit codierten Werten erstellt.
Hexadezimal codieren
Mit der Option Hex wird die encode_hex-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit codierten Werten erstellt.
URL codieren
Die Option URL fügt die Anweisung url-encode als Transformationsschritt hinzu an das Schema an und codiert die aktuelle Spalte.

Zeile decodieren

Sie können die Basisdecodierung von Daten verwenden, um Daten in Umgebungen zu speichern oder zu übertragen die aus alten Gründen auf US-ASCII-Daten beschränkt sind. Sie können es in neue Anwendungen ohne diese alten Einschränkungen, Bearbeitung von Objekten mit Texteditoren.

Sie können die folgenden Dekodierungsschemata, die auf RFC-4648 basieren, auf jeden Wert in einer Spalte anwenden:

  • Base32
  • Base64
  • Hex
  • URL

Beim Decodieren generiert Wrangler eine neue Spalte mit einem Namen in folgendem Format: <column>_encode_<type>, mit Ausnahme von url-decode.

Cloud Data Fusion wendet für die Spaltenwerte die folgenden Regeln an:

  • Wenn die Spalte null ist, ist die Ergebnisspalte auch null.
  • Wenn die ausgewählte Spalte in der Zeile nicht gefunden wird, wird die Zeile übersprungen.
  • Wenn der Spaltenwert nicht den Datentyp "String" oder "Byte-Array" enthält, der Vorgang fehlschlägt.

Unterstützte Decodierungsoptionen

Wrangler unterstützt die folgenden Codierungsoptionen:

Base64 decodieren
Die Option base64 fügt die Anweisung decode64 als Transformationsschritt hinzu an das Schema an und erstellt eine neue Spalte mit den decodierten Werten.
base32 decodieren
Die Option base32 fügt die Anweisung decode32 als Transformationsschritt hinzu an das Schema an und erstellt eine neue Spalte mit den decodierten Werten.
Hexadezimalwert decodieren
Mit der Option Hex wird die Anweisung decode hex als Transformationsschritt hinzugefügt an das Schema an und erstellt eine neue Spalte mit den decodierten Werten.
URL decodieren
Mit der Option URL wird die Direktive url-decode als Transformationsschritt in das Rezept eingefügt und die aktuelle Spalte decodiert.

Nächste Schritte