Auf dieser Seite wird erläutert, wie Sie Zeilen codieren und decodieren, wenn Sie Daten im Wrangler-Arbeitsbereich von Cloud Data Fusion Studio vorbereiten.
Zeile codieren
Sie können die Basiscodierung von Daten verwenden, um Daten in Umgebungen zu speichern oder zu übertragen, die aus historischen Gründen auf US-ASCII-Daten beschränkt sind. Sie können es in neuen Anwendungen ohne diese alten Einschränkungen verwenden, da es die Manipulation von Objekten mit Texteditoren ermöglicht.
Sie können die folgenden Codierungsschemata, die auf RFC-4648 basieren, auf alle Werte in einer Spalte anwenden:
- Base32
- Base64
- Hex
- URL
Beim Codieren generiert Wrangler eine neue Spalte mit einem Namen im folgenden Format: <column>_encode_<type> except for url-encode
.
In Cloud Data Fusion gelten für die Spaltenwerte die folgenden Regeln:
- Wenn die Spalte
null
ist, ist die Ergebnisspalte auchnull
. - Wenn die ausgewählte Spalte in der Zeile nicht gefunden wird, wird die Zeile übersprungen.
- Wenn der Spaltenwert keinen String- oder Byte-Datentyp hat, schlägt die Transformation fehl und es wird ein Fehler angezeigt.
Unterstützte Codierungsoptionen
Wrangler unterstützt die folgenden Codierungsoptionen:
- Base64-Codierung
- Mit der Option Base64 wird die
encode64
-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit codierten Werten erstellt. - Base32-Codierung
- Mit der Option Base32 wird die
encode32
-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit codierten Werten erstellt. - Hexadezimal codieren
- Mit der Option Hex wird die
encode_hex
-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit codierten Werten erstellt. - URL codieren
- Mit der Option URL wird die
url-encode
-Anweisung als Transformationsschritt in das Rezept eingefügt und die aktuelle Spalte codiert.
Zeile decodieren
Sie können die Basisdekodierung von Daten verwenden, um Daten in Umgebungen zu speichern oder zu übertragen, die aus Altgründen auf US-ASCII-Daten beschränkt sind. Sie können es in neuen Anwendungen ohne diese alten Einschränkungen verwenden, da es die Manipulation von Objekten mit Texteditoren ermöglicht.
Sie können die folgenden Dekodierungsschemata, die auf RFC-4648 basieren, auf jeden Wert in einer Spalte anwenden:
- Base32
- Base64
- Hex
- URL
Beim Dekodieren generiert Wrangler eine neue Spalte mit einem Namen im folgenden Format: <column>_encode_<type>
, mit Ausnahme von url-decode
.
In Cloud Data Fusion gelten für die Spaltenwerte die folgenden Regeln:
- Wenn die Spalte
null
ist, ist die Ergebnisspalte auchnull
. - Wenn die ausgewählte Spalte in der Zeile nicht gefunden wird, wird die Zeile übersprungen.
- Wenn der Spaltenwert nicht die Datentypen „String“ oder „Byte-Array“ enthält, schlägt der Vorgang fehl.
Unterstützte Dekodierungsoptionen
Wrangler unterstützt die folgenden Codierungsoptionen:
- Base64-Decodierung
- Mit der Option base64 wird die
decode64
-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit den decodierten Werten erstellt. - Base32 decodieren
- Mit der Option base32 wird die
decode32
-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit den decodierten Werten erstellt. - Hexadezimalwert decodieren
- Mit der Option Hex wird die
decode hex
-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit den decodierten Werten erstellt. - URL decodieren
- Mit der Option URL wird die Direktive
url-decode
als Transformationsschritt in das Rezept eingefügt und die aktuelle Spalte decodiert.