Auf dieser Seite wird erläutert, wie Sie Zeilen codieren und decodieren können, wenn Sie Daten im Wrangler-Arbeitsbereich von Cloud Data Fusion Studio vorbereiten.
Zeile codieren
Sie können die Basiscodierung von Daten verwenden, um Daten in Umgebungen zu speichern oder zu übertragen. die aus alten Gründen auf US-ASCII-Daten beschränkt sind. Sie können es in neue Anwendungen ohne diese alten Einschränkungen, Bearbeitung von Objekten mit Texteditoren.
Sie können die folgenden Codierungsschemata, die auf RFC-4648 basieren, auf alle Werte in einer Spalte anwenden:
- Base32
- Base64
- Hex
- URL
Beim Codieren generiert Wrangler eine neue Spalte mit einem Namen in folgendem
Format: <column>_encode_<type> except for url-encode
.
Cloud Data Fusion wendet für die Spaltenwerte die folgenden Regeln an:
- Wenn die Spalte
null
ist, ist die Ergebnisspalte auchnull
. - Wenn die ausgewählte Spalte nicht in der Zeile gefunden wird, wird die Zeile übersprungen.
- Wenn der Spaltenwert keinen String- oder Byte-Datentyp hat, schlägt die Transformation fehl, und ein Fehler wird angezeigt.
Unterstützte Codierungsoptionen
Wrangler unterstützt die folgenden Codierungsoptionen:
- base64 codieren
- Die Option Base64 fügt die Anweisung
encode64
als Transformationsschritt hinzu an das Schema an und erstellt eine neue Spalte mit codierten Werten. - Base32-Codierung
- Mit der Option Base32 wird die
encode32
-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit codierten Werten erstellt. - Hexadezimal codieren
- Mit der Option Hex wird die
encode_hex
-Anweisung als Transformationsschritt zum Rezept hinzugefügt und eine neue Spalte mit codierten Werten erstellt. - URL codieren
- Die Option URL fügt die Anweisung
url-encode
als Transformationsschritt hinzu an das Schema an und codiert die aktuelle Spalte.
Zeile decodieren
Sie können die Basisdecodierung von Daten verwenden, um Daten in Umgebungen zu speichern oder zu übertragen die aus alten Gründen auf US-ASCII-Daten beschränkt sind. Sie können es in neue Anwendungen ohne diese alten Einschränkungen, Bearbeitung von Objekten mit Texteditoren.
Sie können die folgenden Dekodierungsschemata, die auf RFC-4648 basieren, auf jeden Wert in einer Spalte anwenden:
- Base32
- Base64
- Hex
- URL
Beim Decodieren generiert Wrangler eine neue Spalte mit einem Namen in folgendem
Format: <column>_encode_<type>
, mit Ausnahme von url-decode
.
Cloud Data Fusion wendet für die Spaltenwerte die folgenden Regeln an:
- Wenn die Spalte
null
ist, ist die Ergebnisspalte auchnull
. - Wenn die ausgewählte Spalte in der Zeile nicht gefunden wird, wird die Zeile übersprungen.
- Wenn der Spaltenwert nicht den Datentyp "String" oder "Byte-Array" enthält, der Vorgang fehlschlägt.
Unterstützte Decodierungsoptionen
Wrangler unterstützt die folgenden Codierungsoptionen:
- Base64 decodieren
- Die Option base64 fügt die Anweisung
decode64
als Transformationsschritt hinzu an das Schema an und erstellt eine neue Spalte mit den decodierten Werten. - base32 decodieren
- Die Option base32 fügt die Anweisung
decode32
als Transformationsschritt hinzu an das Schema an und erstellt eine neue Spalte mit den decodierten Werten. - Hexadezimalwert decodieren
- Mit der Option Hex wird die Anweisung
decode hex
als Transformationsschritt hinzugefügt an das Schema an und erstellt eine neue Spalte mit den decodierten Werten. - URL decodieren
- Mit der Option URL wird die Direktive
url-decode
als Transformationsschritt in das Rezept eingefügt und die aktuelle Spalte decodiert.