Cette page explique comment encoder et décoder des lignes lorsque vous préparer des données dans l'espace de travail Wrangler de Cloud Data Fusion Studio ;
Encodage d'une ligne
Vous pouvez utiliser l'encodage de base des données pour stocker ou transférer des données dans des environnements qui, pour des raisons historiques, sont limités aux données US-ASCII. Vous pouvez l'utiliser dans de nouvelles applications sans ces anciennes restrictions, car il permet de manipuler des objets avec des éditeurs de texte.
Vous pouvez appliquer les schémas d'encodage suivants, basés sur sur la norme RFC-4648. à toutes les valeurs d'une colonne:
- Base32
- Base64
- Hex
- URL
Lorsque vous encodez, Wrangler génère une nouvelle colonne avec un nom au format suivant : <column>_encode_<type> except for url-encode
.
Cloud Data Fusion utilise les règles suivantes pour les valeurs de colonne :
- Si la colonne est
null
, la colonne obtenue est égalementnull
. - Si la colonne choisie n'est pas trouvée dans la ligne, celle-ci est ignorée.
- Si la valeur de la colonne n'a pas de type de données de chaîne ou d'octet, la transformation échoue et une erreur s'affiche.
Options d'encodage compatibles
Wrangler prend en charge les options d'encodage suivantes:
- Encodage base64
- L'option Base64 ajoute la directive
encode64
en tant qu'étape de transformation. à la recette et crée une colonne avec des valeurs encodées. - Encodage base32
- L'option Base32 ajoute la directive
encode32
en tant qu'étape de transformation à la recette et crée une colonne avec des valeurs encodées. - Coder en hexadécimal
- L'option Hex ajoute la directive
encode_hex
en tant qu'étape de transformation à la recette et crée une colonne avec des valeurs encodées. - Encoder l'URL
- L'option URL ajoute la directive
url-encode
en tant qu'étape de transformation. à la recette et encode la colonne actuelle.
Décoder une ligne
Vous pouvez utiliser le décodage de base des données pour stocker ou transférer des données dans des environnements qui, pour des raisons anciennes, sont limités aux données US-ASCII. Vous pouvez l'utiliser dans de nouvelles applications sans ces anciennes restrictions, car il permet de manipuler des objets avec des éditeurs de texte.
Vous pouvez appliquer les schémas de décodage suivants, basés sur la norme RFC-4648. à chaque valeur d'une colonne:
- Base32
- Base64
- Hex
- URL
Lors du décodage, Wrangler génère une nouvelle colonne portant un nom
format: <column>_encode_<type>
, sauf pour url-decode
.
Cloud Data Fusion utilise les règles suivantes pour les valeurs de colonne :
- Si la colonne est
null
, la colonne obtenue est égalementnull
. - Si la colonne choisie est introuvable dans la ligne, celle-ci est ignorée.
- Si la valeur de la colonne ne contient pas les types de données de chaîne ou de tableau d'octets, l'opération échoue.
Options de décodage compatibles
Wrangler prend en charge les options d'encodage suivantes:
- Décoder en base64
- L'option base64 ajoute la directive
decode64
en tant qu'étape de transformation à la recette et crée une colonne avec les valeurs décodées. - Décoder base32
- L'option base32 ajoute la directive
decode32
en tant qu'étape de transformation à la combinaison et crée une nouvelle colonne avec les valeurs décodées. - Code hexadécimal de décodage
- L'option Hex ajoute la directive
decode hex
en tant qu'étape de transformation à la recette et crée une colonne avec les valeurs décodées. - Décoder l'URL
- L'option URL ajoute la directive
url-decode
en tant qu'étape de transformation à la combinaison et décode la colonne actuelle.
Étape suivante
- En savoir plus sur les directives Wrangler