Encoder et décoder des lignes

Cette page explique comment encoder et décoder des lignes lorsque vous préparez des données dans l'espace de travail Wrangler de Cloud Data Fusion Studio.

Encodage d'une ligne

Vous pouvez utiliser l'encodage de base des données pour stocker ou transférer des données dans des environnements qui, pour des raisons historiques, sont limités aux données US-ASCII. Vous pouvez l'utiliser dans de nouvelles applications sans ces anciennes restrictions, car il permet de manipuler des objets avec des éditeurs de texte.

Vous pouvez appliquer les schémas d'encodage suivants, basés sur la RFC 4648, à toutes les valeurs d'une colonne:

  • Base32
  • Base64
  • Hex
  • URL

Lorsque vous encodez, Wrangler génère une nouvelle colonne avec un nom au format suivant: <column>_encode_<type> except for url-encode.

Cloud Data Fusion utilise les règles suivantes pour les valeurs de colonne:

  • Si la colonne est null, la colonne générée est également null.
  • Si la colonne choisie n'est pas trouvée dans la ligne, celle-ci est ignorée.
  • Si la valeur de la colonne n'a pas de type de données de chaîne ou d'octet, la transformation échoue et une erreur s'affiche.

Options d'encodage acceptées

Wrangler est compatible avec les options d'encodage suivantes:

Encodage base64
L'option Base64 ajoute la directive encode64 en tant qu'étape de transformation à la combinaison et crée une colonne avec des valeurs encodées.
Encodage base32
L'option Base32 ajoute la directive encode32 en tant qu'étape de transformation à la recette et crée une colonne avec des valeurs encodées.
Encoder en hexadécimal
L'option Hex ajoute la directive encode_hex en tant qu'étape de transformation à la recette et crée une colonne avec des valeurs encodées.
Encoder l'URL
L'option URL ajoute la directive url-encode en tant qu'étape de transformation à la combinaison et encode la colonne actuelle.

Décoder une ligne

Vous pouvez utiliser le décodage de base des données pour stocker ou transférer des données dans des environnements qui, pour des raisons historiques, sont limités aux données US-ASCII. Vous pouvez l'utiliser dans de nouvelles applications sans ces anciennes restrictions, car il permet de manipuler des objets avec des éditeurs de texte.

Vous pouvez appliquer les schémas de décodage suivants, basés sur la RFC-4648, à chaque valeur d'une colonne:

  • Base32
  • Base64
  • Hex
  • URL

Lorsque vous effectuez le décodage, Wrangler génère une colonne avec un nom au format suivant: <column>_encode_<type>, à l'exception de url-decode.

Cloud Data Fusion utilise les règles suivantes pour les valeurs de colonne:

  • Si la colonne est null, la colonne générée est également null.
  • Si la colonne choisie n'est pas trouvée dans la ligne, celle-ci est ignorée.
  • Si la valeur de la colonne ne contient pas les types de données de chaîne ou de tableau d'octets, l'opération échoue.

Options de décodage acceptées

Wrangler est compatible avec les options d'encodage suivantes:

Décoder en base64
L'option base64 ajoute la directive decode64 en tant qu'étape de transformation à la recette et crée une colonne avec les valeurs décodées.
Décoder base32
L'option base32 ajoute la directive decode32 en tant qu'étape de transformation à la combinaison et crée une nouvelle colonne avec les valeurs décodées.
Décoder les valeurs hexadécimales
L'option Hex ajoute la directive decode hex en tant qu'étape de transformation à la recette et crée une colonne avec les valeurs décodées.
Décoder l'URL
L'option URL ajoute la directive url-decode en tant qu'étape de transformation à la combinaison et décode la colonne actuelle.

Étape suivante