이 페이지에서는 Cloud Data Fusion Studio의 Wrangler 작업공간에서 데이터를 준비할 때 행을 인코딩하고 디코딩하는 방법을 설명합니다.
행 인코딩
데이터의 기본 인코딩을 사용하여 기존 사유로 인해 US-ASCII 데이터로 제한된 환경에 데이터를 저장하거나 전송할 수 있습니다. 텍스트 편집기로 객체를 조작할 수 있으므로 기존 제한사항이 없는 새 애플리케이션에서 사용할 수 있습니다.
RFC-4648을 기반으로 하는 다음 인코딩 스키마를 열의 모든 값에 적용할 수 있습니다.
- Base32
- Base64
- 16진수
- URL
인코딩하면 Wrangler는 이름이 <column>_encode_<type> except for url-encode
형식인 새 열을 생성합니다.
Cloud Data Fusion은 열 값에 다음 규칙을 사용합니다.
- 열이
null
이면 결과 열도null
입니다. - 선택한 열이 행에 없으면 행이 건너뜁니다.
- 열 값에 문자열 또는 바이트 데이터 유형이 없으면 변환이 실패하고 오류가 표시됩니다.
지원되는 인코딩 옵션
Wrangler는 다음 인코딩 옵션을 지원합니다.
- base64로 인코딩
- Base64 옵션은
encode64
지시문을 레시피에 변환 단계로 추가하고 인코딩된 값이 포함된 새 열을 만듭니다. - base32로 인코딩
- Base32 옵션은
encode32
지시문을 레시피에 변환 단계로 추가하고 인코딩된 값이 포함된 새 열을 만듭니다. - 16진수로 인코딩
- 16진수 옵션은
encode_hex
지시문을 레시피에 변환 단계로 추가하고 인코딩된 값이 포함된 새 열을 만듭니다. - URL로 인코딩
- URL 옵션은
url-encode
지시문을 레시피에 변환 단계로 추가하고 현재 열을 인코딩합니다.
행 디코딩
데이터의 기본 디코딩을 사용하여 기존 사유로 인해 US-ASCII 데이터로 제한된 환경에 데이터를 저장하거나 전송할 수 있습니다. 텍스트 편집기로 객체를 조작할 수 있으므로 기존 제한사항이 없는 새 애플리케이션에서 사용할 수 있습니다.
RFC-4648을 기반으로 하는 다음 디코딩 스키마를 열의 각 값에 적용할 수 있습니다.
- Base32
- Base64
- 16진수
- URL
디코딩하면 Wrangler에서 url-decode
를 제외하고 이름이 <column>_encode_<type>
형식인 새 열을 생성합니다.
Cloud Data Fusion은 열 값에 다음 규칙을 사용합니다.
- 열이
null
이면 결과 열도null
입니다. - 선택한 열이 행에 없으면 행이 건너뜁니다.
- 열 값에 문자열 또는 바이트 배열 데이터 유형이 포함되지 않으면 작업이 실패합니다.
지원되는 디코딩 옵션
Wrangler는 다음 인코딩 옵션을 지원합니다.
- base64로 디코딩
- base64 옵션은
decode64
지시문을 레시피에 변환 단계로 추가하고 디코딩된 값이 포함된 새 열을 만듭니다. - base32로 디코딩
- base32 옵션은
decode32
지시문을 레시피에 변환 단계로 추가하고 디코딩된 값이 포함된 새 열을 만듭니다. - 16진수로 디코딩
- 16진수 옵션은
decode hex
지시문을 레시피에 변환 단계로 추가하고 디코딩된 값이 포함된 새 열을 만듭니다. - URL로 디코딩
- URL 옵션은
url-decode
지시문을 레시피에 변환 단계로 추가하고 현재 열을 디코딩합니다.
다음 단계
- Wrangler 지시문에 대해 자세히 알아보기