Wrangler 명령줄 지시어

이 페이지에서는 Wrangler에서 사용할 수 있는 지시문을 설명합니다.

Wrangler 전원 모드(Wrangler CLI)에서는 레시피에 지시어와 함수를 추가할 수 있습니다. 자세한 내용은 Wrangler CLI 지시어Wrangler 함수를 참고하세요.

Wrangler는 다음 지시어를 지원합니다.

열 작업

지시문 설명
열 케이스 변경 열 이름을 소문자 또는 대문자로 변경합니다.
대소문자 변경 열 값의 대소문자를 변경합니다.
열 이름 정리 특정 규칙에 따라 열 이름을 삭제합니다.
열 대체 열 이름을 일괄적으로 변경합니다.
복사 소스 열의 값을 대상 열에 복사합니다.
열 삭제 레코드에서 열을 삭제합니다.
null 또는 공백 채우기 값이 null이거나 비어 있으면 고정된 열 값을 입력합니다.
Keep 레코드에서 지정된 열을 유지합니다.
병합 세 번째 열을 삽입하여 두 열을 병합합니다.
이름 바꾸기 레코드의 기존 열 이름을 변경합니다.
헤더 설정 지정된 순서대로 열 이름을 설정합니다.
열로 분할 구분자를 기준으로 열을 여러 열로 분할합니다.
바꾸기 두 열의 열 이름을 교환합니다.
유형 설정 열의 데이터 유형 변경

날짜 변환

지시문 설명
날짜 차이 두 날짜 간의 차이를 계산합니다.
날짜 형식 날짜/시간 형식 지정을 위한 커스텀 패턴입니다.
UNIX 타임스탬프 형식 UNIX 타임스탬프의 형식을 날짜로 지정합니다.

날짜/시간 변환

지시문 설명
현재 날짜/시간 지정된 시간대를 사용하여 현재 날짜/시간을 생성합니다.
날짜/시간을 타임스탬프로 변환 날짜/시간 및 지정된 시간대에서 타임스탬프를 만듭니다.
날짜/시간 형식 날짜/시간을 지정된 형식의 문자열로 형식 지정합니다.
타임스탬프를 날짜/시간으로 변환 타임스탬프를 날짜/시간으로 변환합니다.

인코더 및 디코더

지시문 설명
디코딩 열 값을 base32, base64 또는 hex. 중 하나로 디코딩합니다.
인코딩 열 값을 base32, base64 또는 hex. 중 하나로 인코딩합니다.

해싱 및 마스킹

지시문 설명
해시 메시지 다이제스트를 생성합니다.
마스크 번호 열 값에 대체 마스킹을 적용합니다.
마스크 셔플 열 값에 셔플 마스킹을 적용합니다.

조회

지시문 설명
카탈로그 조회 ICD-9, ICD-10-2016, ICD-10-2017 코드의 정적 카탈로그 조회
테이블 조회 테이블 데이터 세트에서 조회를 실행합니다.

자연어 처리

지시문 설명
토큰화된 단어의 어간 추출 영어 단어에 포터 어간 추출 알고리즘을 적용합니다.

출력 형식 지정 도구

지시문 설명
CSV로 쓰기 레코드를 CSV 형식으로 변환합니다.
JSON 맵으로 쓰기 레코드를 JSON 맵으로 변환합니다.
JSON 객체 쓰기 지정된 필드를 기반으로 JSON 객체를 작성합니다.
통화 형식 로케일에서 지정한 통화로 숫자를 형식화합니다.

파서

지시문 설명
JSON 경로 JSON 레코드 파싱에 DSL(JSON 경로 표현식)을 사용합니다.
AVRO 파일로 파싱 AVRO 데이터 파일을 파싱합니다.
CSV로 파싱 입력 레코드를 쉼표로 구분된 값으로 파싱합니다.
통화로 파싱 현지 통화의 문자열 표현인 통화 가치를 숫자로 파싱합니다.
날짜/시간으로 파싱 문자열을 지정된 형식으로 날짜/시간 데이터 유형으로 파싱합니다.
Excel로 파싱 Microsoft Excel 파일로 파싱합니다.
고정 길이로 파싱 지정된 너비의 고정 길이 레코드로 파싱됩니다.
HL7로 파싱 Health Level 7 버전 2(HL7 V2) 메시지를 파싱합니다.
JSON으로 파싱 JSON 객체를 파싱합니다.
로그로 파싱 Apache httpd 및 NGINX 서버와 같은 액세스 로그 파일을 파싱합니다.
간단한 날짜로 파싱 날짜 문자열을 파싱합니다.
타임스탬프로 파싱 Unix 타임스탬프를 날짜로 나타내는 열 값을 파싱합니다.
XML을 JSON으로 파싱 XML 문서를 JSON 구조로 파싱합니다.

행 작업

지시문 설명
행 필터링 조건에 따라 레코드를 필터링합니다.
일치하는 경우 행 필터링 열의 패턴과 일치하는 행을 필터링합니다.
Flatten 반복되는 필드에서 요소를 구분합니다 .
조건에 따라 실패 조건이 true로 평가되면 처리가 실패합니다.
오류로 전송 오류 수집기로 레코드를 필터링합니다.
오류로 전송 및 처리 계속 레코드를 오류 수집기로 필터링하고 처리를 계속합니다.
행으로 분할 구분자를 기준으로 여러 레코드로 분할합니다.

변환

지시문 설명
대소문자 변경 열 값의 대소문자를 대문자 또는 소문자로 변경합니다.
레코드 생성 소스 열의 값을 대상 열에 복사하여 중첩된 값이 포함된 레코드 열을 만듭니다.
문자 자르기 문자열 값의 일부를 선택합니다.
열 설정 열 값을 표현식 실행의 결과로 설정합니다.
찾기 및 바꾸기 'sed'와 유사한 표현식을 사용하여 문자열 열 값을 변환합니다.
양자화 열 값에 양자화를 적용합니다.
정규식 그룹 추출 정규 표현식 그룹에서 데이터를 자체 열로 추출합니다.
문자 집합 설정 인코딩을 설정한 다음 데이터를 UTF-8 문자열로 변환합니다.
레코드 구분 기호 설정 레코드 구분 기호를 설정합니다.
이메일 분할 이메일 ID를 계정과 도메인으로 분할합니다.
URL 분할 URL을 구성요소로 분할합니다.
텍스트 간격(퍼지 문자열 일치) 두 문자 시퀀스의 차이를 측정합니다.
텍스트 측정항목(퍼지 문자열 일치) 두 문자 시퀀스의 차이를 측정합니다.
URL 디코딩 application/x-www-form-urlencoded MIME 형식에서 디코딩합니다.
URL 인코딩 application/x-www-form-urlencoded MIME 형식으로 인코딩합니다.
스페이스 자르기 문자열 데이터 주변의 공백을 자르는 함수입니다.

일시적 애그리게이터 및 setter

지시문 설명
변수 증가 처리 기록으로 일시적 변수를 증분합니다.
변수 설정 처리 기록이 포함된 일시적 변수를 설정합니다.

고유 ID

지시문 설명
UUID 생성 범용 고유 식별자(UUID)를 생성합니다.

다음 단계