데이터 필터링

이 페이지에서는 Cloud Data Fusion Studio의 Wrangler 작업공간에서 데이터를 준비할 때 필터링하는 방법을 설명합니다. Wrangler에서는 불리언 유형을 제외한 모든 데이터 유형의 열에서 데이터 행을 필터링할 수 있습니다. 구성한 조건에 따라 행을 유지하거나 삭제합니다.

조건에 따라 행을 유지하거나 삭제하려면 다음 단계를 따르세요.

Cloud Data Fusion에서 Wrangler 작업공간으로 이동
데이터 탭에서 열 이름으로 이동하고 arrow_drop_down 펼치기 화살표를 클릭합니다.
필터를 선택하고 옵션(예: 행 유지, 값에 포함된 경우)을 선택합니다.
조건을 지정합니다.
적용을 클릭합니다.

값은 필터에 따라 변경됩니다. Wrangler는 filter-rows-on 지시문을 레시피에 추가합니다. 데이터 파이프라인을 실행하면 열의 값에 변환이 적용됩니다.

행 유지

조건에 따라 행을 유지하도록 선택하면 조건에 맞지 않는 행이 삭제됩니다. 조건에 맞는 행만 데이터 세트에 남습니다. 예를 들어 값이 다음과 같음을 선택하고 Customer 조건을 입력하면 Wrangler는 Customer 문자열이 포함된 행을 유지하고 다른 값이 포함된 행을 삭제합니다.

행 삭제

조건에 따라 행을 삭제하면 조건에 맞는 행이 데이터 세트에서 삭제됩니다. 예를 들어 행을 삭제하고 값이 비어 있음을 선택하면 Wrangler는 값이 비어 있거나 null인 열에서 행을 삭제합니다.

지원되는 필터 조건

다음 조건을 기준으로 행을 필터링할 수 있습니다.

조건	설명
값이 비어 있음	빈 값을 유지하거나 삭제합니다.
값이 다음과 같음	지정된 값과 정확히 일치하는 값을 유지하거나 삭제합니다. 열에 문자열 데이터 유형이 포함된 경우 대소문자 구분을 무시하도록 선택할 수 있습니다. 기본값은 조건에 대소문자를 포함하는 것입니다.
값 포함	지정된 값이 포함된 값을 유지하거나 삭제합니다.
값이 다음으로 시작함	지정된 값으로 시작되는 값을 유지하거나 삭제합니다.
값이 다음으로 끝남	지정된 값으로 끝나는 값을 유지하거나 삭제합니다.
정규식과 일치	정규 표현식과 일치하는 값을 유지하거나 삭제합니다.
커스텀 조건	커스텀 조건과 일치하는 값을 유지하거나 삭제합니다.

다음 단계

Wrangler 지시문에 대해 자세히 알아보기