이 페이지에서는 Cloud Data Fusion Studio의 Wrangler 작업공간에서 데이터를 준비할 때 수치 계산을 수행하는 방법을 설명합니다.
다음 데이터 유형의 열에서 이러한 변환을 수행할 수 있습니다.
- 정수
- 십진수
- 실수
- 부동 소수점 수
- 긴 정수
- 짧은 정수
자세한 내용은 set-column
지시문을 참조하세요.
하나 이상의 열에 숫자 함수를 사용할 수 있습니다. 사용 가능한 숫자 함수는 선택한 열 수에 따라 다릅니다. 계산 결과로 새 열을 만들 수도 있고, 변환을 추가한 열에 결과를 표시할 수도 있습니다.
숫자 함수를 단일 열에 적용할 때의 동작은 여러 열에 숫자 함수를 적용할 때와 다릅니다. 예를 들면 다음과 같습니다.
- 단일 열에서
Multiply()
함수를 사용하는 경우 열의 각 값에 곱할 십진수 값을 지정합니다. Wrangler는 샘플 데이터에 곱셈을 실행하고 새 값을 동일한 열 또는 새 열에 표시합니다. - 여러 열에
Multiply()
함수를 사용하면 Wrangler는 선택한 열의 각 행 값을 곱하고 변환의 첫 번째 열에 새 값을 표시합니다.
단일 열의 값에 대한 수치 계산 수행
단일 열에 수치 계산을 적용하려면 다음 단계를 따르세요.
- Cloud Data Fusion에서 Wrangler 작업공간으로 이동합니다.
- 데이터 탭에서 열 이름으로 이동하고 arrow_drop_down 펼치기 화살표를 클릭합니다.
계산을 선택하고 옵션(예: 더하기)을 선택합니다.
일부 함수에서는 십진수 값을 입력해야 계산이 완료됩니다. 예를 들어 빼기를 선택하면 각 행에서 뺄 값을 입력해야 합니다.
선택사항: 계산된 값으로 새 열을 만들려면 새 열에 복사 체크박스를 선택합니다.
적용을 클릭합니다.
값은 계산에 따라 변경됩니다. Wrangler는 상응하는 지시문을 레시피의 단계로 추가합니다. 예를 들어 Price
열의 각 값에서 2를 빼면 Wrangler는 레시피에 다음 변환을 추가합니다.
set-column :Price Price - 2
데이터 파이프라인을 실행하면 변환이 열의 모든 값에 적용됩니다.
단일 열에 지원되는 계산
단일 열의 모든 값에 대해 다음 계산을 수행할 수 있습니다.
함수 | 설명 |
---|---|
절댓값 | 열의 각 값에 대한 절댓값을 반환합니다. 예를 들어 -10의 절댓값은 10입니다. |
더하기 | 열에 양 또는 음의 십진수를 더하거나 여러 열을 더하여 각 행의 합계를 출력합니다. |
아크코사인 | 열의 각 값에 대한 코사인의 역수를 반환합니다. |
아크사인 | 열의 각 값에 대한 사인의 역수를 반환합니다. |
아크탄젠트 | 열의 각 값에 대한 탄젠트의 역수를 반환합니다. |
올림 | 열의 각 셀에 있는 숫자 값보다 크거나 같은 최소 정수를 반환합니다. 예를 들어 값이 2.21이면 3이 반환됩니다. 값이 5.88이면 6이 반환됩니다. 값이 -5.15이면 -5가 반환됩니다. |
코사인 | 각 열 값의 코사인을 반환합니다. |
세제곱 | 열의 각 값을 세제곱합니다. |
세제곱근 | 열의 각 값에 대한 세제곱근을 반환합니다. |
나누기 | 열의 각 값을 양 또는 음의 십진수로 나누거나 두 열의 각 값을 나눕니다. |
버림 | 열의 각 셀에 있는 숫자 값보다 크거나 같은 최대 정수를 반환합니다. 예를 들어 값이 2.21이면 2가 반환됩니다. 값이 5.88이면 5가 반환됩니다. 마찬가지로 값이 -5.15이면 -6이 반환됩니다. |
로그 | 열의 각 값에 대한 로그를 반환합니다. |
나머지 | 열의 각 값을 양의 십진수로 나눈 나머지를 반환하거나 두 열의 각 값을 나눈 나머지를 반환합니다. |
곱하기 | 열의 각 값에 양 또는 음의 십진수를 곱하거나 두 열의 각 값을 곱합니다. |
자연 로그 | 열의 각 값에 대한 자연 로그를 반환합니다. |
거듭제곱 | 열 값을 지정된 지수로 거듭제곱합니다. |
무작위 | 지정된 열에 예측할 수 없는 무작위 실수 값을 생성합니다. |
반올림 | 열의 각 값을 반올림합니다. |
사인 | 열의 각 값에 대한 사인을 반환합니다. |
제곱 | 열의 각 값을 제곱합니다. |
제곱근 | 열의 각 값에 대한 제곱근을 반환합니다. |
빼기 | 열의 각 값에서 양 또는 음의 십진수를 뺍니다. |
탄젠트 | 열의 각 값에 대한 탄젠트를 반환합니다. |
두 열의 값에 대한 수치 계산 수행
두 열에 수치 계산을 적용하려면 다음 단계를 따르세요.
- Cloud Data Fusion에서 Wrangler 작업공간으로 이동합니다.
- 데이터 탭에서 2개의 열 이름 옆에 있는 체크박스를 선택합니다.
- 열 이름으로 이동하고 arrow_drop_down 펼치기 화살표를 클릭합니다.
- 계산을 선택하고 옵션(예: 더하기)을 선택합니다.
- 선택사항: 계산된 값으로 새 열을 만들려면 새 열에 복사 체크박스를 선택합니다. 그렇지 않으면 계산된 값이 기존 값을 재정의합니다.
- 적용을 클릭합니다.
값은 계산에 따라 변경됩니다. Wrangler는 상응하는 지시문을 레시피의 단계로 추가합니다. 예를 들어 Q1_Sales
및 Q2_Sales
열의 각 행에 있는 값을 더하고 H1_Sales
라는 새 열을 만들면 Wrangler는 다음 변환을 레시피에 추가합니다.
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
데이터 파이프라인을 실행하면 Wrangler가 변환을 수행하고 Q1_Sales
와 Q2_Sales
의 합계가 포함된 H1_Sales
라는 새 열을 만듭니다.
두 열에 지원되는 계산
두 열의 각 행에 있는 값에 대해 다음과 같은 수치 계산을 수행할 수 있습니다.
함수 | 설명 |
---|---|
더하기 | 열에 양 또는 음의 십진수를 더하거나 여러 열을 더하여 각 행의 합계를 출력합니다. |
평균 | 여러 열의 각 행에 대한 평균을 반환합니다. |
나누기 | 열의 각 값을 양 또는 음의 십진수로 나누거나 두 열의 각 값을 나눕니다. |
같음 | 두 열을 비교하여 값이 일치하는지 행별로 확인하는 불리언 함수입니다. true 또는 false 를 반환합니다. |
LCM | 두 열의 각 숫자에 대한 최소 공배수를 반환합니다. |
최대 | 두 열의 각 행에 대한 최댓값을 반환합니다. |
최소 | 두 열의 각 행에 대한 최솟값을 반환합니다. |
나머지 | 열의 각 값을 양의 십진수로 나눈 나머지를 반환하거나 두 열의 각 값을 나눈 나머지를 반환합니다. |
곱하기 | 열의 각 값에 양 또는 음의 십진수를 곱하거나 두 열의 각 값을 곱합니다. |
빼기 | 열의 각 값에서 양 또는 음의 십진수를 뺍니다. |
3개 이상 열의 값에 대한 수치 계산 수행
Cloud Data Fusion 버전 6.8.0 이상에서는 3개 이상의 열 값에 대한 수치 계산 수행을 지원합니다.
3개 이상의 열에 수치 계산을 적용하려면 다음 단계를 따르세요.
- Cloud Data Fusion에서 Wrangler 작업공간으로 이동합니다.
- 데이터 탭에서 2개의 열 이름 옆에 있는 체크박스를 선택합니다.
- 열 이름으로 이동하고 arrow_drop_down 펼치기 화살표를 클릭합니다.
- 계산을 선택하고 옵션(예: 더하기)을 선택합니다.
- 선택사항: 계산된 값으로 새 열을 만들려면 새 열에 복사 체크박스를 선택합니다. 그렇지 않으면 계산된 값이 기존 값을 재정의합니다.
- 적용을 클릭합니다.
값은 계산에 따라 변경됩니다. Wrangler는 상응하는 지시문을 레시피의 단계로 추가합니다. 예를 들어 Q1_Sales
, Q2_Sales
, Q3_Sales
, Q4_Sales
열의 각 행에 있는 값을 더하고 2022_Sales
라는 새 열을 만들면 Wrangler는 레시피에 다음 변환을 추가합니다.
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
데이터 파이프라인을 실행하면 Wrangler가 변환을 수행하고 Q1_Sales
, Q2_Sales
, Q3_Sales
, Q4_Sales
의 합계가 포함된 2022_Sales
라는 새 열을 만듭니다.
3개 이상 열에 지원되는 계산
3개 이상 열의 각 행에 있는 값에 대해 다음 계산을 수행할 수 있습니다.
함수 | 설명 |
---|---|
더하기 | 열에 양 또는 음의 십진수를 더하거나 여러 열을 더하여 각 행의 합계를 출력합니다. |
평균 | 여러 열의 각 행에 대한 평균을 반환합니다. |
같음 | 두 열을 비교하여 값이 일치하는지 행별로 확인하는 불리언 함수입니다. true 또는 false 를 반환합니다. |
최대 | 두 열의 각 행에 대한 최댓값을 반환합니다. |
최소 | 두 열의 각 행에 대한 최솟값을 반환합니다. |
곱하기 | 열의 각 값에 양 또는 음의 십진수를 곱하거나 두 열의 각 값을 곱합니다. |
다음 단계
- Wrangler 지시문에 대해 자세히 알아보기