숫자 작업

이 페이지에서는 Cloud Data Fusion Studio의 Wrangler 작업공간에서 데이터를 준비할 때 수치 계산을 수행하는 방법을 설명합니다.

다음 데이터 유형의 열에서 이러한 변환을 수행할 수 있습니다.

  • 정수
  • 십진수
  • 실수
  • 부동 소수점 수
  • 긴 정수
  • 짧은 정수

자세한 내용은 set-column 지시문을 참조하세요.

하나 이상의 열에 숫자 함수를 사용할 수 있습니다. 사용 가능한 숫자 함수는 선택한 열 수에 따라 다릅니다. 계산 결과로 새 열을 만들 수도 있고, 변환을 추가한 열에 결과를 표시할 수도 있습니다.

숫자 함수를 단일 열에 적용할 때의 동작은 여러 열에 숫자 함수를 적용할 때와 다릅니다. 예를 들면 다음과 같습니다.

  • 단일 열에서 Multiply() 함수를 사용하는 경우 열의 각 값에 곱할 십진수 값을 지정합니다. Wrangler는 샘플 데이터에 곱셈을 실행하고 새 값을 동일한 열 또는 새 열에 표시합니다.
  • 여러 열Multiply() 함수를 사용하면 Wrangler는 선택한 열의 각 행 값을 곱하고 변환의 첫 번째 열에 새 값을 표시합니다.

단일 열의 값에 대한 수치 계산 수행

단일 열에 수치 계산을 적용하려면 다음 단계를 따르세요.

  1. Cloud Data Fusion에서 Wrangler 작업공간으로 이동합니다.
  2. 데이터 탭에서 열 이름으로 이동하고 arrow_drop_down 펼치기 화살표를 클릭합니다.
  3. 계산을 선택하고 옵션(예: 더하기)을 선택합니다.

    일부 함수에서는 십진수 값을 입력해야 계산이 완료됩니다. 예를 들어 빼기를 선택하면 각 행에서 뺄 값을 입력해야 합니다.

  4. 선택사항: 계산된 값으로 새 열을 만들려면 새 열에 복사 체크박스를 선택합니다.

  5. 적용을 클릭합니다.

값은 계산에 따라 변경됩니다. Wrangler는 상응하는 지시문을 레시피의 단계로 추가합니다. 예를 들어 Price 열의 각 값에서 2를 빼면 Wrangler는 레시피에 다음 변환을 추가합니다.

set-column :Price Price - 2

데이터 파이프라인을 실행하면 변환이 열의 모든 값에 적용됩니다.

단일 열에 지원되는 계산

단일 열의 모든 값에 대해 다음 계산을 수행할 수 있습니다.

함수 설명
절댓값 열의 각 값에 대한 절댓값을 반환합니다. 예를 들어 -10의 절댓값은 10입니다.
더하기 열에 양 또는 음의 십진수를 더하거나 여러 열을 더하여 각 행의 합계를 출력합니다.
아크코사인 열의 각 값에 대한 코사인의 역수를 반환합니다.
아크사인 열의 각 값에 대한 사인의 역수를 반환합니다.
아크탄젠트 열의 각 값에 대한 탄젠트의 역수를 반환합니다.
올림 열의 각 셀에 있는 숫자 값보다 크거나 같은 최소 정수를 반환합니다. 예를 들어 값이 2.21이면 3이 반환됩니다. 값이 5.88이면 6이 반환됩니다. 값이 -5.15이면 -5가 반환됩니다.
코사인 각 열 값의 코사인을 반환합니다.
세제곱 열의 각 값을 세제곱합니다.
세제곱근 열의 각 값에 대한 세제곱근을 반환합니다.
나누기 열의 각 값을 양 또는 음의 십진수로 나누거나 두 열의 각 값을 나눕니다.
버림 열의 각 셀에 있는 숫자 값보다 크거나 같은 최대 정수를 반환합니다. 예를 들어 값이 2.21이면 2가 반환됩니다. 값이 5.88이면 5가 반환됩니다. 마찬가지로 값이 -5.15이면 -6이 반환됩니다.
로그 열의 각 값에 대한 로그를 반환합니다.
나머지 열의 각 값을 양의 십진수로 나눈 나머지를 반환하거나 두 열의 각 값을 나눈 나머지를 반환합니다.
곱하기 열의 각 값에 양 또는 음의 십진수를 곱하거나 두 열의 각 값을 곱합니다.
자연 로그 열의 각 값에 대한 자연 로그를 반환합니다.
거듭제곱 열 값을 지정된 지수로 거듭제곱합니다.
무작위 지정된 열에 예측할 수 없는 무작위 실수 값을 생성합니다.
반올림 열의 각 값을 반올림합니다.
사인 열의 각 값에 대한 사인을 반환합니다.
제곱 열의 각 값을 제곱합니다.
제곱근 열의 각 값에 대한 제곱근을 반환합니다.
빼기 열의 각 값에서 양 또는 음의 십진수를 뺍니다.
탄젠트 열의 각 값에 대한 탄젠트를 반환합니다.

두 열의 값에 대한 수치 계산 수행

두 열에 수치 계산을 적용하려면 다음 단계를 따르세요.

  1. Cloud Data Fusion에서 Wrangler 작업공간으로 이동합니다.
  2. 데이터 탭에서 2개의 열 이름 옆에 있는 체크박스를 선택합니다.
  3. 열 이름으로 이동하고 arrow_drop_down 펼치기 화살표를 클릭합니다.
  4. 계산을 선택하고 옵션(예: 더하기)을 선택합니다.
  5. 선택사항: 계산된 값으로 새 열을 만들려면 새 열에 복사 체크박스를 선택합니다. 그렇지 않으면 계산된 값이 기존 값을 재정의합니다.
  6. 적용을 클릭합니다.

값은 계산에 따라 변경됩니다. Wrangler는 상응하는 지시문을 레시피의 단계로 추가합니다. 예를 들어 Q1_SalesQ2_Sales 열의 각 행에 있는 값을 더하고 H1_Sales라는 새 열을 만들면 Wrangler는 다음 변환을 레시피에 추가합니다.

set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)

데이터 파이프라인을 실행하면 Wrangler가 변환을 수행하고 Q1_SalesQ2_Sales의 합계가 포함된 H1_Sales라는 새 열을 만듭니다.

두 열에 지원되는 계산

두 열의 각 행에 있는 값에 대해 다음과 같은 수치 계산을 수행할 수 있습니다.

함수 설명
더하기 열에 양 또는 음의 십진수를 더하거나 여러 열을 더하여 각 행의 합계를 출력합니다.
평균 여러 열의 각 행에 대한 평균을 반환합니다.
나누기 열의 각 값을 양 또는 음의 십진수로 나누거나 두 열의 각 값을 나눕니다.
같음 두 열을 비교하여 값이 일치하는지 행별로 확인하는 불리언 함수입니다. true 또는 false를 반환합니다.
LCM 두 열의 각 숫자에 대한 최소 공배수를 반환합니다.
최대 두 열의 각 행에 대한 최댓값을 반환합니다.
최소 두 열의 각 행에 대한 최솟값을 반환합니다.
나머지 열의 각 값을 양의 십진수로 나눈 나머지를 반환하거나 두 열의 각 값을 나눈 나머지를 반환합니다.
곱하기 열의 각 값에 양 또는 음의 십진수를 곱하거나 두 열의 각 값을 곱합니다.
빼기 열의 각 값에서 양 또는 음의 십진수를 뺍니다.

3개 이상 열의 값에 대한 수치 계산 수행

Cloud Data Fusion 버전 6.8.0 이상에서는 3개 이상의 열 값에 대한 수치 계산 수행을 지원합니다.

3개 이상의 열에 수치 계산을 적용하려면 다음 단계를 따르세요.

  1. Cloud Data Fusion에서 Wrangler 작업공간으로 이동합니다.
  2. 데이터 탭에서 2개의 열 이름 옆에 있는 체크박스를 선택합니다.
  3. 열 이름으로 이동하고 arrow_drop_down 펼치기 화살표를 클릭합니다.
  4. 계산을 선택하고 옵션(예: 더하기)을 선택합니다.
  5. 선택사항: 계산된 값으로 새 열을 만들려면 새 열에 복사 체크박스를 선택합니다. 그렇지 않으면 계산된 값이 기존 값을 재정의합니다.
  6. 적용을 클릭합니다.

값은 계산에 따라 변경됩니다. Wrangler는 상응하는 지시문을 레시피의 단계로 추가합니다. 예를 들어 Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales 열의 각 행에 있는 값을 더하고 2022_Sales라는 새 열을 만들면 Wrangler는 레시피에 다음 변환을 추가합니다.

set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)

데이터 파이프라인을 실행하면 Wrangler가 변환을 수행하고 Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales의 합계가 포함된 2022_Sales라는 새 열을 만듭니다.

3개 이상 열에 지원되는 계산

3개 이상 열의 각 행에 있는 값에 대해 다음 계산을 수행할 수 있습니다.

함수 설명
더하기 열에 양 또는 음의 십진수를 더하거나 여러 열을 더하여 각 행의 합계를 출력합니다.
평균 여러 열의 각 행에 대한 평균을 반환합니다.
같음 두 열을 비교하여 값이 일치하는지 행별로 확인하는 불리언 함수입니다. true 또는 false를 반환합니다.
최대 두 열의 각 행에 대한 최댓값을 반환합니다.
최소 두 열의 각 행에 대한 최솟값을 반환합니다.
곱하기 열의 각 값에 양 또는 음의 십진수를 곱하거나 두 열의 각 값을 곱합니다.

다음 단계