使用數字

本頁面說明如何在 Cloud Data Fusion Studio 的 Wrangler 工作區中準備資料時,執行數值計算。

您可以在下列資料類型的資料欄中執行這些轉換:

  • 整數
  • 小數
  • 雙精度值
  • 浮點值
  • 短文案

詳情請參閱 set-column 指令。

您可以在一或多個資料欄中使用數值函式。可用的數值函式會因所選資料欄數而異。您可以選擇建立包含計算結果的新資料欄,也可以讓結果顯示在新增轉換的資料欄中。

如果您對單一資料欄套用數值函式,其行為會與對多個資料欄套用數值函式不同。例如:

  • 如果您在單一資料欄上使用 Multiply() 函式,請指定要乘上資料欄中每個值的小數值。Wrangler 會對範例資料執行乘法,並在相同資料欄或新資料欄中顯示新值。
  • 如果您在多個資料欄上使用 Multiply() 函式,Wrangler 會將所選資料欄每列的值相乘,並在轉換作業的第一個資料欄中顯示新值。

對單一資料欄中的值執行數值計算

如要對某一欄套用數值計算,請按照下列步驟操作:

  1. 前往 Cloud Data Fusion 中的 Wrangler 工作區
  2. 在「資料」分頁中,前往所需欄名,然後按一下展開箭頭 arrow_drop_down
  3. 選取「計算」,然後選取所需選項,例如「加總」

    為了完成計算,部分函式會要求您輸入小數值。舉例來說,如果您選取「減去」,就必須輸入要從每個資料列中減去的值。

  4. 選用步驟:如要為計算值建立新資料欄,請選取「複製至新資料欄」核取方塊。

  5. 按一下 [套用]

值會根據計算結果而變動。Wrangler 會將對應的指令加入做為方案中的步驟。舉例來說,如果您要從 Price 欄的每個值中減去兩個,Wrangler 會在食譜中加入下列轉換:

set-column :Price Price - 2

執行資料管道時,系統會將轉換套用至資料欄中的所有值。

支援單一資料欄的計算

您可以對資料欄中的所有值執行下列計算:

函式 說明
絕對值 傳回資料欄中每個值的絕對值。舉例來說,-10 的絕對值是 10。
新增 將正或負小數加進資料欄,或新增多個資料欄,以輸出每列的總和。
Arccos 傳回資料欄中每個值的餘弦反函式。
Arcsin 傳回資料欄中每個值的 sin 值的反函式。
Arctan 傳回資料欄中每個值的反正切值。
Ceil 傳回大於或等於資料欄每個儲存格中數值的整數。舉例來說,如果值為 2.21,Ceil 會傳回 3。如果值為 5.88,Ceil 會傳回 6。如果值為 -5.15,Ceil 會傳回 -5。
Cos 傳回每個資料欄值的餘弦。
Cube 將資料欄中的每個值乘以 3。
立方體根目錄 傳回資料欄中每個值的立方根。
Divide 將資料欄中的每個值除以正或負小數,或將兩個資料欄中的每個值相除。
樓層 傳回大於或等於資料欄每個儲存格中數值的最大整數。舉例來說,如果值為 2.21,則 FLOOR 會傳回 2。如果值為 5.88,則 FLOOR 會傳回 5。同樣地,如果值為 -5.15,則 FLOOR 會傳回 -6。
記錄 傳回資料欄中每個值的對數。
Modulo 將資料欄中的每個值除以正小數時,傳回餘數,或是將兩個資料欄中的每個值除以正小數時,傳回餘數。
乘法 將資料欄中的每個值乘以正或負小數,或將兩個資料欄中的每個值相乘。
Natural Log 傳回資料欄中每個值的自然對數。
Power of 將資料欄值乘以指定值的次方。
隨機 在指定的資料欄中產生隨機的不可預測的雙精度浮點值。
Round 將資料欄中的每個值四捨五入。
Sin 傳回資料欄中每個值的 sin 值。
正方形 將資料欄中的每個值乘以 2。
平方根 傳回資料欄中每個值的平方根。
減法 從資料欄的每個值中減去正或負小數。
棕色 傳回資料欄中每個值的切線。

對兩個資料欄中的值執行數值計算

如要將數值計算套用至兩個資料欄,請按照下列步驟操作:

  1. 前往 Cloud Data Fusion 中的 Wrangler 工作區
  2. 在「資料」分頁中,選取兩個欄名稱旁的核取方塊。
  3. 前往欄名稱,然後按一下展開箭頭 arrow_drop_down
  4. 選取「計算」,然後選取所需選項,例如「加總」
  5. 選用步驟:如要為計算值建立新資料欄,請選取「複製至新資料欄」核取方塊。否則,計算值會覆寫現有值。
  6. 按一下 [套用]

值會根據計算結果而變動。Wrangler 會將對應的指令加入做為方案中的步驟。舉例來說,如果您在 Q1_SalesQ2_Sales 欄的每個資料列中新增值,並建立名為 H1_Sales 的新欄,Wrangler 會在方案中加入下列轉換:

set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)

執行資料管道時,Wrangler 會執行轉換作業,並建立名為 H1_Sales 的新欄,其中包含 Q1_SalesQ2_Sales 的總和。

兩欄中支援的計算

您可以對兩個資料欄中每個資料列的值執行下列數值計算:

函式 說明
新增 將正或負小數加進資料欄,或新增多個資料欄,以輸出每列的總和。
平均 傳回多個欄中每個資料列的平均值。
Divide 將資料欄中的每個值除以正或負小數,或將兩個資料欄中的每個值相除。
相等 布林函式,可比較兩個資料欄,逐列查看值是否相符。傳回 truefalse
LCM 傳回兩個資料欄中每個數字的最小公倍數。
Max 傳回兩個資料欄中每個資料列的最大值。
Min 傳回兩個資料欄中每個資料列的最小值。
Modulo 將資料欄中的每個值除以正小數時,傳回餘數,或是將兩個資料欄中的每個值除以時,傳回餘數。
乘法 將資料欄中的每個值乘以正或負小數,或將兩個資料欄中的每個值相乘。
減法 從資料欄的每個值中減去正或負小數。

針對三個或更多資料欄中的值執行數值計算

在 6.8.0 以上版本中,Cloud Data Fusion 可對三個或更多資料欄的值執行數值計算。

如要將數值計算套用至三個或更多欄,請按照下列步驟操作:

  1. 前往 Cloud Data Fusion 中的 Wrangler 工作區
  2. 在「資料」分頁中,選取兩個欄名稱旁的核取方塊。
  3. 前往欄名稱,然後按一下展開箭頭 arrow_drop_down
  4. 選取「計算」,然後選取所需選項,例如「加總」
  5. 選用步驟:如要為計算值建立新資料欄,請選取「複製至新資料欄」核取方塊。否則,計算值會覆寫現有值。
  6. 按一下 [套用]

值會根據計算結果而變動。Wrangler 會將對應的指令加入做為方案中的步驟。舉例來說,如果您在 Q1_SalesQ2_SalesQ3_SalesQ4_Sales 資料欄的每個資料列中新增值,並建立名為 2022_Sales 的新資料欄,Rancher 就會在食譜中加入下列轉換:

set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)

執行資料管道時,Wrangler 會執行轉換作業,並建立名為 2022_Sales 的新欄,其中包含 Q1_SalesQ2_SalesQ3_SalesQ4_Sales 的總和。

支援三個或更多欄中的計算

您可以對三個或更多欄的每個資料列值執行下列計算:

函式 說明
新增 將正或負小數加進資料欄,或新增多個資料欄,以輸出每列的總和。
平均 傳回多個欄中每個資料列的平均值。
相等 布林函式,可比較兩個資料欄,逐列查看值是否相符。傳回 truefalse
Max 傳回兩個資料欄中每個資料列的最大值。
Min 傳回兩個資料欄中每個資料列的最小值。
乘法 將資料欄中的每個值乘以正或負小數,或將兩個資料欄中的每個值相乘。

後續步驟