本頁面說明如何在 Cloud Data Fusion Studio 的 Wrangler 工作區中準備資料時,執行數值計算。
您可以在下列資料類型的資料欄中執行這些轉換:
- 整數
- 小數
- 雙精度值
- 浮點值
- 長
- 短文案
詳情請參閱 set-column
指令。
您可以在一或多個資料欄中使用數值函式。可用的數值函式會因所選資料欄數而異。您可以選擇建立包含計算結果的新資料欄,也可以讓結果顯示在新增轉換的資料欄中。
如果您對單一資料欄套用數值函式,其行為會與對多個資料欄套用數值函式不同。例如:
- 如果您在單一資料欄上使用
Multiply()
函式,請指定要乘上資料欄中每個值的小數值。Wrangler 會對範例資料執行乘法,並在相同資料欄或新資料欄中顯示新值。 - 如果您在多個資料欄上使用
Multiply()
函式,Wrangler 會將所選資料欄每列的值相乘,並在轉換作業的第一個資料欄中顯示新值。
對單一資料欄中的值執行數值計算
如要對某一欄套用數值計算,請按照下列步驟操作:
- 前往 Cloud Data Fusion 中的 Wrangler 工作區。
- 在「資料」分頁中,前往所需欄名,然後按一下展開箭頭 arrow_drop_down。
選取「計算」,然後選取所需選項,例如「加總」。
為了完成計算,部分函式會要求您輸入小數值。舉例來說,如果您選取「減去」,就必須輸入要從每個資料列中減去的值。
選用步驟:如要為計算值建立新資料欄,請選取「複製至新資料欄」核取方塊。
按一下 [套用]。
值會根據計算結果而變動。Wrangler 會將對應的指令加入做為方案中的步驟。舉例來說,如果您要從 Price
欄的每個值中減去兩個,Wrangler 會在食譜中加入下列轉換:
set-column :Price Price - 2
執行資料管道時,系統會將轉換套用至資料欄中的所有值。
支援單一資料欄的計算
您可以對資料欄中的所有值執行下列計算:
函式 | 說明 |
---|---|
絕對值 | 傳回資料欄中每個值的絕對值。舉例來說,-10 的絕對值是 10。 |
新增 | 將正或負小數加進資料欄,或新增多個資料欄,以輸出每列的總和。 |
Arccos | 傳回資料欄中每個值的餘弦反函式。 |
Arcsin | 傳回資料欄中每個值的 sin 值的反函式。 |
Arctan | 傳回資料欄中每個值的反正切值。 |
Ceil | 傳回大於或等於資料欄每個儲存格中數值的整數。舉例來說,如果值為 2.21,Ceil 會傳回 3。如果值為 5.88,Ceil 會傳回 6。如果值為 -5.15,Ceil 會傳回 -5。 |
Cos | 傳回每個資料欄值的餘弦。 |
Cube | 將資料欄中的每個值乘以 3。 |
立方體根目錄 | 傳回資料欄中每個值的立方根。 |
Divide | 將資料欄中的每個值除以正或負小數,或將兩個資料欄中的每個值相除。 |
樓層 | 傳回大於或等於資料欄每個儲存格中數值的最大整數。舉例來說,如果值為 2.21,則 FLOOR 會傳回 2。如果值為 5.88,則 FLOOR 會傳回 5。同樣地,如果值為 -5.15,則 FLOOR 會傳回 -6。 |
記錄 | 傳回資料欄中每個值的對數。 |
Modulo | 將資料欄中的每個值除以正小數時,傳回餘數,或是將兩個資料欄中的每個值除以正小數時,傳回餘數。 |
乘法 | 將資料欄中的每個值乘以正或負小數,或將兩個資料欄中的每個值相乘。 |
Natural Log | 傳回資料欄中每個值的自然對數。 |
Power of | 將資料欄值乘以指定值的次方。 |
隨機 | 在指定的資料欄中產生隨機的不可預測的雙精度浮點值。 |
Round | 將資料欄中的每個值四捨五入。 |
Sin | 傳回資料欄中每個值的 sin 值。 |
正方形 | 將資料欄中的每個值乘以 2。 |
平方根 | 傳回資料欄中每個值的平方根。 |
減法 | 從資料欄的每個值中減去正或負小數。 |
棕色 | 傳回資料欄中每個值的切線。 |
對兩個資料欄中的值執行數值計算
如要將數值計算套用至兩個資料欄,請按照下列步驟操作:
- 前往 Cloud Data Fusion 中的 Wrangler 工作區。
- 在「資料」分頁中,選取兩個欄名稱旁的核取方塊。
- 前往欄名稱,然後按一下展開箭頭 arrow_drop_down。
- 選取「計算」,然後選取所需選項,例如「加總」。
- 選用步驟:如要為計算值建立新資料欄,請選取「複製至新資料欄」核取方塊。否則,計算值會覆寫現有值。
- 按一下 [套用]。
值會根據計算結果而變動。Wrangler 會將對應的指令加入做為方案中的步驟。舉例來說,如果您在 Q1_Sales
和 Q2_Sales
欄的每個資料列中新增值,並建立名為 H1_Sales
的新欄,Wrangler 會在方案中加入下列轉換:
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
執行資料管道時,Wrangler 會執行轉換作業,並建立名為 H1_Sales
的新欄,其中包含 Q1_Sales
和 Q2_Sales
的總和。
兩欄中支援的計算
您可以對兩個資料欄中每個資料列的值執行下列數值計算:
函式 | 說明 |
---|---|
新增 | 將正或負小數加進資料欄,或新增多個資料欄,以輸出每列的總和。 |
平均 | 傳回多個欄中每個資料列的平均值。 |
Divide | 將資料欄中的每個值除以正或負小數,或將兩個資料欄中的每個值相除。 |
相等 | 布林函式,可比較兩個資料欄,逐列查看值是否相符。傳回 true 或 false 。 |
LCM | 傳回兩個資料欄中每個數字的最小公倍數。 |
Max | 傳回兩個資料欄中每個資料列的最大值。 |
Min | 傳回兩個資料欄中每個資料列的最小值。 |
Modulo | 將資料欄中的每個值除以正小數時,傳回餘數,或是將兩個資料欄中的每個值除以時,傳回餘數。 |
乘法 | 將資料欄中的每個值乘以正或負小數,或將兩個資料欄中的每個值相乘。 |
減法 | 從資料欄的每個值中減去正或負小數。 |
針對三個或更多資料欄中的值執行數值計算
在 6.8.0 以上版本中,Cloud Data Fusion 可對三個或更多資料欄的值執行數值計算。
如要將數值計算套用至三個或更多欄,請按照下列步驟操作:
- 前往 Cloud Data Fusion 中的 Wrangler 工作區。
- 在「資料」分頁中,選取兩個欄名稱旁的核取方塊。
- 前往欄名稱,然後按一下展開箭頭 arrow_drop_down。
- 選取「計算」,然後選取所需選項,例如「加總」。
- 選用步驟:如要為計算值建立新資料欄,請選取「複製至新資料欄」核取方塊。否則,計算值會覆寫現有值。
- 按一下 [套用]。
值會根據計算結果而變動。Wrangler 會將對應的指令加入做為方案中的步驟。舉例來說,如果您在 Q1_Sales
、Q2_Sales
、Q3_Sales
和 Q4_Sales
資料欄的每個資料列中新增值,並建立名為 2022_Sales
的新資料欄,Rancher 就會在食譜中加入下列轉換:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
執行資料管道時,Wrangler 會執行轉換作業,並建立名為 2022_Sales
的新欄,其中包含 Q1_Sales
、Q2_Sales
、Q3_Sales
和 Q4_Sales
的總和。
支援三個或更多欄中的計算
您可以對三個或更多欄的每個資料列值執行下列計算:
函式 | 說明 |
---|---|
新增 | 將正或負小數加進資料欄,或新增多個資料欄,以輸出每列的總和。 |
平均 | 傳回多個欄中每個資料列的平均值。 |
相等 | 布林函式,可比較兩個資料欄,逐列查看值是否相符。傳回 true 或 false 。 |
Max | 傳回兩個資料欄中每個資料列的最大值。 |
Min | 傳回兩個資料欄中每個資料列的最小值。 |
乘法 | 將資料欄中的每個值乘以正或負小數,或將兩個資料欄中的每個值相乘。 |
後續步驟
- 進一步瞭解 Wrangler 指令。