MODEIF 函式

根據其分組,計算某資料欄所有資料列值中的眾數 (最常出現的值)。輸入資料欄可以是整數或小數類型。
  • 如果資料列含有遺漏值或空值,則不會列入計算。如果整個資料欄不包含任何值,函式會傳回空值。
  • 如果最常出現的值不只一個,則函式不會傳回任何值。
  • 如果在 pivot 轉換中使用此函式,系統會使用該函式計算每個在 group 參數中所指定之值的例項。請參閱 Pivot 轉換一文。

如需此函式的非條件版本,請參閱 MODE 函式

這個函式有另一個版本,可針對累計範圍的資料列進行計算,詳情請參閱 ROLLINGMODE 函式一文。

基本用法

pivot value:MODEIF(count_visits, health_status == 'sick') group:postal_code limit:1

輸出:產生由兩個資料欄組成的資料表,當中含有 postal_code 資料欄的不重複值,以及 count_visits 資料欄值的眾數 (若針對 postal_code 值,將 health_status 設為 sick)。limit 參數會定義輸出資料欄數量上限。

語法

pivot value:MODEIF(function_col_ref, test_expression) [group:group_col_ref] [limit:limit_count]

引數是否必要?資料類型說明
function_col_ref字串待套用函式的資料欄名稱
test_expression字串

用來求取值的運算式,必須解析為 truefalse

如要進一步瞭解 grouplimit 參數,請參閱 Pivot 轉換一文。

若要進一步瞭解語法標準,請參閱語言文件語法附註

function_col_ref

要依據其值計算函式的資料欄名稱。資料欄必須包含整數或小數值。

  • 輸入內容不得為常值。
  • 不支援多個資料欄和萬用字元。

使用須知:

是否必要?資料類型示例值
字串 (資料欄參照)myValues

test_expression

這個參數含有用來求取值的運算式。這個運算式必須解析為布林值 (truefalse)。

使用須知:

是否必要? 資料類型範例值
得出的結果值為 truefalse 的字串運算式(LastName == 'Mouse' && FirstName == 'Mickey')

範例

範例 - MODEIF 函式

下列資料包含兩個地區 (r01r02) 的 2017 年每週訂單清單。您將依地區計算下半年的最常用訂單計數。

來源:

附註:為了精簡起見,僅會顯示前幾個資料列。

日期地區OrderCount
1/6/2017r0178
1/6/2017r0297
1/13/2017r0192
1/13/2017r0290
1/20/2017r0197
1/20/2017r0284

轉換:

為了方便起見,您可先計算每個資料列的週數:

derive type: single value: WEEKNUM(Date) as: 'weekNumber'

接著您可使用下列匯總,判斷下半年每個地區的最常用訂單值:

pivot group: Region value: MODEIF(OrderCount, weekNumber > 26) limit: 50

結果:

地區modeif_OrderCount
r0185
r02100

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁