ROLLINGCOUNTA 函式

計算指定資料欄中目前資料列前後指定列數的非空值累計計數。
  • 如果輸入值遺漏或為空值,則不會列入計算。例如,針對資料集中的第一列,此列之前的值累計非空值計數為未定義。
  • 擷取值的來源資料列由 order 參數指定的資料列排序決定。

    如果您正在處理隨機產生的資料集樣本,則您在此函式中看到的值未必會對應到工作執行期間在完整資料集中產生的值。

  • 此函式使用資料欄名稱,以及目前資料列往後及往前範圍的兩個整數參數。
    • 預設整數參數值是 -10,用以計算現行資料列往後到資料集第一列的累計函式。
  • 此函式可與下列轉換一起使用:

如要進一步瞭解此函式的非累計版本,請參閱 COUNTA 函式一文。

基本用法

資料欄範例:

derive type:single value:ROLLINGCOUNTA(myCol)

輸出:產生新的資料欄,其中包含資料集第一列至目前列之 myCol 資料欄中的非空值累計計數。

計算前幾列範例:

window value:ROLLINGCOUNTA(myNumber, 3)

輸出:產生新資料欄,其中包含 myNumber 資料欄中目前列與前兩列值的非空值累計計數。

計算前後幾列範例:

window value:ROLLINGCOUNTA(myNumber, 3, 2)

輸出:產生新資料欄,其中包含 myNumber 資料欄中目前列的前兩列值、目前列值,以及後兩列值的累計非空值計數。

語法

window value:ROLLINGCOUNTA(col_ref, rowsBefore_integer, rowsAfter_integer) order: order_col [group: group_col]

引數是否必要?資料類型說明
col_ref字串資料欄名稱,其值會套用於函式
rowsBefore_integer整數待併入計算的現行資料列之前的列數
rowsAfter_integer整數待併入計算的現行資料列之後的列數

如要進一步瞭解 ordergroup 參數,請參閱 Window 轉換

如要進一步瞭解語法標準,請參閱語言文件語法附註

col_ref

資料欄名稱,其值會用於計算函式。

  • 不支援多個資料欄和萬用字元。

使用須知:

是否必要?資料類型範例值
字串 (整數或小數值的資料欄參照)myColumn

rowsBefore_integer、rowsAfter_integer

整數代表現行列前後的列數,系統會從現行列開始計算之前或之後指定列數 (包括現行列在內) 的累計函式。例如,如果第一個值是 5,則計算範圍為現行列和現行列之後的四列。負值的 k 代表計算現行列之前指定列數的累計平均值。

  • rowBefore=1 只會產生現行列值。
  • rowBefore=-1 使用現行列之前的所有列。
  • 如果沒有指定 rowsAfter,則會套用 0 值。
  • 如果套用 group 參數,則這些參數值不應超過群組中的最大列數。

使用須知:

是否必要?資料類型範例值
整數4

範例

範例 - 計算訊息

在下列範例中,系統每隔 10 秒即會列表顯示訊息。如未產生任何訊息,則會傳回空值。

來源:

時間戳記msgTypemsgDescription
15:10:00 PM警告伺服器已重新啟動。
15:10:10 PM警告找不到模式檔案。
15:10:20 PM
15:10:30 PM
15:10:40 PM錯誤無法連線至資料來源。
15:10:50 PM錯誤無法開啟資料集。
15:11:00 PM
15:11:10 PM
15:11:20 PM錯誤權限不足,無法寫入至目標位置。
15:11:30 PM
15:11:40 PM警告伺服器已重新啟動。
15:11:50 PM警告找不到模式檔案。
15:12:00 PM錯誤資料節點離線。
15:12:10 PM
15:12:20 PM
15:12:30 PM警告方案中的陳述式無效。
15:12:40 PM
15:12:50 PM

轉換:

若要針對每列的先前分鐘計算項目數,請新增下列指令:

derive type: multiple value: rollingcounta(msgType, 5, 0) order: Timestamp as: 'rollingcounta_msgType'

結果:

時間戳記msgTypemsgDescriptionrollingcounta_msgType
15:10:00 PM警告伺服器已重新啟動。1
15:10:10 PM警告找不到模式檔案。2
15:10:20 PM 2
15:10:30 PM 2
15:10:40 PM錯誤無法連線至資料來源。3
15:10:50 PM錯誤無法開啟資料集。4
15:11:00 PM 3
15:11:10 PM 2
15:11:20 PM錯誤權限不足,無法寫入至目標位置。3
15:11:30 PM 3
15:11:40 PM警告伺服器已重新啟動。3
15:11:50 PM警告找不到模式檔案。3
15:12:00 PM錯誤資料節點離線。4
15:12:10 PM 4
15:12:20 PM 3
15:12:30 PM警告方案中的陳述式無效。4
15:12:40 PM 3
15:12:50 PM 2

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁