在本文中,我們將討論 Timeseries Insights API 中常見的概念,並嘗試簡單解釋所代表的意義。
活動
事件是一種資料點,以及 Timeseries Insights API 支援的原始輸入。概念代表特定代理程式 (例如客戶交易或發布新聞報導) 或觀察事件 (例如讀取溫度感應器的讀取作業) 所執行的動作機器)。
事件包含:
維度
維度代表資料集裡的事件類型和各值的屬性。維度可以是:
- 類別。這個維度上的事件屬性可以儲存一部分的有限/有限值,通常是字串。範例包括:含有新聞報導的資料集資料集或國家/地區名稱,以及在包含監控監控資料集的資料集中機器名稱。
- 數字。事件的評估方式或一般數值屬性。 例如:新聞報導、CPU 用量或實際工作環境監控資料的錯誤數量。
資料集
資料集是一系列事件。
群組
群組 ID 可供進行分組 (請參閱 Event.group_id
)。
群組的用意在於計算相同群組之間的事件關聯性,但 API 的現行版本不會顯示這項功能。例如,如果您的資料集保存監控資料 (例如 CPU%、RAM 等),則一個群組可以保留單一程序所有的監控資料。這可讓我們偵測出 CPU% 的增加與其他事件相關,例如較早的二進位版本更新。
如果不確定,或者不確定是否要計算這類相關性,那麼每個事件都應該有全域專屬的群組 ID。
智慧捷徑
配量是指資料集中所有類別 維度的值相同的子集。
例如,假設我們有來自國際零售商的銷售資料集,而每個事件都具有銷售下列維度的銷售:銷售國家/地區、產品名稱、 101} 的生產公司名稱。本範例的範例是指:特定產品的銷售、來自特定國家/地區的所有公司帶來的所有產品銷售額。
時間序列
時間序列是一系列匯總事件,位於大小相同的值區裡。其計算方式為:
- 因此,其中一個片段,以及該分類中的所有事件。
- 時間序列的開始時間和結束時間。針對指定的
QueryDataSetRequest
,這些限制 [tested_interval.start_time - forecast_params.forecast_history
、tested_interval.start_time + tested_interval.length
]。系統只會從分類匯出所選取的事件Event.event_time
的時間。 - 時間序列中每個值區的時間長度。對於特定的
QueryDataSetRequest
,這個長度會等於tested_interval.length
。 - 事件的匯總方法。我們目前支援下列兩種匯總方法:計算事件,或加總所有事件中顯示的數字維度 (由
forecast_params.aggregated_dimension
指定)。
預測
針對特定時間序列預測未來值的程序。
訴訟保留
訴訟保留是時間序列的最後一個部分 (通常是最後 5%-10%),用於評估預測模型的成效。如果在暫緩期間使用了較高的預測錯誤,我們會縮減預測界限,藉此降低預測的可信度。
地平線
我們會預測時間序列的值從測試時間間隔到時間水平 (由 ForecastParams.horizon_time
欄位提供)。
測試時間間隔
測試間隔 (QueryDataSetRequest.tested_interval
) 是指您想比較資料集內所有配量 (在測試間隔期間) 的未取樣值,以便對照其過去的時間系列產品。
異常狀況
如果在預測之後,有段期間的預測值落在預期的範圍之外,系統會將 slice 標記為異常狀況。