概念

在本文中,我們將討論 Timeseries Insights API 中常見的概念,並嘗試簡單解釋所代表的意義。

活動

事件是一種資料點,以及 Timeseries Insights API 支援的原始輸入。概念代表特定代理程式 (例如客戶交易或發布新聞報導) 或觀察事件 (例如讀取溫度感應器的讀取作業) 所執行的動作機器)。

事件包含:

  • 在不同的維度中的一組值,代表事件的屬性,例如標籤或數值測量。
  • 時間戳記,代表事件發生的時間。將事件放入時間序列時,就會使用這個時間戳記。
  • 群組 ID。

維度

維度代表資料集裡的事件類型和各值的屬性。維度可以是:

  • 類別。這個維度上的事件屬性可以儲存一部分的有限/有限值,通常是字串。範例包括:含有新聞報導的資料集資料集或國家/地區名稱,以及在包含監控監控資料集的資料集中機器名稱。
  • 數字。事件的評估方式或一般數值屬性。 例如:新聞報導、CPU 用量或實際工作環境監控資料的錯誤數量。

資料集

資料集是一系列事件。

群組

群組 ID 可供進行分組 (請參閱 Event.group_id)。

群組的用意在於計算相同群組之間的事件關聯性,但 API 的現行版本不會顯示這項功能。例如,如果您的資料集保存監控資料 (例如 CPU%、RAM 等),則一個群組可以保留單一程序所有的監控資料。這可讓我們偵測出 CPU% 的增加與其他事件相關,例如較早的二進位版本更新。

如果不確定,或者不確定是否要計算這類相關性,那麼每個事件都應該有全域專屬的群組 ID。

智慧捷徑

配量是指資料集中所有類別 維度的值相同的子集。

例如,假設我們有來自國際零售商的銷售資料集,而每個事件都具有銷售下列維度的銷售:銷售國家/地區、產品名稱、 101} 的生產公司名稱。本範例的範例是指:特定產品的銷售、來自特定國家/地區的所有公司帶來的所有產品銷售額。

時間序列

時間序列是一系列匯總事件,位於大小相同的值區裡。其計算方式為:

  • 因此,其中一個片段,以及該分類中的所有事件。
  • 時間序列的開始時間和結束時間。針對指定的QueryDataSetRequest,這些限制 [tested_interval.start_time - forecast_params.forecast_historytested_interval.start_time + tested_interval.length ]。系統只會從分類匯出所選取的事件Event.event_time的時間。
  • 時間序列中每個值區的時間長度。對於特定的 QueryDataSetRequest,這個長度會等於 tested_interval.length
  • 事件的匯總方法。我們目前支援下列兩種匯總方法:計算事件,或加總所有事件中顯示的數字維度 (由 forecast_params.aggregated_dimension 指定)。

預測

針對特定時間序列預測未來值的程序。

訴訟保留

訴訟保留是時間序列的最後一個部分 (通常是最後 5%-10%),用於評估預測模型的成效。如果在暫緩期間使用了較高的預測錯誤,我們會縮減預測界限,藉此降低預測的可信度。

地平線

我們會預測時間序列的值從測試時間間隔到時間水平 (由 ForecastParams.horizon_time 欄位提供)。

測試時間間隔

測試間隔 (QueryDataSetRequest.tested_interval) 是指您想比較資料集內所有配量 (在測試間隔期間) 的未取樣值,以便對照其過去的時間系列產品。

異常狀況

如果在預測之後,有段期間的預測值落在預期的範圍之外,系統會將 slice 標記為異常狀況。

後續步驟