管理以 SQL 為準的快訊政策事件

事件是警告政策符合條件時的記錄。一般來說,當符合警告政策的條件時,Cloud Monitoring 會開啟事件並傳送通知。不過,在下列情況下,系統不會建立事件:

  • 政策已暫緩或停用。
  • 快訊政策或事件數量超過現有的快訊限制

針對每個事件,Monitoring 會建立「事件詳細資料」頁面,方便您管理事件,並提供事件資訊,協助您排解故障問題。舉例來說,「事件詳細資料」頁面會顯示 SQL 查詢結果摘要和相關事件的清單。

本文說明如何找出事件。本文也會說明如何使用「事件詳細資料」頁面,管理以 SQL 為基礎的快訊政策事件,這類政策會評估針對記錄檔項目群組資料執行的 SQL 查詢結果。

這項功能僅支援 Google Cloud 專案。 如要進行 App Hub 設定,請選取 App Hub 主機專案或已啟用應用程式的資料夾管理專案。

事前準備

如要取得必要權限,以便使用 Google Cloud 控制台查看及管理事件,請要求管理員授予您專案的下列 IAM 角色:

如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。

您或許還可透過自訂角色或其他預先定義的角色取得必要權限。

如要進一步瞭解 Cloud Monitoring 角色,請參閱「使用 Identity and Access Management 控制存取權」。

尋找事件

如要查看 Google Cloud 專案中的事件清單,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的 「Alerting」(警告) 頁面

    前往「Alerting」(快訊)

    如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果

  2. 在 Google Cloud 控制台的工具列中,選取您的 Google Cloud 專案。如要進行 App Hub 設定,請選取 App Hub 主專案或已啟用應用程式的資料夾管理專案。

    「警告」頁面會顯示警告政策、暫緩和事件的相關資訊:

    • 「摘要」窗格會列出未結事件的數量。
    • 「Incidents」(事件) 窗格會顯示最近的未結事件。如要在表格中列出最新事件 (包括已結案的事件),請按一下「顯示已結案的事件」
  3. 如要查看特定事件的詳細資料,請在清單中選取該事件。

    「Incident details」(事件詳細資料) 頁面隨即開啟。如要進一步瞭解「事件詳細資料」頁面,請參閱本頁的「調查事件」一節。

尋找較舊的事件

「Alerting」(警告) 頁面的「Incidents」(事件) 窗格會顯示最近的未結事件。如要找出較舊的事件,請執行下列其中一項操作:

  • 如要逐頁瀏覽「事件」表格中的項目,請按一下「較新」或「較舊」

  • 如要前往「事件」頁面,請按一下「查看所有事件」。您可以在「事件」頁面執行下列所有操作:

    • 顯示已結案的事件:如要在表格中列出所有事件,請按一下「顯示已結案的事件」
    • 篩選事件:如要瞭解如何新增篩選器,請參閱「篩選事件」。
    • 確認或關閉事件,或是暫緩快訊政策。 如要存取這些選項,請按一下事件列中的「更多選項」,然後從選單中選取。詳情請參閱「管理事件」。

篩選事件

在篩選列中輸入值時,「事件」表格只會列出符合篩選條件的事件。如果新增多個篩選器,事件必須符合所有篩選條件才會顯示。

如要為事件表格新增篩選器,請按照下列步驟操作:

  1. 在「事件」頁面中,按一下「篩選表格」,然後選取篩選器屬性。篩選條件屬性包括下列所有項目:

    • 事件狀態
    • 快訊政策名稱
    • 事件開啟或關閉的時間
  2. 從次要選單選取值,或在篩選列中輸入值。

調查事件

「事件詳細資料」頁面包含有助於找出事件原因的資訊。

瀏覽查詢結果

「每日消耗的運算單元總時間」窗格會顯示過去 24 小時內,保留的 BigQuery 運算單元執行警報政策 SQL 查詢所花費的時間。

「SQL 查詢結果」窗格會顯示清單,列出每次 Log Analytics 從警報政策的條件執行 SQL 查詢時,得到的查詢結果摘要。根據預設,系統會篩選清單,只顯示符合警告政策條件的查詢。

  • 如要查看特定時間的查詢和查詢結果表格 (Log Analytics 當時執行查詢),請按一下「Query run time」(查詢執行時間) 欄中的值。
  • 如要切換顯示符合快訊政策條件的查詢結果,以及 Log Analytics 從快訊政策執行的所有查詢,請按一下「只顯示符合快訊條件的查詢」

查看補充資訊

「說明文件」部分會顯示您建立快訊政策時提供的通知說明文件範本。這類資訊可能包括警報政策監控內容的說明,以及緩解措施的提示。詳情請參閱「使用使用者定義的註解標註通知」。

如果沒有為快訊政策設定說明文件,則「說明文件」窗格會顯示「未設定任何說明文件」。

為協助您找出應用程式的根本問題,您可以探索與其他快訊政策條件相關的事件。

「相關事件」部分會顯示快訊政策條件符合時建立的其他事件清單。

管理事件

事件會處於下列其中一種狀態:

  •  開啟: 符合以 SQL 為基礎的快訊政策條件,且事件仍處於開啟狀態。如果再次符合相同條件,且事件已開啟,系統就不會開啟新事件。

  •  已確認: 事件處於開啟狀態,且已手動標示為已確認。 通常這個狀態表示事件正在調查中。

  •  已結案: 您已手動結案,或自動結案期限到期後,系統已自動結案。

確認事件

建議您在開始調查事件原因時,將事件標示為已確認。

如要將事件標示為已確認,請按照下列步驟操作:

  1. 在「警告」頁面的「事件」窗格中,按一下「查看所有事件」
  2. 在「事件」頁面中,找到要確認的事件,然後執行下列任一操作:

    • 按一下「更多選項」,然後選取「確認」
    • 開啟事件的詳細資料頁面,然後按一下「確認事件」

暫緩執行快訊政策

如要避免 Monitoring 在特定時間範圍內建立事件及傳送通知,請延後相關快訊政策。延後快訊政策後,與該政策相關的事件仍會保持開啟狀態,但不會再觸發通知。系統會根據快訊政策的自動關閉期限關閉事件。

如要為目前查看的事件建立暫緩通知,請按照下列步驟操作:

  1. 在「Incident details」(事件詳細資料) 頁面中,按一下「Snooze Policy」(暫緩政策)

  2. 選取延後時間長度。選取延後時間長度後,系統會立即開始延後。

您也可以前往「事件」頁面,找出要延後的事件,然後依序點選「更多選項」和「延後」,延後警告政策。您可以在服務中斷期間暫緩快訊政策,以免在疑難排解程序中收到更多通知。

關閉事件

您可以讓 Monitoring 為您關閉事件,也可以自行關閉事件。

當快訊政策的自動關閉時間到期時,監控系統會自動關閉事件。預設的自動關閉時間為 7 天。自動關閉期限最短為 30 分鐘。

自動關閉期限是指事件必須經過的時間長度,如果事件原因未重複發生,系統就會關閉事件。因此,如果事件處於開啟狀態,且原因再次發生,事件的開啟時間可能會比自動關閉時間長。

如要關閉事件,請按照下列步驟操作:

  1. 在「警告」頁面的「事件」窗格中,按一下「查看所有事件」
  2. 在「事件」頁面中找到要結案的事件,然後執行下列其中一項操作:

    • 按一下「查看更多」,然後選取「關閉事件」
    • 開啟該事件的「Incident details」(事件詳細資料) 頁面,然後按一下「Close incident」(關閉事件)

如果看到 Unable to close incident 訊息,請稍待幾分鐘後再試。您無法立即關閉新事件,因為警報系統仍將導致事件的條件視為有效。

資料保留和限制

如要瞭解事件的限制和保留期限,請參閱「快訊限制」一文。

後續步驟