管理服務錯誤

您可以透過 Error Reporting 自動擷取應用程式異常終止情形,並將這些異常終止的堆疊追蹤分組成錯誤群組,藉此找出、瞭解及管理應用程式錯誤。不過,某些 Google Cloud服務錯誤會記錄為錯誤訊息,而不會以堆疊追蹤的形式記錄。Error Reporting 的「Service Errors」功能會自動擷取並歸類這類 Google Cloud 服務錯誤,協助您快速找出系統問題,並在發生新錯誤時收到通知。

舉例來說,在使用 Cloud Run 時,您可能會遇到在提出要求時達到容器執行個體上限的情況。當這項事件記錄至 Cloud Logging 時,Error Reporting 中的服務錯誤會自動擷取這項錯誤,並將其與類似錯誤分組,並通知您這項事件已發生。此外,為協助您解決這些錯誤,部分 Google Cloud 服務會提供疑難排解說明文件,您可以透過 Error Reporting 頁面存取這些文件。

查看服務錯誤

前往 Google Cloud 控制台的「Error Reporting」頁面:

前往「錯誤回報

您也可以透過搜尋列找到這個頁面。

當 Error Reporting 偵測到含有新服務錯誤的記錄並將其歸類時,您可以在 Error Reporting 總覽頁面的「類型」欄中看到這些服務錯誤。

Error Reporting 總覽頁面

如果服務錯誤有已記錄的解決方案,錯誤回報會提供連結,讓您前往 Google Cloud 服務提供的疑難排解指南。

服務錯誤示例

下表列出 Error Reporting 的服務錯誤擷取的部分錯誤,但並非全部。

Google Cloud 服務名稱 錯誤類型
Dataflow 工作站記錄節流
記憶體不足 (系統)
缺少自訂子網路
步驟中長時間運作
JRE 當機
工作站 JAR 檔案設定錯誤
Cloud Run 已超出記憶體上限
沒有可用的執行個體
Google Kubernetes Engine Pod 健康狀態不良,探測失敗
Pod 排程失敗
使用回溯法重新啟動失敗的容器
未掛載的磁碟分割區
容器映像檔提取失敗
無法更新端點
找不到密碼/設定地圖