您可以透過 Error Reporting 自動擷取應用程式異常終止情形,並將這些異常終止的堆疊追蹤分組成錯誤群組,藉此找出、瞭解及管理應用程式錯誤。不過,某些 Google Cloud服務錯誤會記錄為錯誤訊息,而不會以堆疊追蹤的形式記錄。Error Reporting 的「Service Errors」功能會自動擷取並歸類這類 Google Cloud 服務錯誤,協助您快速找出系統問題,並在發生新錯誤時收到通知。
舉例來說,在使用 Cloud Run 時,您可能會遇到在提出要求時達到容器執行個體上限的情況。當這項事件記錄至 Cloud Logging 時,Error Reporting 中的服務錯誤會自動擷取這項錯誤,並將其與類似錯誤分組,並通知您這項事件已發生。此外,為協助您解決這些錯誤,部分 Google Cloud 服務會提供疑難排解說明文件,您可以透過 Error Reporting 頁面存取這些文件。
查看服務錯誤
前往 Google Cloud 控制台的「Error Reporting」頁面:
您也可以透過搜尋列找到這個頁面。
當 Error Reporting 偵測到含有新服務錯誤的記錄並將其歸類時,您可以在 Error Reporting 總覽頁面的「類型」欄中看到這些服務錯誤。
如果服務錯誤有已記錄的解決方案,錯誤回報會提供連結,讓您前往 Google Cloud 服務提供的疑難排解指南。
服務錯誤示例
下表列出 Error Reporting 的服務錯誤擷取的部分錯誤,但並非全部。
Google Cloud 服務名稱 | 錯誤類型 |
---|---|
Dataflow | 工作站記錄節流 記憶體不足 (系統) 缺少自訂子網路 步驟中長時間運作 JRE 當機 工作站 JAR 檔案設定錯誤 |
Cloud Run | 已超出記憶體上限 沒有可用的執行個體 |
Google Kubernetes Engine | Pod 健康狀態不良,探測失敗 Pod 排程失敗 使用回溯法重新啟動失敗的容器 未掛載的磁碟分割區 容器映像檔提取失敗 無法更新端點 找不到密碼/設定地圖 |