應用程式監控支援的基礎架構

下表列出與應用程式監控服務整合的基礎架構資源。將這些資源註冊為 App Hub 服務或工作負載後,資源產生的遙測資料就會包含應用程式專屬標籤。這類遙測資料包括平台和稽核記錄項目、指標資料和追蹤資料。如要查看與 App Hub 整合的服務和工作負載清單,請參閱「App Hub 支援的資源」。

如果資料包含應用程式專屬標籤,應用程式監控功能產生的現成 (OOTB) 資訊主頁就會顯示記錄和指標資料,包括下列黃金信號:

  • 流量:所選時間範圍內,服務或工作負載的傳入要求比率。
  • 伺服器錯誤率:在所選時間範圍內,產生或對應至 5xx HTTP 回應代碼的傳入要求平均百分比。
  • P95 延遲時間:所選時間範圍內,要求延遲時間的第 95 個百分位數,以毫秒為單位。
  • 飽和度:衡量服務或工作負載的飽和程度。舉例來說,如果是代管執行個體群組 (MIG)、Cloud Run 和 Google Kubernetes Engine 部署作業,這個欄位會顯示 CPU 使用率。

支援的基礎架構資源

「附註」欄會列出支援的關鍵信號詳細資料。 這個資料欄也會列出限制。

基礎架構資源 黃金信號 注意事項和限制
PostgreSQL 適用的 AlloyDB 叢集
(區域)
應用程式標籤不會附加至範圍。
PostgreSQL 適用的 AlloyDB 執行個體
(區域)
應用程式標籤不會附加至範圍。
Bigtable 叢集
(區域)
應用程式標籤不會附加至範圍。
Bigtable 執行個體
(區域)
應用程式標籤不會附加至指標資料或 span。
Cloud Run 工作
(區域)
Cloud Run 服務和函式
(區域)

只有檢測工作負載產生的追蹤記錄範圍包含應用程式標籤。

只有在 Cloud Run 中執行的客戶監控工作負載,才會產生黃金信號。

Cloud Logging 記錄檔 bucket
(全域和區域)
只有稽核記錄包含應用程式標籤。
Cloud SQL 執行個體
(區域)
應用程式標籤不會附加至範圍。
Cloud Storage bucket
(區域和多區域)
  • 流量api/request_count
  • 伺服器錯誤率:回應狀態指出發生錯誤的要求,占要求總數的比例。下列狀態值表示發生錯誤:
    • DATA_LOSS
    • DEADLINE_EXCEEDED
    • INTERNAL
    • UNAVAILABLE
    • UNIMPLEMENTED
    • UNKNOWN
應用程式標籤不會附加至範圍。
Compute Engine MIG
(區域和區域)
Dataproc Metastore 服務
(區域和多區域)

應用程式標籤不會附加至範圍。

如需一般資訊,請參閱 Dataproc Metastore 總覽

Cloud Deploy 推送管道
(區域)
應用程式標籤不會附加至範圍。
Firestore 資料庫
(區域)
  • 流量api/request_count
  • 伺服器錯誤率:回應狀態指出發生錯誤的要求,占要求總數的比例。下列狀態值表示發生錯誤:
    • DEADLINE_EXCEEDED
    • INTERNAL
    • UNAVAILABLE
    • UNIMPLEMENTED
  • P95 延遲時間api/request_latencies
應用程式標籤不會附加至範圍。
Kubernetes CronJob
(區域和可用區)
如要瞭解如何在 GKE 中執行 Cron 工作,請參閱「About CronJobs in GKE」(關於 GKE 中的 CronJob)。
Kubernetes DaemonSet
(區域和可用區)
  • 飽和度container/cpu/core_usage_timecontainer/cpu/request_cores 的比率。
  • 流量伺服器錯誤率P95 延遲時間: 對於在 GKE 上執行的工作負載, 這些信號是從 Prometheus 指標 http_server_request_duration_seconds 擷取, 只有在使用 OpenTelemetry 檢測應用程式時,才能取得這項指標。詳情請參閱「檢測應用程式
Kubernetes Deployment
(區域和可用區)
  • 飽和度container/cpu/core_usage_timecontainer/cpu/request_cores 的比率。
  • 流量伺服器錯誤率P95 延遲時間: 對於在 GKE 上執行的工作負載, 這些信號是從 Prometheus 指標 http_server_request_duration_seconds 擷取, 只有在使用 OpenTelemetry 檢測應用程式時,才能取得這項指標。詳情請參閱「檢測應用程式
Kubernetes StatefulSets
(區域和可用區)
  • 飽和度container/cpu/core_usage_timecontainer/cpu/request_cores 的比率。
  • 流量伺服器錯誤率P95 延遲時間: 對於在 GKE 上執行的工作負載, 這些信號是從 Prometheus 指標 http_server_request_duration_seconds 擷取, 只有在使用 OpenTelemetry 檢測應用程式時,才能取得這項指標。詳情請參閱「檢測應用程式
如要瞭解如何使用 StatefulSet 或部署有狀態的應用程式,請參閱「Google Kubernetes Engine 中的 StatefulSet 簡介」。
第 7 層外部和內部應用程式負載平衡器,適用於 HTTP 或 HTTPS 流量
(全域和區域)
  • 流量:根據記錄要求數量的 Cloud Load Balancing 指標類型,例如 https/request_count。Cloud Load Balancing 的設定會決定實際指標。
  • 伺服器錯誤率:回應狀態為 5xx 的要求數量與要求總數的比率。
  • P95 延遲時間:根據記錄總延遲時間的 Cloud Load Balancing 指標類型,例如 https/total_latencies。Cloud Load Balancing 的設定會決定實際指標。
應用程式負載平衡器只會將轉送規則後端服務整合至 App Hub。應用程式標籤不會附加至範圍。
Memorystore for Redis 叢集
(區域)
應用程式標籤不會附加至記錄項目或 span。
Memorystore for Redis 執行個體
(區域)
應用程式標籤不會附加至指標資料或 span。
Pub/Sub 主題
(全域)
應用程式標籤不會附加至範圍。
Pub/Sub 訂閱項目
(全球)
應用程式標籤不會附加至範圍。
Secret Manager 密鑰
(全域和區域)
應用程式標籤不會附加至範圍。
Spanner 資料庫
(全域和區域)
應用程式標籤不會附加至指標資料或 span。
Spanner 執行個體
(全域和區域)
應用程式標籤不會附加至範圍。