Service Monitoring (Beta 版)

Service Monitoring 支援 Istio、Anthos 服務網格、App Engine 和其他客戶定義的服務。

代為監控現代化應用程式

適用於現代化應用程式的監控工具

現今的應用程式通常由多種服務組成,由數十個到數百個不同的依附元件支援著特定的應用程式或使用案例。 當某個環節出錯,往往看起來像是許多地方都有問題,一時可能難以找到癥結。為針對問題抽絲剝繭,Service Monitoring 透過 Anthos 和 Istio 服務網格技術,提供對監控服務的額外支援。Service Monitoring 亦能監控 App Engine 服務和客戶定義的服務。

設定服務等級目標

設定服務等級目標 (SLO)

有了服務監控功能,您就可以依據「服務等級目標 (SLO)」來設定、監控並警示團隊,讓團隊更能著眼於企業的關鍵事項。由於 Istio (和 App Engine) 的檢測是專斷的,我們可知道服務之間確切的交易次數、錯誤次數和延遲的分布情形。您只需設定可用性與效能目標,系統就會為您自動產生服務水準指標 (SLI)、依時間顯示的目標達成度以及剩餘的「錯誤預算」等圖表。當悖離這些目標時,系統會發出快訊,通知您採取行動修正服務。

服務監控功能

Anthos 服務網格中的服務監控功能

瞭解內部服務的相依性有其難度,服務之間彼此環環相扣的關係和模式可能很複雜,並且隨時變動。Service Monitoring 提供服務圖表,顯示應用程式中的所有服務和服務間的關聯,讓您可以輕易綜觀服務的相依關係。服務拓撲圖也會顯示服務之間的流量、錯誤和延遲狀況,讓您瞭解哪些服務可能會影響其他服務的效能或可用性。另外,服務拓撲圖亦可讓您查看歷來的變化,因此更容易找出問題所在。Service Monitoring 服務圖表可讓您檢視即時服務資料與歷史服務資料以及其相依性,藉此視覺化應用程式並減少根本原因分析與復原所需的時間。

可觀察性人因工程

可觀察性人因工程

Service Monitoring 包含互動式的資訊主頁,您可以透過所有訊號深入瞭解服務的行為,無需在服務等級目標、指標、記錄和快訊中來回切換。您可以查看特定服務專屬的資訊主頁,然後將時間範圍限縮在一定的期間內。在診斷可用性的問題時,您可以細查指標熱視圖、追蹤記錄並且探索記錄。服務資訊主頁提供了一個連貫的介面來協助您縮小檢驗的範圍:您可以先觀察特定服務的警示訊息,然後限縮到特定的時間範圍,再篩選出某一部分的流量,最後找出造成問題的可能原因。這是找出服務問題成因最快的可能方式。

Service Monitoring 使用實務

  • 當應用程式發生問題時,使用 Service Monitoring 服務等級目標進行監控與偵測
  • 使用 Anthos 服務網格中的服務拓撲圖找出服務的相依性,以及最可能導致問題發生的服務
  • 使用服務資訊主頁瀏覽來自有問題服務的各種訊號,並追蹤根本原因
Google Cloud

開始使用

瞭解詳情並著手實作

第一次使用 GCP 嗎?我們提供您 $300 美元的額度,歡迎免費體驗 GCP 產品。

需要進一步協助嗎?

我們的專家會協助您打造合適的解決方案,或是為您找到符合需求的合作夥伴。

本頁所列產品及功能目前仍處於 Alpha 或 Beta 測試階段。如要進一步瞭解產品推出的各個階段,請參閱這個網頁