使用 Google Cloud 服務健康狀態做為備援

本文說明在下列罕見情況下,如何使用 Google Cloud Service Health:Personalized Service Health 本身無法使用或受到中斷影響,或是受影響的產品尚未加入 Personalized Service Health。

Google Cloud Service Health 會提供符合特定條件的持續性大規模事件資訊。Personalized Service Health 一律會為Google Cloud 客戶提供最詳盡的資訊。

2022 年 3 月 24 日前,「服務健康狀態」稱為「狀態資訊主頁」。 Google Cloud Google Cloud

存取 Google Cloud 服務健康狀態

您可以透過下列方式存取 Google Cloud 服務健康狀態:

  • 公開狀態資訊主頁:Google Cloud Service Health
  • 公開 RSS 動態消息
  • Google Cloud 控制台:

    1. 在 Google Cloud 控制台中,依序前往「Support」(支援) >「Cases」(案件) 頁面。

      前往「Cases」(案件) 頁面

    2. 使用控制台工具列上的資源選取器,選取要列出已知問題的資源。

    3. 按一下「已知問題」分頁標籤。

      已知問題也包括次要和範圍有限的事件。您可以將支援案件連結至已知問題,以便定期取得更新消息並與支援人員聯繫。客服案件適用於不屬於事件或需要直接互動的問題。如果您有 Premium、Enhanced 或 Standard 支援服務,可以建立客服案件來回報事件。

如果無法透過先前的資源存取 Google Cloud 服務健康狀態,請使用Google Cloud 平台支援問題表單

支援的 Google Cloud Service Health 事件

在大多數 Google Cloud 事件中,受影響的客戶會直接透過 Google Cloud 控制台中的 Personalized Service Health 收到事件通訊。 如果符合快訊條件,這些事件也會觸發您設定的任何服務健康狀態快訊

全球服務健康狀態團隊會運用多種不同類型的信號來監控產品狀態,並在發生重大問題時更新 Google Cloud 服務健康狀態。如有需要,他們會在事件解決之後發布詳細的事件分析報告。如要瞭解支援團隊和產品工程團隊如何共同解決事件,請參閱事件生命週期

符合下列任一條件的事件會顯示在 Google Cloud 服務健康狀態中:

  • 重大公開事件
  • Personalized Service Health 資訊主頁無法使用時發生的事件

重大事件

Google Cloud 如果事件符合下列所有條件,就會定義為重大事件:

  • 影響範圍廣泛:事件影響全球,或多個區域中,有相當比例的客戶專案受到影響。
  • 嚴重程度高:一或多項產品無法使用或嚴重降級。

萬一發生重大事件,我們會採取緊急行動來解決任何問題。

發生重大事件時,系統會透過資訊主頁說明問題狀態。重大事件在資訊主頁上會標示為「服務中斷」。問題解決後,我們會發布公開事件報告,其中包含導致事件發生的因素詳情,以及我們計畫採取的措施,避免這類事件再次發生。

如果事件範圍較小,我們可能會向客戶提供非公開報告。

「服務健康狀態」 Google Cloud 未列出的問題

Google Cloud 服務健康狀態會提供影響產品和服務的重大事件,包括目前和歷來的狀態資訊。 Google Cloud 如果問題未列在「服務健康狀態」Google Cloud 頁面中,則可能只與您的專案或執行個體有關,或者影響的客戶人數有限。範圍較小的事件可能會顯示在支援入口網站。如果您遇到任何未列在「服務健康狀態」頁面上的問題,請與「服務健康狀態」團隊聯絡。 Google Cloud

如果您已使用個人化服務健康狀態,請檢查該處是否列出問題,判斷專案或執行個體是否受到影響。

如果您使用 Google Cloud 控制台,請在頂端工具列中依序選取 >「提供意見」

以程式輔助方式取用 Google Cloud 服務健康狀態資料

您可以透過下列方式建立整合,以使用「服務健康狀態」 Google Cloud顯示的資料:

  • 透過 RSS 動態消息。
  • 透過 JSON 記錄檔。您可以從公開狀態資訊主頁下載 JSON 檔案的結構定義

    請使用標示為「穩定」的欄位,而非標示為「不穩定」的欄位。 一般來說,ID 欄位會視為「穩定」,而顯示名稱等欄位則視為「不穩定」,可能會在沒有警告的情況下變更。整合外部系統或建構自動化程序時,請使用「穩定」欄位。

    如要以程式輔助方式找出影響特定產品組合的事件,請使用產品 ID (affected_products>id),而非顯示名稱。如要瞭解產品 ID 和產品名稱之間的對應關係,請參閱產品目錄

    產品 ID 提供穩定的欄位做為鍵,同時允許產品的顯示名稱變更。以程式輔助方式找出影響一組產品的事件時,請參照產品 ID。

RSS 動態饋給和 JSON 記錄檔會提供事件狀態資訊,例如:

  • 事件影響的產品和地點
  • 事件開始和結束時間
  • 整體嚴重程度
  • 事件更新,說明事件隨時間的變化,包括狀態和當時受影響的地點

根據先前的 Google Cloud 服務健康狀態實作項目進行整合

在 RSS 動態消息和 JSON 檔案中,區域狀態資訊是除了先前發布的資訊外,新增的資訊。先前發布的資訊是在推出區域狀態報告和「Google Cloud 服務健康狀態」名稱變更前發布。因此,我們預期現有的整合功能會繼續運作。不過,如要透過整合服務使用區域狀態資訊,則必須修改整合服務。

以下詳細說明區域資訊在 RSS 動態消息和 JSON 檔案中的顯示方式:

  • RSS 動態消息

    區域狀態資訊是動態饋給資訊的新增內容,在推出區域化狀態前,動態饋給資訊中並未提供這類資訊。系統會將所有回報受影響的位置附加至 RSS 訊息。

  • JSON 檔案

    在發布區域狀態更新之前, Google Cloud 會發布一系列事件,每個事件都包含受影響的產品清單,以及每個產品的狀態更新清單 (如有)。這些狀態更新包含結構化或非結構化字串欄位,其中可能含有或不含位置資訊。

    現在, Google Cloud 會像之前一樣發布事件串流。 不過,每個事件的狀態更新都會包含下列新欄位:

    • updates.affected_locations:包含更新發布時受影響地點的結構化清單。每個更新記錄和 most_recent_update 記錄都包含這個欄位。
    • currently_affected_locations:包含受事件影響的最新位置資訊。與 updates.affected_locations 不同,這個清單會在事件解決後變成空白 (也就是 end 設為非空白值時)。
    • previously_affected_locations:包含先前在事件期間受到影響,但目前未受影響的位置清單。隨著事件進展,部分地區的服務中斷問題可能會解決。這些地點仍會保留在 previously_affected_locations field 中。事件解決後 (也就是 end 設為非空白值時),這個欄位會列出事件期間受影響的所有位置。

查看過往產品中斷和故障的資訊

Google Cloud 服務健康狀態最多會保留五年內產品的服務中斷和停止運作記錄。 Google Cloud 資訊主頁會顯示產品目前的狀態 (依語言代碼)。如要查看過去一年內產品中斷和故障的相關資訊,請按一下 「查看事件記錄」。如要查看產品過去五年的服務中斷記錄,請按一下該產品的「查看更多」圖示

查看區域化狀態資訊

Google Cloud 服務健康狀態會顯示所有產品的狀態,並依區域和全球地區整理。 Google Cloud如要查看多地區的狀態,請選取特定地區的分頁。