X4 是一系列專門的 Compute Engine 裸機機器類型,專門用於執行多 TB 的 SAP HANA 工作負載。如要定期更新軟體和韌體,就必須進行 X4 維護。這項維護作業可確保 X4 執行個體的效能最佳化、安全可靠。
與其他 Compute Engine 機器類型不同,X4 不支援在維護事件期間進行即時遷移程序。也就是說,如果是預定的主機維護事件,Google 就必須停止並更新 X4 執行個體,因此這些事件對 SAP HANA 工作負載至關重要。
維護生命週期
我們會在預定主機維護事件開始前 60 天,提前通知你。您可以在這個時間範圍內觸發主機維護事件。如果您未在預定開始日期和時間前觸發主機維護事件,Google 會在預定開始日期、預定開始時間或該時間過後幾分鐘自動觸發該事件。
預定的主機維護事件通常會持續 4 小時,在此期間,主機上執行的執行個體會停止及重新啟動。
X4 執行個體的預定主機維護事件頻率約為 90 天。也就是說,一旦預定維護作業完成,下次預定維護作業至少會在 90 天後發生。不過,系統仍可能會根據問題的嚴重性,進行非預定的維護作業。
以下各節說明兩種觸發預定主機維護事件的方式:由您手動觸發或由 Google 自動觸發。
您手動觸發的維護事件
以下步驟說明在觸發預定房源維護事件的情況下,會發生的動作順序範例:
- 在第 0 天,您會部署 X4 執行個體。
在第 36 天,您會收到 Google 發送的預定主機維護事件通知。
如果您使用
gcloud compute instances describe
指令查詢 X4 執行個體的說明,回應中就會顯示"maintenanceStatus": "PENDING"
。在第 36 天至第 96 天之間 (60 天的提前通知期間),您可以選擇觸發主機維護事件。
在第 80 天,您會觸發 X4 執行個體的主機維護事件。例如,您執行
gcloud compute instances perform-maintenance
指令。Google 會關閉 X4 執行個體進行維護。維護作業通常會持續 4 小時。
您可以使用
gcloud compute instances describe
指令查看執行個體的maintenanceStatus
欄位是否設為ONGOING
。維護作業完成後,Google 會重新啟動您的 X4 執行個體。
您最快會在本次維護事件結束後的 30 天內,收到下次預定房東維護事件的通知。在這個範例中,Google 會在第 120 天傳送通知,告知您下次預定的主機維護事件。
下圖說明上述步驟:
由 Google 自動觸發的維護事件
以下步驟說明在 Google 觸發預定的主機維護事件時,會發生的動作順序範例。只有在您未在收到活動通知的日期和活動預定開始日期之間的 60 天預先通知期間觸發活動時,Google 才會在活動的預定開始日期觸發主機維護事件。
- 在第 0 天,您部署 X4 執行個體。
在第 45 天,您會收到 Google 發送的通知,說明預定的代管服務器維護事件。
如果您使用
gcloud compute instances describe
指令查詢 X4 執行個體的說明,回應中就會顯示"maintenanceStatus": "PENDING"
。在第 105 天 (即主機維護事件的預定開始日期),Google 會觸發主機維護事件。維護作業通常會在預定開始時間或該時間過後幾分鐘開始。
如果您使用
gcloud compute instances describe
指令查詢 X4 執行個體的說明,回應中就會顯示"maintenanceStatus": "ONGOING"
。Google 會關閉 X4 執行個體進行維護。維護期間通常為 4 小時。
維護活動完成後,Google 會重新啟動您的 X4 執行個體。
您最快會在本次維護事件結束後的 30 天內,收到下次預定房東維護事件的通知。在這個範例中,Google 會在第 150 天傳送通知,告知您下次預定的主機維護事件。
下圖說明上述步驟:
查看維護事件相關資訊
對於每個預定的主機維護事件,Google 都會提前 60 天通知您。X4 的所有預定主機維護事件都歸類為已排定維護作業。
如要查看預定主機維護事件的相關資訊,請按照下列步驟操作:
- 使用 Google Cloud CLI 查詢 X4 執行個體
- 使用 REST API 查詢 X4 執行個體
- 查詢 X4 執行個體的中繼資料伺服器
- 查看 Cloud Logging 中的記錄檔
如要瞭解如何執行這些動作 (包括必要的 IAM 角色和權限),請參閱「監控及規劃主機維護事件」一文。
使用這些選項時,您可以使用 machineType
中繼資料欄位篩選 X4 執行個體,該欄位會顯示執行個體的機器類型。以下是 X4 執行個體資訊在「Logs Explorer」中顯示的範例:
metadata: { canReschedule: true latestWindowStartTime: "2025-07-21T00:00:01Z" machineType: "x4-megamem-1920-metal" maintenanceStatus: "PENDING" type: "SCHEDULED" windowEndTime: "2025-07-21T04:00:00Z" windowStartTime: "2025-07-21T00:00:00Z" } methodName: "compute.instances.upcomingMaintenance"
模擬維護事件
如要觀察預定主機維護事件的端對端程序,或測試您可能已實作的任何整合或自動化功能,您可以使用 gcloud CLI 或 REST API,為 X4 執行個體模擬主機維護事件。
當您嘗試在 X4 執行個體上模擬主機維護事件時,由於 X4 執行個體的 onHostMaintenance
屬性已固定為 TERMINATE
值,因此執行個體會終止並重新啟動。詳情請參閱「可用的主機維護屬性」。
如要瞭解如何模擬預定的維護事件,請參閱「模擬要終止的 Compute Engine 執行個體的主機維護作業」。
觸發維護事件
在 60 天預先通知期結束前,您隨時可以觸發預定的主機維護事件。您可以使用 gcloud CLI 或 REST API 執行這項操作。
如要觸發主機維護事件,請勿使用可停止及啟動 Compute Engine 執行個體的 gcloud CLI 或 REST API 資源。
如要瞭解如何觸發已排定的主機維護事件,或如何檢查其狀態,請參閱「手動啟動主機維護事件」。
維護事件不再適用
在極少發生的情況下,如果發生非預期的維護問題,而影響到 X4 執行個體,Google Cloud 會自動將執行個體遷移至其他正常主機。同樣地,如果您在 60 天的提前通知期間手動停止及啟動 X4 執行個體,系統會在可用的主機上佈建執行個體。
Google Cloud 旨在維持最新的 X4 機器機群。如果 X4 執行個體的新主機執行的是最新韌體,則先前排定的主機維護事件將不再適用於 X4 執行個體。在這種情況下,系統會自動解決主機維護事件,可能可縮短 SAP HANA 工作負載的停機時間。
驗證維護事件是否完成
如要確認 Compute Engine X4 執行個體的預定主機維護事件是否順利完成,您可以採取下列做法:
使用 gcloud CLI 或 REST API 查詢執行個體。回應中不會包含
upcomingMaintenance
欄位。如要瞭解如何查詢執行個體,請參閱「檢查執行個體是否有維護事件通知」。
在 Cloud Logging 中查看執行個體的記錄。您會看到類似以下的記錄訊息:
Maintenance window is completed for this instance. All maintenance notifications on the instance has been removed.
如要瞭解如何搜尋執行個體的記錄,請參閱「檢查 Cloud Logging 是否有維護事件通知」。
監控維護事件
為 Compute Engine X4 執行個體的預定主機維護事件設定監控功能,有助於讓團隊掌握目前事件的狀態,以及即將發生的事件。
您可以透過下列方式監控主機維護事件:
由於每個維護事件都會向 Cloud Logging 傳送多則訊息,因此您可以設定以記錄為基礎的警告政策,搜尋特定維護事件通知,並使用通知管道傳送警報。
您可以使用
machineType
中繼資料欄位篩選記錄,該欄位包含與 X4 執行個體相對應的機器類型,例如x4-megamem-960-metal
、x4-megamem-1440-metal
或x4-megamem-1920-metal
。如要瞭解如何設定快訊,以便在預定的代管服務器維護事件發生時收到通知,請參閱「設定代管服務器維護通知的快訊」。
匯入
maintenance-system-events.json
範本,在 Google Cloud 專案中建立監控資訊主頁。這個資訊主頁範本可在 GoogleCloudPlatform/sapagent GitHub 存放區中取得。如要瞭解如何透過上傳 JSON 檔案建立監控資訊主頁,請參閱「安裝資訊主頁範本」一文。