本文件說明如何使用 Cloud SQL 的 AI 輔助功能,排解 Cloud SQL 中資料庫負載過高的情形。您可以使用 Cloud SQL 和 Gemini Cloud Assist 的 AI 輔助功能,進行調查、分析、取得建議,並最終實作這些建議,以便在 Cloud SQL 中改善查詢。
您可以存取 Google Cloud 控制台中的「查詢深入分析」資訊主頁,分析資料庫並排解系統發生資料庫負載高於平均值的事件。Cloud SQL 會使用所選時間範圍前 24 小時的資料,計算資料庫的預期負載。您可以查看負載事件增加的原因,並分析成效降低的證據。最後,Cloud SQL 會提供最佳化資料庫的最佳化建議,以提升效能。
事前準備
如要透過 AI 輔助功能排解資料庫負載過高的情形,請執行下列操作:
必要角色和權限
如要瞭解使用 AI 協助排解資料庫負載過高的相關角色和權限,請參閱「使用 AI 進行觀察和疑難排解」一文。
使用 AI 輔助功能
如要使用 AI 協助功能排解資料庫負載過高的情況,請前往 Google Cloud 控制台的「執行個體總覽」頁面或「查詢深入分析」資訊主頁。
執行個體總覽頁面
如要透過 AI 協助功能在「執行個體總覽」頁面中排解資料庫負載過高的情況,請按照下列步驟操作:
-
前往 Google Cloud 控制台的「Cloud SQL 執行個體」頁面。
- 如要開啟執行個體的「總覽」頁面,請按一下執行個體名稱。
- 在「總覽」頁面的「圖表」選單中,選取資料庫的指標。您可以選取任何指標。
- 選用:如要選取特定分析時間範圍,請使用「時間範圍」篩選器,選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。
- 按一下「分析執行個體效能」,即可開始透過 AI 協助排除資料庫負載過高的情況。這會產生「分析資料庫負載」頁面。

您可以放大圖表的特定區域,找出要分析的高負載區域。舉例來說,負載量高的區域可能會顯示 CPU 使用率接近 100%。如要放大圖表,請按一下並選取圖表的一部分。

查詢洞察資訊主頁
請按照下列步驟,在查詢深入分析資訊主頁中使用 AI 協助功能,排解資料庫負載過高的情況:
-
前往 Google Cloud 控制台的「Cloud SQL 執行個體」頁面。
- 如要開啟執行個體的「總覽」頁面,請按一下執行個體名稱。
- 按一下「查詢洞察」,開啟「查詢洞察」資訊主頁。
- 選用:使用「時間範圍」篩選器,選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。
- 在「資料庫負載圖表」中,按一下「分析執行個體效能」,即可開始透過 AI 協助排除資料庫負載過高的情況。系統會產生「分析資料庫負載」頁面。

您可以將圖表縮放至特定區域,以便查看哪些區域的資料庫負載較高,進而縮短查詢執行時間。如要放大圖表,請按一下並選取圖表的部分區域。
分析資料庫負載過高
您可以使用 AI 協助功能,分析及排解資料庫負載的詳細資料。
在「Analyzing database load」(分析資料庫負載)頁面中,您可以查看 Cloud SQL 執行個體的下列詳細資料:
- 分析時間範圍
- CPU 使用率 (p99)
- 記憶體使用率 (p99)
Cloud SQL 會顯示 MySQL 查詢圖表,您可以查看所選時間範圍內的查詢活動。您可以查看特定時間範圍內的活動是否突然激增。
資料分析時間範圍
Cloud SQL 會分析資料庫在您在資料庫負載圖表中選取的時間範圍,這項資訊來自「查詢深入分析」資訊主頁或「執行個體總覽」頁面。如果選取的時間範圍少於 24 小時,Cloud SQL 會分析整個時間範圍。如果選取的時間範圍超過 24 小時,Cloud SQL 只會選取該時間範圍內的最後 24 小時進行分析。
為計算資料庫的基準成效分析,Cloud SQL 會在分析時間範圍內加入 24 小時的基準時間範圍。如果所選時間範圍發生在星期一以外的日期,Cloud SQL 會使用所選時間範圍前24 小時的基線時間範圍。如果所選時間範圍發生在星期一,Cloud SQL 會使用前 7 天的基準時間範圍,與所選時間範圍相比較。
情況
Cloud SQL 啟動分析時,會檢查下列重要指標是否有重大變化:
- 每秒查詢次數 (QPS)
- CPU
- 記憶體
- 磁碟 I/O
Cloud SQL 會比較資料庫在分析時間範圍內的效能資料,如果 Cloud SQL 偵測到關鍵指標的閾值出現重大變化,就會指出資料庫可能出現問題。這項狀況可能說明資料庫在所選時間範圍內負荷過高的原因。
舉例來說,您可能會看到多種情況,說明資料庫為何出現高負載:
- 大量執行緒並行
- CPU 使用率大幅變動
- 磁碟 IOPS 大幅變動
- QPS 大幅變動
證據
針對每種情況,Cloud SQL 都會提供證據清單,以支持相關發現。Cloud SQL 會根據從執行個體收集到的指標提供證據。
每種情況都會提供輔助證據,用於偵測系統效能異常。當系統效能超出特定門檻或符合特定時間限制條件時,Cloud SQL 就會偵測到異常情況。Cloud SQL 會為每種情況定義這些門檻或條件。
為了證明偵測到重要指標的大幅變化,您可能會看到下列證據:
- 總 QPS:平均值從 18,534.22 變更為 37,619.86,第 20 百分位數從 3.55 變更為 5.45,第 80 百分位數從 5.62 變更為 112,050.8。
- 讀取 QPS:平均值從 1,802.98 變更為 3,657.93,第 20 百分位數從 1.17 變更為 2.1,第 80 百分位數從 2.12 變更為 10,908.8。
- 寫入 QPS:平均值從 1,751.61 變更為 3,553.48,第 20 百分位數從 0.2 變更為 0.2,第 80 百分位數從 0.2 變更為 10,600.13。
- CPU 用量變化:系統偵測到 CPU 使用率大幅變動。平均變動幅度為 183.85%。第 80 個百分位數變動幅度為 2,630.49%。第 20 個百分位數變動幅度為 6.75%。
- 磁碟 IOPS:系統偵測到磁碟 IOPS 有大幅變動。平均變動幅度為 173.39%。第 80 個百分位數變動幅度為 20,832.44%。第 20 個百分位數變動幅度為 1.88%。
- 執行中的執行緒:執行中的執行緒數量增加 3,166.67%。
如要查看分析期間擷取的證據,請按一下各個情況。證據會顯示在窗格中,位於相應情況旁邊。
建議
根據分析的所有情況,Cloud SQL 會提供一或多項可行建議,協助您解決資料庫負載過高的相關問題。Cloud SQL 會提供建議,並附上成本效益分析,讓您在決定是否採用建議前,能先參考相關資訊。
在某些情況下,系統可能不會根據分析資料提供建議。
舉例來說,您可能會收到下列最佳化建議:
查看並行工作負載:使用查詢洞察分析過去和目前的工作負載。
- CPU 使用率提高時,請留意耗用最多資源的查詢,找出潛在的效率問題。
- CPU 使用率降低時,則請查看等待事件,找出潛在的爭用情形。
查看 I/O 相關的資料庫旗標:如果修改資料庫旗標,磁碟 IOPS 可能會有波動。
某些可能會影響 IOPS 的重要旗標包括但不限於:
innodb_buffer_pool_size
innodb_redo_log_capacity
innodb_io_capacity
innodb_flush_neighbors
innodb_lru_scan_depth
temptable_max_ram
請查看這些設定,找出 I/O 變化的潛在原因。
查看其他 I/O 指標:如要進一步瞭解 IOPS 的變化,請分析下列 系統洞察指標:
Disk read/write operations
Read/write InnoDB pages
此外,請在 Metrics Explorer 中查看其他 InnoDB I/O 指標。
如果您想繼續進行疑難排解,或需要進一步的系統效能協助,也可以開啟 Gemini Cloud Assist。詳情請參閱「使用 AI 協助功能觀察及排解問題」。