本頁面由 Cloud Translation API 翻譯而成。

Pub/Sub 到 BigQuery 最佳做法

本頁說明如何將從 Pub/Sub 讀取資料並寫入 BigQuery 的 Dataflow 管道最佳化。視使用情況而定，下列建議可能有助於提升成效。

管道積壓工作的初步解決方案

如果「Pub/Sub 至 BigQuery」管道的待處理工作不斷增加，且無法處理傳入的訊息，您可以立即採取下列步驟：

延長 Pub/Sub 確認期限：針對相關聯的 Pub/Sub 訂閱項目，延長確認期限，使其略長於預期的訊息處理時間上限。這樣可避免系統在訊息處理期間過早重新傳送訊息。
擴充工作站：如果未確認的訊息數量和訂閱項目待處理事項快速增加，管道的處理容量可能不足。增加 Dataflow 工作站數量，以處理大量訊息。
啟用指數輪詢：啟用指數輪詢，改善管道處理暫時性問題重試的方式，提高管道的穩定性。

為維持效能和穩定性，建議進行下列架構和程式碼變更：

減少對 BigQuery 的 getTable 呼叫次數：過多的 getTable 方法呼叫可能會導致速率限制和效能瓶頸。如要解決這個問題，請採取下列做法：
- 在工作人員記憶體中快取資料表存在資訊，避免重複呼叫相同資料表。
- 批次呼叫，以每個套裝組合為單位，而非每個個別元素。getTable
- 重構管道程式碼，不必為每則訊息檢查資料表是否存在。
使用 BigQuery Storage Write API：對於寫入 BigQuery 的串流管道，請從標準串流插入作業遷移至 Storage Write API。Storage Write API 的效能較佳，配額也大幅提高。
針對高基數工作使用舊版 Dataflow 執行器： 對於處理大量不重複鍵 (高基數) 的工作，舊版 Dataflow 執行器的效能可能優於 Runner v2，除非需要跨語言轉換。
最佳化鍵空間：當管道處理數百萬個有效鍵時，效能可能會降低。調整管道的邏輯，在較小且更容易管理的主要空間中執行工作。

適當的資源分配和設定對管道健康狀態至關重要：

主動管理配額：監控配額，並在擴充事件期間，要求提高可能達到的配額。舉例來說，請考量下列縮放事件：
- 如果對 TableService.getTable 或 tabledata.insertAll 方法的呼叫率過高，可能會超過每秒查詢次數 (QPS) 上限。如要進一步瞭解限制，以及如何申請更多配額，請參閱「BigQuery 配額與限制」。
- 使用中的 IP 位址和 CPU 的 Compute Engine 配額可能會超過上限。如要進一步瞭解限制，以及如何要求提高配額，請參閱 Compute Engine 配額和限制總覽。
最佳化工作人員設定：為避免記憶體不足 (OOM) 錯誤並提升穩定性：
- 使用記憶體較大的工作站機器類型。
- 減少每個工作站的執行緒數量。
- 設定較高的工作人員數量，更平均地分配工作負載，並減少頻繁自動調度資源事件對效能的影響。