關於 GKE Volume Populator


Google Kubernetes Engine (GKE) Volume Populator 可協助您自動化及簡化程序,在動態佈建期間,將資料從 Cloud Storage 儲存空間預先載入至目的地 PersistentVolumeClaims (PVC)

GKE Volume Populator 的運作方式

GKE Volume Populator 採用核心 Kubernetes Volume Populator 概念。GKE Volume Populator 可讓 PVC 參照 GCPDataSource 自訂資源,不必佈建空白磁碟區。這個自訂資源會指定來源 Cloud Storage 值區和必要憑證。

使用dataSourceRef指向 GCPDataSource 資源的 PVC 時,GKE Volume Populator 會啟動資料轉移作業。這個程序會先將指定 Cloud Storage bucket URI 中的資料複製到基礎的永久儲存空間磁碟區,再將磁碟區提供給 Pod 使用。

這個程序可減少使用手動資料轉移指令碼或 CLI 指令的需求,並自動將大型資料集轉移至永久磁碟區。GKE Volume Populator 支援在下列來源和目的地類型之間轉移資料:

GKE Volume Populator 是 GKE 管理的元件,Autopilot 和 Standard 叢集預設都會啟用。您主要透過 gcloud CLIkubectl CLI 與 GKE Volume Populator 互動。

架構

下圖顯示資料如何從來源儲存空間流向目的地儲存空間,以及如何使用 GKE Volume Populator 建立目的地儲存空間的 PersistentVolume

  1. 您建立的 PVC 會參照 GCPDataSource 自訂資源。
  2. GKE Volume Populator 會偵測 PVC,並啟動資料移轉工作。
  3. 轉移作業會在現有節點集區上執行,如果啟用節點自動佈建功能,系統會建立新的節點集區。
  4. 轉移工作會將 GCPDataSource 資源中指定的 Cloud Storage bucket 資料複製到目的地儲存空間磁碟區。
  5. 轉移完成後,PVC 會繫結至目的地儲存空間磁碟區,讓工作負載 Pod 可存取資料。

使用 GKE Volume Populator 從來源資料儲存空間轉移資料,並為目的地儲存空間建立 PV

主要優點

GKE Volume Populator 提供下列優點:

  • 自動填入資料:在佈建期間,自動從 Cloud Storage 填入磁碟區資料,有助於減輕作業負擔。
  • 資料可攜性無縫轉移:將資料從物件儲存空間移至高效能檔案 (Parallelstore) 或區塊儲存空間 (Hyperdisk) 系統,根據工作負載需求調整價格或效能。
  • 簡化工作流程:減少個別資料載入作業的需求,或手動介入準備持續性磁碟區。
  • 整合 Identity and Access Management (IAM):透過 Workload Identity Federation for GKE 使用 IAM 型驗證,確保資料傳輸安全無虞,並提供精細的存取權控管。
  • 加速 AI/機器學習工作負載:將大型資料集、模型和權重直接預先載入高效能儲存空間,加快訓練和推論作業。

GKE Volume Populator 的用途

您可以使用 GKE Volume Populator,為 AI/ML 載入大型訓練資料集。假設您有一個多 TB 的資料集,用於訓練儲存在 Cloud Storage 值區中的大型語言模型 (LLM)。您的訓練作業會在 GKE 上執行,且需要高 I/O 效能。您可以使用 GKE Volume Populator 自動佈建 ParallelstoreHyperdisk ML 磁碟區,並在建立 PVC 時,從 Cloud Storage 填入資料集,不必手動複製資料。這項自動化程序可確保訓練 Pod 立即以高速存取資料。

以下列舉更多可使用 GKE Volume Populator 的範例:

  • 將 Cloud Storage 中的 AI/機器學習模型權重和資產預先快取到 Hyperdisk ML 磁碟區,加快推論服務的模型載入時間。
  • 將資料從 Cloud Storage 遷移至永久磁碟,供需要高效能磁碟存取的有狀態應用程式使用。

後續步驟