GKE Volume Populator


Mit dem GKE-Volume-Populator können Sie das Vorabladen von Daten aus Cloud Storage-Buckets in Ziel-PersistentVolumeClaims (PVCs) während der dynamischen Bereitstellung automatisieren und optimieren.

Funktionsweise von GKE Volume Populator

GKE Volume Populator basiert auf dem Kubernetes Volume Populator-Kernkonzept. Anstatt ein leeres Volume bereitzustellen, kann ein PVC mit dem GKE Volume Populator auf eine benutzerdefinierte GCPDataSource-Ressource verweisen. In dieser benutzerdefinierten Ressource werden der Cloud Storage-Quell-Bucket und die erforderlichen Anmeldedaten angegeben.

Wenn Sie einen PVC mit einem dataSourceRef erstellen, der auf eine GCPDataSource-Ressource verweist, initiiert der GKE-Volume-Populator die Datenübertragung. Dabei werden Daten aus dem angegebenen Cloud Storage-Bucket-URI in das zugrunde liegende persistente Speichervolume kopiert, bevor das Volume für Ihre Pods verfügbar gemacht wird.

Dadurch müssen Sie weniger manuelle Datenübertragungsskripts oder CLI-Befehle verwenden und die Übertragung großer Datasets auf persistente Volumes wird automatisiert. GKE Volume Populator unterstützt Datenübertragungen zwischen den folgenden Quell- und Zieltypen:

GKE Volume Populator ist eine von GKE verwaltete Komponente, die standardmäßig sowohl in Autopilot- als auch in Standard-Clustern aktiviert ist. Die Interaktion mit GKE Volume Populator erfolgt hauptsächlich über die gcloud CLI und die kubectl-CLI.

Architektur

Das folgende Diagramm zeigt, wie Daten vom Quellspeicher zum Zielspeicher fließen und wie das PersistentVolume für den Zielspeicher mit GKE Volume Populator erstellt wird.

  1. Sie erstellen einen PVC, der auf eine benutzerdefinierte GCPDataSource-Ressource verweist.
  2. Der GKE Volume Populator erkennt das PVC und initiiert einen Datenübertragungsjob.
  3. Der Übertragungsjob wird in einem vorhandenen Knotenpool ausgeführt. Wenn die automatische Knotenbereitstellung aktiviert ist, wird ein neuer Knotenpool erstellt.
  4. Mit dem Übertragungsjob werden Daten aus dem in der GCPDataSource-Ressource angegebenen Cloud Storage-Bucket in das Zielspeichervolume kopiert.
  5. Nach Abschluss der Übertragung wird der PVC an das Zielspeichervolume gebunden, sodass die Daten für den Arbeitslast-Pod verfügbar sind.

Datenübertragung vom Quelldatenspeicher und Erstellung von PV für den Zielspeicher mit dem GKE Volume Populator

Hauptvorteile

Der GKE Volume Populator bietet mehrere Vorteile:

  • Automatisierte Datenübertragung: Beim Bereitstellen von Volumes können Daten aus Cloud Storage automatisch übertragen werden. Das trägt dazu bei, den Betriebsaufwand zu senken.
  • Nahtlose Datenportabilität: Sie können Daten aus dem Objektspeicher in leistungsstarke Datei- (Parallelstore) oder Blockspeichersysteme (Hyperdisk) verschieben, um den Preis oder die Leistung entsprechend den Anforderungen Ihrer Arbeitslast zu optimieren.
  • Vereinfachte Workflows: Sie benötigen weniger separate Jobs zum Laden von Daten oder manuellen Aufwand zum Vorbereiten von persistenten Volumes.
  • Integration mit Identity and Access Management (IAM): Verwenden Sie die IAM-basierte Authentifizierung über Workload Identity Federation for GKE, um für eine sichere Datenübertragung mit detaillierter Zugriffssteuerung zu sorgen.
  • Beschleunigte KI-/ML-Arbeitslasten: Große Datasets, Modelle und Gewichte können schnell direkt in den Hochleistungsspeicher vorab geladen werden, um Trainings- und Inferenzaufgaben zu beschleunigen.

Anwendungsfälle für GKE Volume Populator

Mit GKE Volume Populator können Sie große Trainingsdatasets für KI/ML laden. Angenommen, Sie haben ein Dataset mit mehreren Terabyte zum Trainieren eines Large Language Model (LLM), das in einem Cloud Storage-Bucket gespeichert ist. Ihr Trainingsjob wird in GKE ausgeführt und erfordert eine hohe E/A-Leistung. Anstatt die Daten manuell zu kopieren, können Sie mit dem GKE Volume Populator automatisch ein Parallelstore- oder Hyperdisk ML-Volume bereitstellen und es mit dem Dataset aus Cloud Storage füllen, wenn der PVC erstellt wird. Dieser automatisierte Prozess sorgt dafür, dass Ihre Trainings-Pods sofortigen Hochgeschwindigkeitszugriff auf die Daten haben.

Hier sind einige weitere Beispiele für die Verwendung des GKE Volume Populator:

  • Vorab-Caching von KI-/ML-Modellgewichtungen und ‑Assets aus Cloud Storage in Hyperdisk ML-Volumes, um die Modellladezeiten für die Inferenzbereitstellung zu verkürzen.
  • Daten aus Cloud Storage in nichtflüchtige Volumes für zustandsorientierte Anwendungen migrieren, die einen leistungsstarken Festplattenzugriff erfordern.

Nächste Schritte