Zusammenfassung: Nichtflüchtige Ressource

Eine nichtflüchtige Vertex AI-Ressource ist ein langlebiger Cluster, den Sie zum Ausführen benutzerdefinierter Trainingsjobs erstellen können. Nach Abschluss eines Trainingsjobs bleibt die nichtflüchtige Ressource so lange verfügbar, bis Sie sie löschen, um andere Trainingsjobs auszuführen. Sie können nichtflüchtige Ressourcen verwenden, um die Verfügbarkeit der Computing-Ressource zu sichern und die Startzeit des Jobs zu reduzieren, die andernfalls für die Erstellung von Computing-Ressourcen erforderlich ist. Nichtflüchtige Ressourcen unterstützen alle VMs und GPUs, die von benutzerdefinierten Trainingsjobs unterstützt werden. Auf dieser Seite wird erläutert, wann Sie eine persistente Ressource verwenden sollten, und Sie erhalten Informationen zu Abrechnung und Kontingent.

Wann eine nichtflüchtige Ressource verwendet werden sollte

Wir empfehlen in folgenden Szenarien nichtflüchtige Ressourcen:

  • Sie möchten die Kapazitätsverfügbarkeit für kritische ML-Arbeitslasten oder während Spitzenzeiten sichern. Im Gegensatz zu benutzerdefinierten Jobs, bei denen der Trainingsdienst die Ressource nach Abschluss des Jobs freigibt, bleiben nichtflüchtige Ressourcen bis zum Löschen verfügbar.
  • Sie reichen denselben Job mehrmals ein und können von Daten- und Bild-Caching profitieren, indem Sie die Jobs auf derselben persistenten Ressource ausführen.
  • Sie führen viele kurzlebige Trainingsjobs aus, bei denen die tatsächliche Trainingszeit kürzer als die Startzeit des Jobs ist.

Weitere Informationen dazu, wann und warum eine persistente Ressource verwendet werden sollte, finden Sie im Blogpost Für Kapazitätszusicherung und schnellere Startzeiten in Vertex AI Training sorgen.

Zahlungsinformationen

Ihnen wird die gesamte Dauer, in der sich eine nichtflüchtige Ressource im Ausführungsmodus befindet, in Rechnung gestellt, unabhängig davon, ob in der nichtflüchtigen Ressource ein Job ausgeführt wird oder nicht. Die einzelnen Instanzen im Pool nichtflüchtiger Ressourcen werden nach Kernstunde abgerechnet. Jobs, die auf einer persistenten Ressource ausgeführt werden, werden nicht separat in Rechnung gestellt. Ihnen wird nur die persistente Ressource in Rechnung gestellt.

Wenn Sie das Autoscaling für Ihre persistente Ressource einrichten, zahlen Sie nur für die bereitgestellten Instanzen. Wenn min-replica-count beispielsweise auf 4 festgelegt ist, werden immer 4-Instanzen bereitgestellt. Dies ist dann der Mindestbetrag, der Ihnen in Rechnung gestellt wird. Wenn Ihre Arbeitslast zunimmt, wird der Ressourcenpool möglicherweise auf 6 skaliert, um der gestiegenen Nachfrage gerecht zu werden. Anschließend werden Ihnen die 6 bereitgestellten Instanzen in Rechnung gestellt, bis Ihr Ressourcenpool wieder verkleinert wird. Verwenden Sie das Autoscaling für Ihre nichtflüchtige Ressource oder löschen Sie sie, wenn Sie sie nicht mehr benötigen, um nicht für inaktive Knoten zu zahlen. Weitere Informationen zu den Preisen finden Sie im Abschnitt Benutzerdefinierte Modelle auf der Vertex AI-Preisseite.

Kontingente

Für nichtflüchtige Ressourcen wird Ihr Trainingskontingent verwendet. Prüfen Sie daher, ob Sie genügend Kontingent für die Erstellung nichtflüchtiger Ressourcen haben. Weitere Informationen zu Kontingenten finden Sie unter Trainingskontingente und -limits.

Nächste Schritte