Eine nichtflüchtige Vertex AI-Ressource ist ein Cluster mit langer Ausführungszeit, den Sie zum Ausführen benutzerdefinierter Trainingsjobs erstellen können. Nach Abschluss eines Trainingsjobs bleibt die nichtflüchtige Ressource verfügbar, um andere Trainingsjobs auszuführen, bis Sie sie löschen. Sie können nichtflüchtige Ressourcen verwenden, um die Verfügbarkeit der Computing-Ressource zu sichern und die Startzeit des Jobs zu reduzieren, die andernfalls für die Erstellung von Computing-Ressourcen erforderlich ist. Nichtflüchtige Ressourcen unterstützen alle VMs und GPUs, die von benutzerdefinierten Trainingsjobs unterstützt werden. Auf dieser Seite wird erläutert, wann eine nichtflüchtige Ressource verwendet werden sollte. Außerdem finden Sie Informationen zur Abrechnung und zu den Kontingenten.
Wann eine nichtflüchtige Ressource verwendet werden sollte
Wir empfehlen in folgenden Szenarien nichtflüchtige Ressourcen:
- Sie möchten die Kapazitätsverfügbarkeit für kritische ML-Arbeitslasten oder während Spitzenzeiten sichern. Im Gegensatz zu benutzerdefinierten Jobs, bei denen der Trainingsdienst die Ressource nach Abschluss des Jobs freigibt, bleibt die nichtflüchtige Ressource verfügbar, bis sie gelöscht wird.
- Sie senden denselben Job mehrmals und können vom Daten- und Image-Caching profitieren, wenn Sie die Jobs in derselben nichtflüchtigen Ressource ausführen.
- Sie führen viele kurzlebige Trainingsjobs aus, bei denen die tatsächliche Trainingszeit kürzer als die Startzeit des Jobs ist.
Weitere Informationen dazu, wann und warum eine persistente Ressource verwendet werden sollte, finden Sie im Blogpost Für Kapazitätszusicherung und schnellere Startzeiten in Vertex AI Training sorgen.
Zahlungsinformationen
Ihnen wird die gesamte Dauer, in der sich eine nichtflüchtige Ressource im Ausführungsmodus befindet, in Rechnung gestellt, unabhängig davon, ob in der nichtflüchtigen Ressource ein Job ausgeführt wird oder nicht. Die einzelnen Instanzen im Pool nichtflüchtiger Ressourcen werden nach Kernstunde abgerechnet. Jobs, die auf einer persistenten Ressource ausgeführt werden, werden nicht separat in Rechnung gestellt. Ihnen wird nur die persistente Ressource in Rechnung gestellt.
Wenn Sie die automatische Skalierung für die persistente Ressource einrichten, zahlen Sie nur für die bereitgestellten Instanzen. Wenn min-replica-count
beispielsweise auf 4
festgelegt ist, werden immer 4
-Instanzen bereitgestellt. Dies ist dann der Mindestbetrag, der Ihnen in Rechnung gestellt wird. Wenn Ihre Arbeitslast zunimmt, kann der Ressourcenpool auf 6
skaliert werden, um die erhöhte Nachfrage zu erfüllen. Anschließend werden Ihnen die 6
bereitgestellten Instanzen in Rechnung gestellt, bis Ihr Ressourcenpool wieder herunterskaliert wird. Verwenden Sie das Autoscaling für Ihre nichtflüchtige Ressource oder löschen Sie sie, wenn Sie sie nicht mehr benötigen, um nicht für inaktive Knoten zu zahlen. Weitere Informationen zu den Preisen finden Sie im Abschnitt Benutzerdefinierte Modelle auf der Vertex AI-Preisseite.
Kontingente
Nichtflüchtige Ressourcen verwenden Ihr Trainingskontingent. Prüfen Sie daher, ob Ihr Kontingent für die Erstellung nichtflüchtiger Ressourcen ausreicht. Weitere Informationen zu Kontingenten finden Sie unter Trainingskontingente und -limits.
Nächste Schritte
- Nichtflüchtige Ressource erstellen und verwenden.
- Trainingsjobs für eine nichtflüchtige Ressource ausführen.
- Informationen zu einer nichtflüchtigen Ressource abrufen.
- Nichtflüchtige Ressource neu starten.
- Nichtflüchtige Ressource löschen.