Reservierungen mit Vertex AI Workbench-Instanzen verwenden
Um sicherzustellen, dass VM-Ressourcen verfügbar sind, wenn Ihre Vertex Ai Workbench-Instanzen sie benötigen, können Sie Compute Engine-Reservierungen verwenden. Reservierungen bieten ein hohes Maß an Sicherheit beim Beschaffen von Kapazitäten für zonale Ressourcen von Compute Engine.
Beschränkungen und Anforderungen
Alle Einschränkungen von Compute Engine-Reservierungen gelten, wenn Vertex AI Workbench-Instanzen Reservierungen aufnehmen. Siehe Funktionsweise von Reservierungen.
Wenn Sie Reservierungen mit Vertex AI Workbench-Instanzen verwenden, gelten außerdem die folgenden Einschränkungen und Anforderungen:
Reservierungen für Vertex AI Workbench-Instanzen befinden sich in der privaten Vorschau. Informationen zum Anfordern des Zugriffs finden Sie auf der Seite Zugriffsanforderung.
Rabatte für zugesicherte Nutzung gelten nicht.
Die Verwendung von Reservierungen mit Vertex AI Workbench ist nur über die Notebooks API verfügbar. Die Verwendung von Reservierungen mit Vertex AI Workbench über die Google Cloud Console wird nicht unterstützt.
Vorbereitung
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihrem Nutzerkonto die folgenden IAM-Rollen für das Projekt zuzuweisen, damit Ihr Nutzerkonto die erforderlichen Berechtigungen zur Verwendung von Reservierungen mit Vertex AI Workbench-Instanzen hat:
-
Compute Admin (
roles/compute.admin
) -
Notebooks-Administrator (
roles/notebooks.admin
)
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Ihr Administrator kann Ihrem Nutzerkonto möglicherweise auch die erforderlichen Berechtigungen über benutzerdefinierte Rollen oder andere vordefinierte Rollen erteilen.
Reservierung erstellen
Erstellen Sie eine Compute Engine-Reservierung. Es kann sich um eine Reservierung für ein einzelnes Projekt oder eine freigegebene Reservierung handeln. Weitere Informationen finden Sie in folgenden Dokumenten:
Die Reservierung kann GPU-Beschleuniger enthalten.
Reservierung mit einer neuen Instanz verwenden
Sie können Ihre Reservierung mithilfe der REST API eine neue Vertex AI Workbench-Instanz hinzufügen.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
PROJECT_ID
: Ihre Projekt-ID.LOCATION
: Zone, in der sich Ihre Instanz befindet.INSTANCE_NAME
: durch den Namen der InstanzMACHINE_TYPE
: den Maschinentyp Ihrer InstanzRESERVATION_TYPE
: den ReservierungstypRESERVATION_NAME
: den Namen Ihrer Reservierung
HTTP-Methode und URL:
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
JSON-Text der Anfrage:
{ "gce_setup": { "machine_type": "MACHINE_TYPE", "reservation_affinity": { "consume_reservation_type": "RESERVATION_TYPE", "key": "compute.googleapis.com/reservation-name", "values": ["RESERVATION_NAME"] } } }
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Nutzung Ihrer Reservierung beenden
Wenn Sie Ihre Reservierung nicht mehr verwenden möchten, können Sie Ihre Reservierung löschen.
Wenn Sie Ihre Reservierung weiterhin mit anderen Ressourcen verwenden möchten, sie aber nicht von Ihrer vorhandenen Vertex AI Workbench-Instanz verwendet werden soll, müssen Sie die Instanz löschen.
Abrechnung
Reservierte Compute Engine-VM-Ressourcen werden von Vertex AI Workbench in Rechnung gestellt, solange die Vertex AI Workbench-Instanz ausgeführt wird. Compute Engine wird abgerechnet, wenn die VM-Ressourcen nicht von Vertex AI Workbench verwendet werden.
Nächste Schritte
- Weitere Informationen zu Compute Engine-Reservierungen finden Sie unter Reservierungen von zonalen Compute Engine-Ressourcen.