Utiliser des réservations avec des instances Vertex AI Workbench
Pour vous assurer que des ressources de VM sont disponibles lorsque vos instances Vertex AI Workbench en ont besoin, vous pouvez utiliser des réservations Compute Engine. Les réservations offrent un niveau élevé d'assurance pour l'obtention de la capacité des ressources zonales Compute Engine.
Limites et exigences
Toutes les limites des réservations Compute Engine s'appliquent lorsque les instances Vertex AI Workbench consomment des réservations. Consultez la section Fonctionnement des réservations.
De plus, lorsque vous utilisez des réservations avec des instances Vertex AI Workbench, les limites et exigences suivantes s'appliquent :
Les réservations pour les instances Vertex AI Workbench sont en version preview privée. Pour demander l'accès, consultez la page de demande d'accès.
Les remises sur engagement d'utilisation ne s'appliquent pas.
L'utilisation des réservations avec Vertex AI Workbench n'est disponible que via l'API Notebooks. Il n'est pas possible d'utiliser des réservations avec Vertex AI Workbench à l'aide de la console Google Cloud.
Avant de commencer
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
Rôles requis
Pour vous assurer que votre compte utilisateur dispose des autorisations nécessaires pour utiliser des réservations avec des instances Vertex AI Workbench, demandez à votre administrateur d'attribuer les rôles IAM suivants à votre compte utilisateur sur le projet :
-
Administrateur de Compute (
roles/compute.admin
) -
Administrateur Notebooks (
roles/notebooks.admin
)
Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.
Votre administrateur peut également attribuer à votre compte utilisateur les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Créer une réservation
Créez une réservation Compute Engine. Il peut s'agir d'une réservation à projet unique ou d'une réservation partagée. Pour en savoir plus, consultez les documents suivants :
La réservation peut inclure des accélérateurs de GPU.
Utiliser votre réservation avec une nouvelle instance
Vous pouvez ajouter votre réservation à une nouvelle instance Vertex AI Workbench à l'aide de l'API REST.
Avant d'utiliser les données de requête ci-dessous, effectuez les remplacements suivants :
PROJECT_ID
: ID de votre projet.LOCATION
: zone où se trouve votre instanceINSTANCE_NAME
: nom de l'instanceMACHINE_TYPE
: type de machine de votre instanceRESERVATION_TYPE
: type de réservationRESERVATION_NAME
: nom de votre réservation
Méthode HTTP et URL :
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
Corps JSON de la requête :
{ "gce_setup": { "machine_type": "MACHINE_TYPE", "reservation_affinity": { "consume_reservation_type": "RESERVATION_TYPE", "key": "compute.googleapis.com/reservation-name", "values": ["RESERVATION_NAME"] } } }
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Cesser d'utiliser votre réservation
Pour cesser d'utiliser votre réservation, vous pouvez supprimer votre réservation.
Si vous souhaitez continuer à utiliser votre réservation avec d'autres ressources, mais que vous ne souhaitez pas que votre instance Vertex AI Workbench existante l'utilise, vous devez supprimer l'instance.
Facturation
Les ressources de VM Compute Engine réservées sont facturées par Vertex AI Workbench pendant l'exécution de l'instance Vertex AI Workbench, et sont facturées par Compute Engine lorsque les ressources de VM ne sont pas utilisées par Vertex AI Workbench.
Étapes suivantes
- Pour en savoir plus sur les réservations Compute Engine, consultez la section Réservations de ressources zonales Compute Engine.