Utilizzare le prenotazioni con le istanze di Vertex AI Workbench
Per assicurarti che le risorse VM siano disponibili quando le istanze Vertex AI Workbench ne hanno bisogno, puoi usarle delle prenotazioni Compute Engine. Le prenotazioni offrono un alto livello di garanzia nell'ottenimento di capacità per Compute Engine a livello di zona Google Cloud.
Limitazioni e requisiti
Tutte le limitazioni delle prenotazioni Compute Engine si applicano quando Le istanze di Vertex AI Workbench consumano prenotazioni. Consulta l'articolo Come funzionano le prenotazioni.
Inoltre, quando utilizzi le prenotazioni con le istanze Vertex AI Workbench, si applicano le seguenti limitazioni e i seguenti requisiti:
L'utilizzo delle prenotazioni Compute Engine con le istanze Vertex AI Workbench è in anteprima privata. A richiedere l'accesso, consulta la pagina di richiesta di accesso.
Gli sconti per impegno di utilizzo non vengono applicati.
L'utilizzo delle prenotazioni con Vertex AI Workbench è disponibile solo tramite l'API Notebooks. L'utilizzo delle prenotazioni con Vertex AI Workbench tramite la console Google Cloud non è supportato.
Prima di iniziare
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
Ruoli obbligatori
Per assicurarti che il tuo account utente disponga degli autorizzazioni per utilizzare le prenotazioni con le istanze di Vertex AI Workbench, chiedi all'amministratore di concedere al tuo account utente la seguenti ruoli IAM sul progetto:
-
Amministratore Compute (
roles/compute.admin
) -
Amministratore blocchi note (
roles/notebooks.admin
)
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.
L'amministratore potrebbe anche assegnare al tuo account utente le autorizzazioni richieste tramite ruoli personalizzati o altri ruoli predefiniti.
Crea una prenotazione
Crea una prenotazione Compute Engine. Può essere un singolo progetto o una prenotazione condivisa. Per ulteriori informazioni, consulta le documenti:
La prenotazione può includere acceleratori GPU.
Usa una prenotazione con una nuova istanza
Puoi aggiungere la tua prenotazione quando crei un nuovo Vertex AI Workbench utilizzando l'API REST.
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
PROJECT_ID
: il tuo ID progettoLOCATION
: la zona in cui si trova l'istanzaINSTANCE_NAME
: il nome dell'istanzaMACHINE_TYPE
: il tipo di macchina dell'istanzaRESERVATION_TYPE
: tipo di prenotazione; deve essere RESERVATION_ANY o RESERVATION_SPECIFICRESERVATION_NAME
: il nome della prenotazione quando si utilizza il tipo RESERVATION_SPECIFIC- Per le prenotazioni nello stesso progetto, puoi utilizzare l'ID prenotazione.
- Per le prenotazioni in un altro progetto, devi utilizzare il percorso completo della prenotazione.
Metodo HTTP e URL:
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
Corpo JSON della richiesta:
{ "gce_setup": { "machine_type": "MACHINE_TYPE", "reservation_affinity": { "consume_reservation_type": "RESERVATION_TYPE", "key": "compute.googleapis.com/reservation-name", "values": ["RESERVATION_NAME"] } } }
Per inviare la richiesta, scegli una delle seguenti opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json
,
quindi esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
,
quindi esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Per utilizzare una prenotazione,
{
"gce_setup": {
"machine_type": "MACHINE_TYPE",
"reservation_affinity": {
"consume_reservation_type": "RESERVATION_ANY"
}
}
}
Interrompere l'utilizzo della prenotazione
Per interrompere l'utilizzo della prenotazione, puoi eliminare la prenotazione.
Se vuoi continuare a utilizzare la tua prenotazione con altre risorse, non vuoi che la tua istanza Vertex AI Workbench esistente lo utilizzi, devi eliminare l'istanza.
Fatturazione
Le risorse VM Compute Engine riservate vengono fatturate da Vertex AI Workbench mentre l'istanza di Vertex AI Workbench è in esecuzione e da Compute Engine quando le risorse VM non sono in uso da Vertex AI Workbench.
Passaggi successivi
- Per scoprire di più sulle prenotazioni di Compute Engine, consulta Prenotazioni di risorse zonali di Compute Engine.