Utilizzare le prenotazioni con le istanze di Vertex AI Workbench

Per assicurarti che le risorse VM siano disponibili quando le istanze Vertex AI Workbench ne hanno bisogno, puoi usarle delle prenotazioni Compute Engine. Le prenotazioni offrono un alto livello di garanzia nell'ottenimento di capacità per Compute Engine a livello di zona Google Cloud.

Limitazioni e requisiti

Tutte le limitazioni delle prenotazioni Compute Engine si applicano quando Le istanze di Vertex AI Workbench consumano prenotazioni. Consulta l'articolo Come funzionano le prenotazioni.

Inoltre, quando utilizzi le prenotazioni con le istanze Vertex AI Workbench, si applicano le seguenti limitazioni e i seguenti requisiti:

  • L'utilizzo delle prenotazioni Compute Engine con le istanze Vertex AI Workbench è in anteprima privata. A richiedere l'accesso, consulta la pagina di richiesta di accesso.

  • Gli sconti per impegno di utilizzo non vengono applicati.

  • L'utilizzo delle prenotazioni con Vertex AI Workbench è disponibile solo tramite l'API Notebooks. L'utilizzo delle prenotazioni con Vertex AI Workbench tramite la console Google Cloud non è supportato.

Prima di iniziare

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

Ruoli obbligatori

Per assicurarti che il tuo account utente disponga degli autorizzazioni per utilizzare le prenotazioni con le istanze di Vertex AI Workbench, chiedi all'amministratore di concedere al tuo account utente la seguenti ruoli IAM sul progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

L'amministratore potrebbe anche assegnare al tuo account utente le autorizzazioni richieste tramite ruoli personalizzati o altri ruoli predefiniti.

Crea una prenotazione

  1. Crea una prenotazione Compute Engine. Può essere un singolo progetto o una prenotazione condivisa. Per ulteriori informazioni, consulta le documenti:

    La prenotazione può includere acceleratori GPU.

Usa una prenotazione con una nuova istanza

Puoi aggiungere la tua prenotazione quando crei un nuovo Vertex AI Workbench utilizzando l'API REST.

Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:

  • PROJECT_ID: il tuo ID progetto
  • LOCATION: la zona in cui si trova l'istanza
  • INSTANCE_NAME: il nome dell'istanza
  • MACHINE_TYPE: il tipo di macchina dell'istanza
  • RESERVATION_TYPE: tipo di prenotazione; deve essere RESERVATION_ANY o RESERVATION_SPECIFIC
  • RESERVATION_NAME: il nome della prenotazione quando si utilizza il tipo RESERVATION_SPECIFIC
    • Per le prenotazioni nello stesso progetto, puoi utilizzare l'ID prenotazione.
    • Per le prenotazioni in un altro progetto, devi utilizzare il percorso completo della prenotazione.

Metodo HTTP e URL:

POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

Corpo JSON della richiesta:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Per inviare la richiesta, scegli una delle seguenti opzioni:

curl

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
In caso di esito positivo, il corpo della risposta contiene un'istanza di Operazione.

Per utilizzare una prenotazione,

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_ANY"
    }
  }
}

Interrompere l'utilizzo della prenotazione

Per interrompere l'utilizzo della prenotazione, puoi eliminare la prenotazione.

Se vuoi continuare a utilizzare la tua prenotazione con altre risorse, non vuoi che la tua istanza Vertex AI Workbench esistente lo utilizzi, devi eliminare l'istanza.

Fatturazione

Le risorse VM Compute Engine riservate vengono fatturate da Vertex AI Workbench mentre l'istanza di Vertex AI Workbench è in esecuzione e da Compute Engine quando le risorse VM non sono in uso da Vertex AI Workbench.

Passaggi successivi