Utilizzare le prenotazioni con le istanze Vertex AI Workbench

Per assicurarti che le risorse VM siano disponibili quando le tue istanze Vertex AI Workbench ne hanno bisogno, puoi utilizzare le prenotazioni Compute Engine. Le prenotazioni offrono un elevato livello di garanzia per l'ottenimento di capacità per le risorse di zona di Compute Engine.

Limitazioni e requisiti

Quando le istanze di Vertex AI Workbench utilizzano le prenotazioni, si applicano tutte le limitazioni delle prenotazioni di Compute Engine. Consulta l'articolo Come funzionano le prenotazioni.

Inoltre, quando utilizzi le prenotazioni con le istanze Vertex AI Workbench, si applicano le seguenti limitazioni e requisiti:

  • L'utilizzo delle prenotazioni Compute Engine con le istanze Vertex AI Workbench è in anteprima privata. Per richiedere l'accesso, consulta la pagina di richiesta di accesso.

  • Gli sconti per impegno di utilizzo non vengono applicati.

  • L'utilizzo delle prenotazioni con Vertex AI Workbench è disponibile solo tramite l'API Notebooks. L'utilizzo delle prenotazioni con Vertex AI Workbench tramite la console Google Cloud non è supportato.

Prima di iniziare

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

Ruoli obbligatori

Per assicurarti che il tuo account utente disponga delle autorizzazioni necessarie per utilizzare le prenotazioni con le istanze Vertex AI Workbench, chiedi all'amministratore di concedere al tuo account utente i seguenti ruoli IAM sul progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

L'amministratore potrebbe anche assegnare al tuo account utente le autorizzazioni richieste tramite ruoli personalizzati o altri ruoli predefiniti.

Crea una prenotazione

  1. Crea una prenotazione Compute Engine. Può essere una prenotazione per un singolo progetto o una prenotazione condivisa. Per ulteriori informazioni, consulta i seguenti documenti:

    La prenotazione può includere acceleratori GPU.

Utilizzare una prenotazione con una nuova istanza

Puoi aggiungere la prenotazione quando crei una nuova istanza di Vertex AI Workbench utilizzando l'API REST.

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

  • PROJECT_ID: il tuo ID progetto
  • LOCATION: la zona in cui si trova l'istanza
  • INSTANCE_NAME: il nome dell'istanza
  • MACHINE_TYPE: il tipo di macchina dell'istanza
  • RESERVATION_TYPE: il tipo di prenotazione; deve essere RESERVATION_ANY o RESERVATION_SPECIFIC
  • RESERVATION_NAME: il nome della prenotazione quando si utilizza il tipo RESERVATION_SPECIFIC
    • Per le prenotazioni nello stesso progetto, puoi utilizzare l'ID prenotazione.
    • Per le prenotazioni in un altro progetto, devi utilizzare il percorso completo della prenotazione.

Metodo HTTP e URL:

POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

Corpo JSON della richiesta:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Per inviare la richiesta, scegli una delle seguenti opzioni:

curl

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
In caso di esito positivo, il corpo della risposta contiene un'istanza di Operation.

Per utilizzare una prenotazione,

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_ANY"
    }
  }
}

Interrompere l'utilizzo della prenotazione

Per interrompere l'utilizzo della prenotazione, puoi eliminarla.

Se vuoi continuare a utilizzare la prenotazione con altre risorse, ma non vuoi che la tua istanza Vertex AI Workbench esistente la utilizzi, devi eliminare l'istanza.

Fatturazione

Le risorse VM Compute Engine riservate vengono fatturate da Vertex AI Workbench mentre l'istanza di Vertex AI Workbench è in esecuzione e da Compute Engine quando le risorse VM non sono in uso da Vertex AI Workbench.

Passaggi successivi