Usar reservas com instâncias do Vertex AI Workbench

É possível usar reservas do Compute Engine para garantir que os recursos da VM estejam disponíveis quando suas instâncias do Vertex AI Workbench precisarem deles. As reservas fornecem um nível alto de garantia da capacidade dos recursos zonais do Compute Engine.

Limitações e requisitos

Todas as limitações das reservas do Compute Engine se aplicam quando instâncias do Vertex AI Workbench consomem reservas. Saiba Como funcionam as reservas.

Além disso, ao usar reservas com instâncias do Vertex AI Workbench, as seguintes limitações e requisitos se aplicam:

Antes de começar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

Funções exigidas

Para garantir que sua conta de usuário tenha as permissões necessárias para usar reservas com instâncias do Vertex AI Workbench, peça ao administrador para conceder à sua conta de usuário os seguintes papéis do IAM no projeto:

Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

O administrador também pode conceder à sua conta de usuário as permissões necessárias via funções personalizadas ou outros papéis predefinidos.

Criar uma reserva

  1. Crie uma reserva do Compute Engine. Pode ser uma reserva de projeto único ou compartilhada. Confira mais informações nestes documentos:

    A reserva pode incluir aceleradores de GPU.

Use sua reserva com uma nova instância

É possível adicionar sua reserva a uma nova instância do Vertex AI Workbench usando a API REST.

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

  • PROJECT_ID: ID do projeto;
  • LOCATION: a zona em que a instância está localizada
  • INSTANCE_NAME: o nome da instância
  • MACHINE_TYPE: o tipo de máquina da instância
  • RESERVATION_TYPE: o tipo de reserva
  • RESERVATION_NAME: o nome da sua reserva

Método HTTP e URL:

POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

Corpo JSON da solicitação:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Para enviar a solicitação, escolha uma destas opções:

curl

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Se a solicitação for bem-sucedida, o corpo da resposta conterá uma instância de Operation.

Parar de usar sua reserva

Para deixar de usar sua reserva, exclua-a.

Se você quiser continuar usando sua reserva com outros recursos, mas não quiser que sua instância atual do Vertex AI Workbench a utilize, exclua a instância.

Faturamento

Os recursos reservados de VM do Compute Engine são cobrados pelo Vertex AI Workbench enquanto a instância está em execução e são cobrados pelo Compute Engine quando os recursos da VM não estão sendo usados pelo Vertex AI Workbench.

A seguir