Usar reservas com instâncias do Vertex AI Workbench
É possível usar reservas do Compute Engine para garantir que os recursos da VM estejam disponíveis quando suas instâncias do Vertex AI Workbench precisarem deles. As reservas fornecem um nível alto de garantia da capacidade dos recursos zonais do Compute Engine.
Limitações e requisitos
Todas as limitações das reservas do Compute Engine se aplicam quando instâncias do Vertex AI Workbench consomem reservas. Saiba Como funcionam as reservas.
Além disso, ao usar reservas com instâncias do Vertex AI Workbench, as seguintes limitações e requisitos se aplicam:
As reservas para instâncias do Vertex AI Workbench estão em visualização particular. Para solicitar acesso, consulte a página de solicitação de acesso.
Os descontos por compromisso de uso não se aplicam.
O uso de reservas com o Vertex AI Workbench só está disponível pela API Notebooks. Não é possível usar reservas com o Vertex AI Workbench usando o console do Google Cloud.
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
Funções exigidas
Para garantir que sua conta de usuário tenha as permissões necessárias para usar reservas com instâncias do Vertex AI Workbench, peça ao administrador para conceder à sua conta de usuário os seguintes papéis do IAM no projeto:
-
Administrador do Compute (
roles/compute.admin
) -
Administrador de notebooks (
roles/notebooks.admin
)
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
O administrador também pode conceder à sua conta de usuário as permissões necessárias via funções personalizadas ou outros papéis predefinidos.
Criar uma reserva
Crie uma reserva do Compute Engine. Pode ser uma reserva de projeto único ou compartilhada. Confira mais informações nestes documentos:
A reserva pode incluir aceleradores de GPU.
Use sua reserva com uma nova instância
É possível adicionar sua reserva a uma nova instância do Vertex AI Workbench usando a API REST.
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
PROJECT_ID
: ID do projeto;LOCATION
: a zona em que a instância está localizadaINSTANCE_NAME
: o nome da instânciaMACHINE_TYPE
: o tipo de máquina da instânciaRESERVATION_TYPE
: o tipo de reservaRESERVATION_NAME
: o nome da sua reserva
Método HTTP e URL:
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
Corpo JSON da solicitação:
{ "gce_setup": { "machine_type": "MACHINE_TYPE", "reservation_affinity": { "consume_reservation_type": "RESERVATION_TYPE", "key": "compute.googleapis.com/reservation-name", "values": ["RESERVATION_NAME"] } } }
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome request.json
e execute o comando a seguir:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Salve o corpo da solicitação em um arquivo com o nome request.json
e execute o comando a seguir:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Parar de usar sua reserva
Para deixar de usar sua reserva, exclua-a.
Se você quiser continuar usando sua reserva com outros recursos, mas não quiser que sua instância atual do Vertex AI Workbench a utilize, exclua a instância.
Faturamento
Os recursos reservados de VM do Compute Engine são cobrados pelo Vertex AI Workbench enquanto a instância está em execução e são cobrados pelo Compute Engine quando os recursos da VM não estão sendo usados pelo Vertex AI Workbench.
A seguir
- Saiba mais sobre as reservas do Compute Engine em Reservas de recursos zonais do Compute Engine.