Esta página foi traduzida pela API Cloud Translation.

Usar reservas com instâncias do Vertex AI Workbench

É possível usar reservas do Compute Engine para garantir que os recursos da VM estejam disponíveis quando suas instâncias do Vertex AI Workbench precisarem deles. As reservas fornecem um nível alto de garantia da capacidade dos recursos zonais do Compute Engine.

Limitações e requisitos

Todas as limitações das reservas do Compute Engine se aplicam quando instâncias do Vertex AI Workbench consomem reservas. Saiba Como funcionam as reservas.

Além disso, ao usar reservas com instâncias do Vertex AI Workbench, as seguintes limitações e requisitos se aplicam:

O consumo de reservas do Compute Engine com instâncias do Vertex AI Workbench está em pré-lançamento particular. Para solicitar acesso, consulte a página de solicitação de acesso.
Os descontos por compromisso de uso não se aplicam.
O uso de reservas com o Vertex AI Workbench só está disponível pela API Notebooks. Não é possível usar reservas com o Vertex AI Workbench usando o console do Google Cloud.

Antes de começar

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Enable the Compute Engine and Notebooks APIs.

Enable the APIs

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Enable the Compute Engine and Notebooks APIs.

Enable the APIs

Funções exigidas

Para garantir que sua conta de usuário tenha as permissões necessárias para usar reservas com instâncias do Vertex AI Workbench, peça ao administrador para conceder à sua conta de usuário os seguintes papéis do IAM no projeto:

Administrador do Compute (roles/compute.admin)
Administrador de notebooks (roles/notebooks.admin)

Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

O administrador também pode conceder à sua conta de usuário as permissões necessárias via funções personalizadas ou outros papéis predefinidos.

Criar uma reserva

Crie uma reserva do Compute Engine. Pode ser uma reserva de projeto único ou compartilhada. Confira mais informações nestes documentos:
- Criar uma reserva para um único projeto
- Criar uma reserva compartilhada
A reserva pode incluir aceleradores de GPU.

Usar uma reserva com uma nova instância

É possível adicionar sua reserva ao criar uma nova instância do Vertex AI Workbench usando a API REST.

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

PROJECT_ID: ID do projeto;
LOCATION: a zona em que a instância está localizada
INSTANCE_NAME: o nome da instância
MACHINE_TYPE: o tipo de máquina da instância
RESERVATION_TYPE: o tipo de reserva. Precisa ser RESERVATION_ANY ou RESERVATION_SPECIFIC.
RESERVATION_NAME: o nome da sua reserva ao usar o tipo RESERVATION_SPECIFIC

Para reservas no mesmo projeto, use o ID da reserva.
Para reservas em um projeto diferente, use o caminho completo da reserva.

Método HTTP e URL:

POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

Corpo JSON da solicitação:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Para enviar a solicitação, escolha uma destas opções:

curl

Observação: o comando a seguir pressupõe que você fez login na CLI gcloud com sua conta de usuário executando gcloud init ou gcloud auth login, ou usando o Cloud Shell, que faz login automaticamente na CLI gcloud. . É possível verificar a conta ativa atual executando gcloud auth list.

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Observação: o comando a seguir pressupõe que você fez login na CLI gcloud com sua conta de usuário executando gcloud init ou gcloud auth login . É possível verificar a conta ativa atual executando gcloud auth list.

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content

Se a solicitação for bem-sucedida, o corpo da resposta conterá uma instância de Operation.

Para usar qualquer reserva,

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_ANY"
    }
  }
}

Parar de usar sua reserva

Para deixar de usar sua reserva, exclua-a.

Se você quiser continuar usando sua reserva com outros recursos, mas não quiser que sua instância atual do Vertex AI Workbench a utilize, exclua a instância.

Faturamento

Os recursos reservados de VM do Compute Engine são cobrados pelo Vertex AI Workbench enquanto a instância está em execução e são cobrados pelo Compute Engine quando os recursos da VM não estão sendo usados pelo Vertex AI Workbench.

Resolver problemas

Para encontrar métodos de diagnóstico e resolução de erros relacionados ao uso de reservas com instâncias do Vertex AI Workbench, consulte Solução de problemas de instâncias do Vertex AI Workbench.

A seguir

Saiba mais sobre as reservas do Compute Engine em Reservas de recursos zonais do Compute Engine.