Criar uma VM que use o modelo vinculado à reserva

Neste documento, explicamos como criar uma instância de máquina virtual (VM) independente usando o modelo de provisionamento vinculado à reserva. Com esse modelo de provisionamento, é possível criar VMs A4X, A4 ou A3 Ultra consumindo capacidade pré-reservada.

Para outros métodos de criação de VMs usando o modelo de provisionamento vinculado à reserva, consulte Visão geral das opções de implantação na documentação do Hipercomputador de IA.

Antes de começar

  • Configure a autenticação, caso ainda não tenha feito isso. Com isso, você confirma sua identidade para acesso a serviços e APIs do Google Cloud . Para executar código ou exemplos em um ambiente de desenvolvimento local, faça a autenticação no Compute Engine com um destes métodos:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Instale a CLI do Google Cloud. Após a instalação, inicialize a CLI do Google Cloud executando o seguinte comando:

      gcloud init

      Ao usar um provedor de identidade (IdP) externo, primeiro faça login na gcloud CLI com sua identidade federada.

    2. Set a default region and zone.

    REST

    Para usar as amostras da API REST desta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para gcloud CLI.

      Instale a CLI do Google Cloud. Após a instalação, inicialize a CLI do Google Cloud executando o seguinte comando:

      gcloud init

      Ao usar um provedor de identidade (IdP) externo, primeiro faça login na gcloud CLI com sua identidade federada.

    Saiba mais em Autenticar para usar REST na documentação de autenticação do Google Cloud .

Funções exigidas

Para receber as permissões necessárias para criar VMs usando o modelo de provisionamento vinculado à reserva, peça ao administrador para conceder a você o papel do IAM de Administrador da instância do Compute (v1) (roles/compute.instanceAdmin.v1) no projeto. Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Esse papel predefinido contém as permissões necessárias para criar VMs usando o modelo de provisionamento vinculado à reserva. Para acessar as permissões exatas necessárias, expanda a seção Permissões necessárias:

Permissões necessárias

As permissões a seguir são necessárias para criar VMs usando o modelo de provisionamento vinculado à reserva:

  • compute.instances.create no projeto
  • Usar uma imagem personalizada a fim de criar a VM: compute.images.useReadOnly na imagem
  • Usar um snapshot para criar a VM: compute.snapshots.useReadOnly no snapshot
  • Usar um modelo de instância para criar a VM: compute.instanceTemplates.useReadOnly no modelo de instância
  • Especificar uma sub-rede para a VM: compute.subnetworks.use no projeto ou na sub-rede escolhida
  • Especificar um endereço IP estático para a VM: compute.addresses.use no projeto
  • Atribuir um endereço IP externo à VM ao usar uma rede VPC: compute.subnetworks.useExternalIp no projeto ou na sub-rede escolhida
  • Atribuir uma rede legada à VM: compute.networks.use no projeto
  • Atribuir um endereço IP externo à VM ao usar uma rede legada: compute.networks.useExternalIp no projeto
  • Definir os metadados da instância de VM para a VM: compute.instances.setMetadata no projeto
  • Definir tags para a VM: compute.instances.setTags na VM
  • Definir rótulos para a VM: compute.instances.setLabels na VM
  • Definir uma conta de serviço a ser usada pela VM: compute.instances.setServiceAccount na VM
  • Criar um disco para a VM: compute.disks.create no projeto
  • Anexar um disco atual no modo somente leitura ou de leitura e gravação: compute.disks.use no disco
  • Anexar um disco atual no modo somente leitura: compute.disks.useReadOnly no disco

Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.

Criar uma VM que use o modelo de provisionamento vinculado à reserva

Para criar uma VM ultra A4X, A4 ou A3 usando o modelo de provisionamento vinculado à reserva, aguarde até que a reserva automática que você quer usar atinja o horário de início. Além disso, a VM que você quer criar precisa atender a todos os requisitos a seguir:

O exemplo a seguir cria uma solicitação de reserva adiantada no modo de calendário para cinco VMs A3 Ultra e, em seguida, cria uma VM A3 Ultra consumindo a reserva criada automaticamente para a solicitação.

Para criar uma VM de exemplo usando o modelo de provisionamento vinculado à reserva, selecione uma das seguintes opções:

Console

  1. Crie um exemplo de solicitação para cinco VMs A3 Ultra e envie para análise:

    1. No console do Google Cloud , acesse a página Reservas.

      Acesse "Reservas"

    2. Clique na guia Reservas adiantadas.

    3. Clique em Criar reserva adiantada. A página Criar uma reserva adiantada é exibida.

    4. Na seção Configuração de hardware, selecione Especificar tipo de máquina e especifique uma instância A3 Ultra.

    5. Na seção Método de capacidade de obtenção, siga estas etapas:

      1. Selecione Pesquisar capacidade por até 90 dias.

      2. Nas listas Região e Zona, especifique a região e a zona em que os recursos serão reservados. Para este exemplo, selecione us-central1 e us-central1-a, respectivamente.

      3. No campo Capacidade total necessária, insira 5.

      4. Na seção Período de reserva, especifique o período da reserva.

    6. Especifique os campos restantes e clique em Enviar.

  2. No horário de início da solicitação, para criar uma VM A3 Ultra e consumir a reserva de exemplo criada automaticamente, faça o seguinte:

    1. No console do Google Cloud , acesse a página Criar uma instância.

      Acesse "Criar uma instância"

    2. No campo Nome, insira um nome para a VM. Neste exemplo, digite example-vm.

    3. Especifique a região e a zona em que você quer reservar recursos. Para este exemplo, selecione us-central1 e us-central1-a, respectivamente.

    4. Clique na guia GPUs e, na lista Tipo de GPU, selecione NVIDIA H200 141 GB. Essa ação especifica uma VM A3 Ultra e define o modelo de provisionamento como Vinculado à reserva.

    5. No menu de navegação, clique em Avançado.

    6. Na seção Reservas, selecione Escolher uma reserva e clique em Escolher uma reserva.

    7. No painel Escolher uma reserva, faça o seguinte:

      1. Selecione uma reserva específica. Se você quiser consumir uma reserva compartilhada que existe em um projeto diferente, na lista Projeto, selecione o projeto em que a reserva está.

      2. Clique em Escolher.

    8. Na seção Modelo de provisionamento, expanda a seção Configurações avançadas do modelo de provisionamento de VM.

    9. Na lista No encerramento da VM, selecione Parar (padrão) ou Excluir.

    10. Clique em Criar.

gcloud

  1. Para criar um exemplo de solicitação de cinco VMs A3 Ultra e enviar para revisão, use o comando gcloud beta compute future-reservations create:

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-type=local \
        --start-time=2025-10-05T00:00:00Z \
        --end-time=2025-10-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-a
    

    Suponha que Google Cloud aprove a solicitação e o Compute Engine crie automaticamente uma reserva vazia. No horário de início da solicitação, em 5 de outubro de 2025, o Compute Engine aumenta o número de VMs com GPU reservadas na reserva. Depois, você pode consumir a reserva.

  2. No horário de início da solicitação, para criar uma VM A3 Ultra e consumir a reserva de exemplo criada automaticamente, use o comando gcloud compute instances create com as seguintes flags:

    • A sinalização --instance-termination-action

    • A flag --provisioning-model definida como RESERVATION_BOUND.

    • A sinalização --reservation

    • A flag --reservation-affinity definida como specific.

    O comando é semelhante a este: Para conferir os requisitos completos para criar uma VM A3 Ultra, consulte Criar uma instância A3 Ultra ou A4.

    gcloud compute instance create example-vm  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-a \
        ...
    

    O comando inclui os seguintes valores:

    • TERMINATION_ACTION: se o Compute Engine vai parar (STOP) ou excluir (DELETE) a VM ao final do período de reserva.

    • RESERVATION_URL: o URL da reserva, formatado da seguinte maneira:

      • Se a reserva criada automaticamente existir no seu projeto: example-reservation.

      • Se a reserva criada automaticamente estiver em um projeto diferente: projects/PROJECT_ID/reservations/example-reservation.

REST

  1. Para criar um exemplo de solicitação de cinco VMs A3 Ultra e enviar para análise, faça uma solicitação POST para o método Beta futureReservations.insert:

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2025-10-05T00:00:00Z",
        "endTime": "2025-10-19T00:00:00Z"
      }
    }
    

    Suponha que Google Cloud aprove a solicitação e o Compute Engine crie automaticamente uma reserva vazia. No horário de início da solicitação, em 5 de outubro de 2025, o Compute Engine aumenta o número de VMs com GPU reservadas na reserva. Depois, você pode consumir a reserva.

  2. No horário de início da solicitação, para criar uma VM A3 Ultra e consumir a reserva de exemplo criada automaticamente, faça uma solicitação POST para o método instances.insert. No corpo da solicitação, inclua os seguintes campos:

    • O campo reservationAffinity.consumeReservationType definido como SPECIFIC_RESERVATION.

    • O campo reservationAffinity.key definido como compute.googleapis.com/reservation-name.

    • O campo reservationAffinity.values definido como o URL da reserva.

    • O campo scheduling.instanceTerminationAction.

    • O campo scheduling.provisioningModel definido como RESERVATION_BOUND.

    A solicitação é semelhante a esta: Para conferir os requisitos completos para criar uma VM A3 Ultra, consulte Criar uma instância A3 Ultra ou A4.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-a/machineTypes/a3-ultragpu-8g",
        "name": "example-vm",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    O corpo da solicitação inclui os seguintes valores:

    • RESERVATION_URL: o URL da reserva, formatado da seguinte maneira:

      • Se a reserva criada automaticamente existir no seu projeto: example-reservation.

      • Se a reserva criada automaticamente estiver em um projeto diferente: projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION: se o Compute Engine vai parar (STOP) ou excluir (DELETE) a VM ao final do período de reserva.

A seguir

Faça um teste

Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho do Compute Engine em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.

Faça uma avaliação gratuita do Compute Engine