Acerca dos pedidos de reserva futuros no modo de calendário


Este documento apresenta uma vista geral dos pedidos de reserva futuros no modo de calendário. Para saber mais sobre as diferentes formas de reservar recursos no Compute Engine, consulte o artigo Escolha um tipo de reserva.

Para obter capacidade para criar instâncias de máquinas virtuais (VMs) com GPUs ou TPUs anexadas, use pedidos de reserva futuros no modo de calendário. Se Google Cloud aprovar o seu pedido, o Compute Engine aprovisiona os recursos reservados na data e hora escolhidas, e durante um período máximo de 90 dias. Em seguida, pode usar os recursos reservados para criar VMs de GPU ou VMs de TPU para executar as seguintes cargas de trabalho:

  • Tarefas de pré-treino de modelos

  • Tarefas de ajuste do modelo

  • Cargas de trabalho de simulação de computação de alto desempenho (HPC)

  • Aumentos esperados a curto prazo nas cargas de trabalho de inferência

Crie um pedido no modo de calendário

As secções seguintes explicam como ver a disponibilidade de recursos, bem como os detalhes a especificar quando cria um pedido de reserva futuro no modo de calendário.

Veja a disponibilidade futura dos recursos

Antes de criar um pedido de reserva futura no modo de calendário, pode ver a disponibilidade futura numa região dos seguintes recursos:

  • Para VMs com GPU, até 60 dias de antecedência

  • Para TPUs, até 120 dias de antecedência

O Compute Engine usa o Dynamic Workload Scheduler (DWS) para ver quando os recursos pedidos estão disponíveis. Quando criar um pedido, especifique o número, o tipo e o período de reserva dos recursos que confirmou como disponíveis. Google Cloud é mais provável que aprove o seu pedido se fornecer estas informações.

Defina as propriedades do pedido

Quando cria um pedido de reserva futuro no modo de calendário, tem de especificar as seguintes propriedades:

  • Eliminação automática. Esta propriedade determina se o Compute Engine elimina a reserva criada automaticamente (auto-created) para o seu pedido à hora de fim, mesmo que a reserva não seja totalmente consumida. Para criar um pedido no modo de calendário, tem de ativar a opção de eliminação automática.

  • Tipo de consumo. Esta propriedade define como as VMs consomem a reserva criada automaticamente. Quando cria um pedido no modo de calendário, tem de especificar que quer criar reservas segmentadas especificamente. Esta definição significa que apenas as VMs que segmentam a reserva podem consumi-la.

  • Tipo de implementação. Esta propriedade define a colocação conjunta dos seus recursos reservados. Quando cria um pedido no modo de calendário, tem de especificar que os recursos devem ser implementados de forma densa. Neste tipo de implementação, os recursos estão localizados próximos uns dos outros para minimizar a latência da rede.

  • Nome. O nome do seu pedido, que tem de ser exclusivo no seu projeto.

  • Número de recursos. O número de VMs de GPU ou TPUs a reservar na hora de início pedida.

  • Estado do planeamento. Esta propriedade define se envia imediatamente o seu pedido para Google Cloud revisão ou se o guarda como rascunho e o envia mais tarde. Quando cria um pedido no modo de calendário, tem de especificar que quer enviar imediatamente o pedido para revisão.

  • Modo de reserva. Esta propriedade define o método para reservar recursos, que tem de definir como CALENDAR para um pedido no modo de calendário.

  • Nome da reserva. O nome da reserva que o Compute Engine cria automaticamente se Google Cloud aprovar o seu pedido.

  • Tipo de partilha. Esta propriedade define se outros projetos na sua organização podem consumir a reserva criada automaticamente para o seu pedido aprovado. Pode especificar uma das seguintes opções:

    • Projeto único. Apenas o seu projeto pode consumir a capacidade reservada.

    • Partilhado. Pode partilhar a capacidade reservada com até 100 outros projetos na sua organização. Se especificar esta opção, tem de especificar os projetos com os quais partilhar a reserva criada automaticamente. Para mais informações, consulte as práticas recomendadas para reservas partilhadas.

  • Período de reserva. A data e a hora em que o Compute Engine disponibiliza a capacidade pedida e pode consumi-la. O período de reserva inclui o seguinte:

    • Hora de início. Quando quer começar a consumir a sua capacidade reservada. Com base nos recursos que reserva, a hora de início tem de ser, pelo menos, um dos seguintes valores a partir do momento em que cria e envia um pedido:

      • Para VMs com GPU, 87 horas (três dias e 15 horas)

      • Para TPUs, seis horas

    • Hora de fim. Quando a capacidade pedida já não está reservada para si. Neste momento, o Compute Engine elimina a reserva criada automaticamente e para ou elimina todas as VMs que consomem a reserva com base na ação de encerramento que especificou para as VMs.

  • Propriedades dos recursos. Os requisitos de hardware das VMs com GPU ou TPUs que quer reservar. As VMs só podem usar uma reserva se as respetivas propriedades corresponderem às propriedades da reserva. Para mais informações, consulte os requisitos para consumir reservas.

  • Tipo de carga de trabalho. Se reservar TPUs v5e, tem de especificar como reservar capacidade com base no tipo de carga de trabalho:

    • Lote. Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de aprendizagem automática (AA).

    • A prestar serviços. Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML.

  • Zona. A zona onde quer reservar capacidade.

Processo de solicitação de revisão

Para reservar capacidade através de um pedido de reserva futuro no modo de calendário, tem de criar e enviar o pedido para Google Cloud para revisão. Depois de criar e enviar uma solicitação, o Google Ads a revê no prazo de um minuto e, em seguida, ocorre uma das seguintes situações: Google Cloud

  • Google Cloud aprova o seu pedido: o Compute Engine reserva os recursos pedidos e, no prazo de um minuto após a aprovação, cria automaticamente uma reserva vazia. Na hora de início do pedido, o Compute Engine aprovisiona a capacidade pedida aumentando o número de VMs de GPU ou TPUs na reserva.

  • Encontra um erro. O pedido falha porque a zona do pedido não tem recursos suficientes. Recomendamos que volte a verificar a disponibilidade de recursos futuros e, em seguida, crie e envie uma nova solicitação de revisão.

Ciclo de vida do pedido

O diagrama seguinte mostra os diferentes estados que o Compute Engine pode definir para um pedido de reserva futura no modo de calendário:

Um fluxograma que mostra os diferentes estados pelos quais um pedido de reserva futura no modo de calendário pode passar.

Os estados e o fluxo de eventos apresentados no diagrama anterior são os seguintes:

  • PENDING_APPROVAL: criou e enviou um pedido de revisão. No prazo de um minuto, Google Cloud aprova o pedido.

  • APPROVED: Google Cloud aprovou o seu pedido. Em seguida, no prazo de um minuto, o Compute Engine cria automaticamente uma reserva vazia e altera o estado do pedido para PROCURING.

  • PROCURING: o Compute Engine agenda o aprovisionamento dos seus recursos reservados. Antes da hora de início do pedido, o estado do pedido muda para PROVISIONING.

  • PROVISIONING: o Compute Engine está a aprovisionar os seus recursos reservados aumentando o número de VMs com GPU ou TPUs reservadas na reserva criada automaticamente. À hora de início do pedido, o estado do pedido é alterado para FULFILLED.

  • FULFILLED: o Compute Engine aprovisionou os seus recursos reservados e é-lhe cobrado o respetivo valor. Pode consumir a reserva criada automaticamente criando VMs até à hora de fim do pedido.

À hora de fim do pedido, o Compute Engine elimina o pedido e a reserva criada automaticamente. Também para ou elimina todas as VMs que consomem a reserva com base na ação de rescisão que especificou para as VMs.

Consuma capacidade aprovisionada

Depois de Google Cloud aprovar um pedido de reserva futura no modo de calendário, o Compute Engine cria automaticamente uma reserva com as seguintes características:

  • A reserva criada automaticamente não tem VMs com GPU nem TPUs reservadas. Ainda não a pode usar.

  • A reserva criada automaticamente herda as propriedades de VM ou TPU especificadas no seu pedido.

Na hora de início do pedido, o Compute Engine aprovisiona a capacidade pedida aumentando o número de VMs de GPU ou TPUs na reserva criada automaticamente. Em seguida, pode consumir a reserva criando VMs de GPU ou VMs de TPU que cumpram todas as seguintes condições:

Pode criar VMs até que a reserva seja totalmente consumida ou até à hora de fim pedida. À hora de fim do pedido, o Compute Engine elimina a reserva criada automaticamente e para ou elimina todas as VMs que consomem a reserva.

Quota

Os pedidos de reserva futuros no modo de calendário têm de usar o modelo de aprovisionamento associado a reservas. Este modelo não requer quota do Compute Engine para reservar recursos. No entanto, antes de criar um pedido, verifique se tem quota suficiente para quaisquer recursos que não façam parte de uma reserva quando cria VMs, como discos ou endereços IP.

Preços

Quando cria um pedido de reserva futuro no modo de calendário, não lhe é cobrado nenhum valor. Em vez disso, incorre em custos quando ocorre o seguinte:

  • O Compute Engine aprovisiona a capacidade pedida. Quando um pedido atinge o estado FULFILLED, são-lhe cobrados os recursos aprovisionados de acordo com os preços do DWS. Este modelo de preços oferece vCPUs, memória, GPUs e TPUs a um preço com desconto em comparação com os preços padrão.

  • Usar recursos não abrangidos pela reserva. Quando cria VMs que consomem uma reserva criada automaticamente, não lhe é cobrado novamente o valor dos recursos consumidos. Só lhe são cobrados os recursos que não fazem parte da reserva, como discos ou endereços IP.

Deixa de incorrer em custos pelos recursos reservados à hora de fim do pedido. Neste momento, o Compute Engine elimina a reserva criada automaticamente e para ou elimina todas as VMs que consomem a reserva.

Limitações

As secções seguintes explicam as limitações para pedidos de reserva futuros no modo de calendário.

Limitações para todos os pedidos

Todos os pedidos de reserva futuros no modo de calendário têm as seguintes limitações:

  • Pode reservar recursos por um período entre 1 e 90 dias.

  • Depois de criar e enviar um pedido, não pode cancelá-lo, eliminá-lo nem modificá-lo.

Limitações para pedidos de VMs com GPU

Só pode reservar VMs com GPU da seguinte forma:

  • Pode reservar entre 1 e 80 VMs com GPU por pedido.

  • Pode reservar as seguintes séries de máquinas:

  • Só pode reservar VMs com GPU em zonas específicas.

Limitações para pedidos de TPUs

Só pode reservar TPUs da seguinte forma:

  • Pode reservar 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1024 chips de TPU por pedido.

  • Pode reservar as seguintes versões de TPUs:

  • Só pode reservar 1, 4 ou 8 chips de TPU v5e para tipos de cargas de trabalho de publicação (SERVING).

  • Só pode reservar TPUs nas seguintes zonas:

    • Para a TPU v6e:

      • asia-northeast1-b

      • us-east5-a

      • us-east5-b

    • Para a TPU v5p:

      • us-east5-a
    • Para a TPU v5e:

      • Para tipos de carga de trabalho em lote (BATCH): us-west4-b

      • Para tipos de carga de trabalho de publicação (SERVING): us-central1-a

Limitações para todas as reservas criadas automaticamente

Uma reserva criada automaticamente para um pedido tem as seguintes limitações:

  • Só pode modificar a reserva da seguinte forma:

    • Para permitir ou não permitir que as tarefas do Vertex AI o consumam.

    • Após a hora de início da reserva.

  • Não pode aplicar descontos por utilização garantida (CUDs) nem descontos por utilização contínua (SUDs) à reserva.

  • Não pode eliminar a reserva. O Compute Engine elimina-a na hora de fim da reserva.

O que se segue?