Sobre solicitações de redimensionamento em um MIG


Neste documento, descrevemos como as solicitações de redimensionamento em um grupo gerenciado de instâncias (MIG) funcionam e as limitações delas. Use solicitações de redimensionamento para criar instâncias de máquina virtual (VM) com GPUs de uma só vez em um MIG.

Criar VMs de uma só vez em um MIG por meio de uma solicitação de redimensionamento é útil nos seguintes cenários:

  • Quando você quer VMs de GPU apenas por um tempo específico, uma solicitação de redimensionamento aumenta as chances de conseguir GPUs, que são recursos altamente demandas.

  • Quando você quiser um número exato de VMs para executar um job, uma solicitação de redimensionamento ajuda a criar VMs de uma só vez. Ao usar solicitações de redimensionamento, você também pode evitar cobranças desnecessárias pela capacidade parcial criada pelo Compute Engine enquanto aguarda a disponibilização de todos os recursos.

Como funcionam as solicitações de redimensionamento

Ao criar uma solicitação de redimensionamento, especifique o seguinte:

  • resizeBy: o número de VMs que você quer criar de uma só vez como parte da solicitação.

  • requestedRunDuration: o tempo de execução das VMs criadas como parte da solicitação. A duração da execução precisa ser entre 10 minutos e 7 dias. No final da duração da execução, o MIG exclui as VMs criadas.

Quando você cria uma solicitação de redimensionamento em um MIG, o Compute Engine define o estado da solicitação como CREATING e, em seguida, faz a transição dele para ACCEPTED quando a solicitação é criada. O Dynamic Workload Scheduler (DWS), o mecanismo de programador subjacente, programa solicitações de redimensionamento criadas no Compute Engine com base nas durações solicitadas e na disponibilidade dos recursos.

Depois que o DWS programa a criação do número solicitado de VMs, o MIG aumenta o tamanho de destino pelo número de VMs solicitadas e cria instâncias gerenciadas que estão em uma CREATING. Essas instâncias gerenciadas representam as VMs que o MIG criará quando a solicitação de redimensionamento for bem-sucedida. Não é possível excluir as instâncias gerenciadas que estão no status CREATING, a menos que você cancele a solicitação de redimensionamento.

Se você não tiver cota para os recursos solicitados ou eles estiverem temporariamente indisponíveis, o DWS vai manter a solicitação até que você tenha cota suficiente e os recursos sejam disponibilizados.

Uma solicitação de redimensionamento aceita permanece dessa forma até que o Compute Engine defina o estado como um dos seguintes:

  • SUCCEEDED: o MIG criou o número solicitado de VMs de uma só vez. As VMs são executadas até que o MIG as exclua após o término da execução especificada ou até que você as exclua.

  • FAILED: a solicitação de redimensionamento falhou devido a um erro técnico, e o Compute Engine diminuiu o tamanho de destino do MIG pelo número de VMs solicitadas.

  • CANCELLED: um usuário cancelou a solicitação de redimensionamento, e o Compute Engine diminuiu o tamanho de destino do MIG pelo número de VMs solicitadas. Se você quiser interromper a criação de VMs de uma solicitação de redimensionamento aceita, será necessário cancelar a solicitação de redimensionamento para, em seguida, excluí-la. Se você não excluir uma solicitação de redimensionamento cancelada, o Compute Engine a excluirá automaticamente 14 dias após o cancelamento.

Para verificar o status de uma solicitação de redimensionamento aceita ou solucionar problemas, veja os detalhes da solicitação de redimensionamento.

Se você excluir um MIG que contenha solicitações de redimensionamento, essa operação também excluirá todas as solicitações e VMs de redimensionamento no MIG. No entanto, se você excluir um MIG quando ele estiver criando VMs para atender a uma solicitação de redimensionamento, o Compute Engine aguardará até que o MIG termine de criar o número solicitado de VMs e o estado das transições de solicitação de redimensionamento. como SUCCEEDED antes de excluir o MIG.

Limitações

As seções a seguir descrevem as limitações para criar solicitações de redimensionamento em um MIG.

Limitações para solicitações de redimensionamento

Para solicitações de redimensionamento, as seguintes limitações se aplicam:

  • Você pode usar a solicitação de redimensionamento para ter apenas VMs de GPU.

  • Só é possível criar solicitações de redimensionamento em MIGs zonais.

  • Só é possível cancelar as solicitações de redimensionamento aceitas (ACCEPTED).

  • Só é possível excluir uma solicitação de redimensionamento depois que ela for concluída (SUCCEEDED), falhar (FAILED) ou depois que um usuário a cancelar (CANCELLED).

Limitações do modelo de instância

Para o modelo de instância usado no MIG em que você quer criar solicitações de redimensionamento, as seguintes limitações se aplicam:

Limitações para o MIG

Para o MIG em que você quer criar solicitações de redimensionamento, as seguintes limitações se aplicam:

Cota para VMs de GPU com duração de execução solicitada

As VMs de GPU configuradas para serem excluídas automaticamente após um tempo de execução predefinido de até 7 dias podem consumir cotas de alocação padrão ou preemptivas. Esse comportamento é intencional para ajudar você a melhorar a capacidade de obtenção da cota de alocação para cargas de trabalho temporárias, mas sem interrupções. Para mais informações sobre este comportamento, consulte VMs de GPU e cotas de alocação preemptivas.

Preços

Não há custos associados à criação, ao cancelamento ou à exclusão de solicitações de redimensionamento. Você só vai receber cobranças pelas VMs criadas por uma solicitação de redimensionamento, desde o momento em que o MIG cria as VMs até que ele as exclua automaticamente no final da duração da execução ou que você as exclua manualmente.

Se um MIG criar apenas algumas das VMs solicitadas e não conseguir criar as demais, você ainda poderá incorrer em cobranças pelas VMs criadas até que o MIG as exclua automaticamente.

A seguir