Sobre solicitações de redimensionamento em um MIG


Neste documento, descrevemos como as solicitações de redimensionamento em um grupo gerenciado de instâncias (MIG) funcionam e as limitações delas. Use solicitações de redimensionamento para criar instâncias de máquina virtual (VM) com GPUs de uma só vez em um MIG.

Criar VMs de uma só vez em um MIG por meio de uma solicitação de redimensionamento é útil nos seguintes cenários:

  • Quando você quer VMs de GPU apenas por um tempo específico, uma solicitação de redimensionamento aumenta as chances de conseguir esses recursos com alta demanda.

  • Quando você quiser um número exato de VMs para executar um job, uma solicitação de redimensionamento ajuda a criar VMs de uma só vez. Isso ajuda a evitar cobranças desnecessárias pela capacidade parcial criada pelo Compute Engine enquanto você aguarda a disponibilização de todos os recursos.

Como funcionam as solicitações de redimensionamento

As seções a seguir descrevem como as solicitações de redimensionamento funcionam.

Na criação

Ao criar uma solicitação de redimensionamento, especifique as seguintes propriedades:

  • resizeBy: o número de VMs que você quer criar de uma só vez como parte da solicitação.

  • requestedRunDuration: o tempo de execução das VMs criadas como parte da solicitação. A duração da execução precisa ser entre 10 minutos e 7 dias. No final da duração da execução, o MIG exclui automaticamente as VMs criadas.

Após a criação

Depois que você cria uma solicitação de redimensionamento, o Compute Engine muda o estado dela da seguinte forma:

  • CREATING: o Compute Engine está criando a solicitação de redimensionamento, o tamanho de destino do MIG aumenta pelo número de VMs especificado na solicitação e o MIG cria instâncias gerenciadas que estão em um estado CREATING. Essas instâncias gerenciadas representam as VMs que o MIG cria quando a solicitação de redimensionamento é bem-sucedida.

  • ACCEPTED: a solicitação foi criada e aceita. O mecanismo de programador subjacente, o Dynamic Workload Scheduler (DWS), programa a criação dos recursos solicitados com base na disponibilidade de recursos e na duração da execução especificada na solicitação. Se você não tiver cota para os recursos solicitados ou eles estiverem temporariamente indisponíveis, o DWS vai manter a solicitação até que você tenha cota suficiente e os recursos sejam disponibilizados.

  • SUCCEEDED: o MIG criou o número solicitado de VMs de uma só vez. As VMs são executadas até que o MIG as exclua após o término da execução especificada ou até que você as exclua.

  • FAILED: a solicitação de redimensionamento falhou devido a um erro técnico, e o Compute Engine diminuiu o tamanho de destino do MIG pelo número de VMs solicitadas.

  • CANCELLED: um usuário cancelou a solicitação de redimensionamento. O cancelamento de uma solicitação de redimensionamento impede que o MIG crie os recursos solicitados. Depois de cancelar uma solicitação de redimensionamento, o Compute Engine diminui o tamanho de destino do MIG pelo número de VMs solicitadas e exclui a solicitação automaticamente após 14 dias. Se preferir, você pode excluir uma solicitação de redimensionamento antes que o Compute Engine faça isso automaticamente.

Se você excluir um MIG que contenha solicitações de redimensionamento, essa operação também excluirá todas as solicitações e VMs de redimensionamento no MIG. No entanto, se você excluir um MIG quando ele estiver criando VMs para atender a uma solicitação de redimensionamento, o Compute Engine vai aguardar até que o MIG termine de criar o número solicitado de VMs e o estado da solicitação de redimensionamento seja transferido para SUCCEEDED antes de excluir o MIG.

Limitações

As seções a seguir descrevem as limitações para criar solicitações de redimensionamento em um MIG.

Para solicitações de redimensionamento

Para solicitações de redimensionamento, as seguintes limitações se aplicam:

  • Você pode usar a solicitação de redimensionamento para ter apenas VMs de GPU.

  • Só é possível cancelar as solicitações de redimensionamento aceitas (ACCEPTED).

  • Só é possível excluir uma solicitação de redimensionamento depois que ela for concluída (SUCCEEDED), falhar (FAILED) ou depois que um usuário a cancelar (CANCELLED).

Para o modelo de instância

Para o modelo de instância usado no MIG em que você quer criar solicitações de redimensionamento, as seguintes limitações se aplicam:

Para o MIG

Para o MIG em que você quer criar solicitações de redimensionamento, as seguintes limitações se aplicam:

Cota para VMs de GPU com duração de execução solicitada

As VMs de GPU configuradas para serem excluídas automaticamente após um tempo de execução predefinido de até 7 dias podem consumir cotas de alocação padrão ou preemptivas. Esse comportamento é intencional para ajudar você a melhorar a capacidade de obtenção da cota de alocação para cargas de trabalho temporárias, mas sem interrupções. Para mais informações sobre este comportamento, consulte VMs de GPU e cotas de alocação preemptivas.

Preços

Não há custos associados à criação, ao cancelamento ou à exclusão de solicitações de redimensionamento. Você só vai receber cobranças pelas VMs criadas por uma solicitação de redimensionamento, desde o momento em que o MIG cria as VMs até que ele as exclua automaticamente no final da duração da execução ou que você as exclua manualmente.

Se um MIG criar apenas algumas das VMs solicitadas e não conseguir criar as demais, você ainda poderá incorrer em cobranças pelas VMs criadas até que o MIG as exclua automaticamente.

A seguir