Neste documento, descrevemos como as solicitações de redimensionamento em um grupo gerenciado de instâncias (MIG) funcionam e as limitações delas. Use solicitações de redimensionamento para criar instâncias de máquina virtual (VM) com GPUs de uma só vez em um MIG.
Criar VMs de uma só vez em um MIG por meio de uma solicitação de redimensionamento é útil nos seguintes cenários:
Quando você quer VMs de GPU apenas por um tempo específico, uma solicitação de redimensionamento aumenta as chances de conseguir esses recursos com alta demanda.
Quando você quiser um número exato de VMs para executar um job, uma solicitação de redimensionamento ajuda a criar VMs de uma só vez. Isso ajuda a evitar cobranças desnecessárias pela capacidade parcial criada pelo Compute Engine enquanto você aguarda a disponibilização de todos os recursos.
Como funcionam as solicitações de redimensionamento
As seções a seguir descrevem como as solicitações de redimensionamento funcionam.
Na criação
Ao criar uma solicitação de redimensionamento, especifique as seguintes propriedades:
resizeBy
: o número de VMs que você quer criar de uma só vez como parte da solicitação.requestedRunDuration
: o tempo de execução das VMs criadas como parte da solicitação. A duração da execução precisa ser entre 10 minutos e 7 dias. No final da duração da execução, o MIG exclui automaticamente as VMs criadas.
Após a criação
Depois que você cria uma solicitação de redimensionamento, o Compute Engine muda o estado dela da seguinte forma:
CREATING
: o Compute Engine está criando a solicitação de redimensionamento, o tamanho de destino do MIG aumenta pelo número de VMs especificado na solicitação e o MIG cria instâncias gerenciadas que estão em um estadoCREATING
. Essas instâncias gerenciadas representam as VMs que o MIG cria quando a solicitação de redimensionamento é bem-sucedida.ACCEPTED
: a solicitação foi criada e aceita. O mecanismo de programador subjacente, o Dynamic Workload Scheduler (DWS), programa a criação dos recursos solicitados com base na disponibilidade de recursos e na duração da execução especificada na solicitação. Se você não tiver cota para os recursos solicitados ou eles estiverem temporariamente indisponíveis, o DWS vai manter a solicitação até que você tenha cota suficiente e os recursos sejam disponibilizados.SUCCEEDED
: o MIG criou o número solicitado de VMs de uma só vez. As VMs são executadas até que o MIG as exclua após o término da execução especificada ou até que você as exclua.FAILED
: a solicitação de redimensionamento falhou devido a um erro técnico, e o Compute Engine diminuiu o tamanho de destino do MIG pelo número de VMs solicitadas.CANCELLED
: um usuário cancelou a solicitação de redimensionamento. O cancelamento de uma solicitação de redimensionamento impede que o MIG crie os recursos solicitados. Depois de cancelar uma solicitação de redimensionamento, o Compute Engine diminui o tamanho de destino do MIG pelo número de VMs solicitadas e exclui a solicitação automaticamente após 14 dias. Se preferir, você pode excluir uma solicitação de redimensionamento antes que o Compute Engine faça isso automaticamente.
Se você excluir um MIG que contenha solicitações de redimensionamento, essa operação também excluirá
todas as solicitações e VMs de redimensionamento no MIG. No entanto, se você excluir um MIG quando ele estiver criando VMs para atender a uma solicitação de redimensionamento, o Compute Engine vai aguardar até que o MIG termine de criar o número solicitado de VMs e o estado da solicitação de redimensionamento seja transferido para SUCCEEDED
antes de excluir o MIG.
Limitações
As seções a seguir descrevem as limitações para criar solicitações de redimensionamento em um MIG.
Para solicitações de redimensionamento
Para solicitações de redimensionamento, as seguintes limitações se aplicam:
Você pode usar a solicitação de redimensionamento para ter apenas VMs de GPU.
Só é possível cancelar as solicitações de redimensionamento aceitas (
ACCEPTED
).Só é possível excluir uma solicitação de redimensionamento depois que ela for concluída (
SUCCEEDED
), falhar (FAILED
) ou depois que um usuário a cancelar (CANCELLED
).
Para o modelo de instância
Para o modelo de instância usado no MIG em que você quer criar solicitações de redimensionamento, as seguintes limitações se aplicam:
É necessário especificar a interrupção das VMs durante os eventos de manutenção do host.
É necessário especificar para não usar reservas.
Não é possível especificar VMs spot.
Não é possível especificar políticas de posicionamento.
Não é possível especificar os campos
maxRunDuration
outerminationTime
.
Para o MIG
Para o MIG em que você quer criar solicitações de redimensionamento, as seguintes limitações se aplicam:
Em um MIG regional, apenas a forma de distribuição de destino
ANY_SINGLE_ZONE
oferece suporte à solicitação de redimensionamento (pré-lançamento). Os outros formatos de distribuição não são compatíveis.É necessário desativar os reparos no MIG.
Não é possível aplicar atualizações de configuração às VMs criadas por solicitações de redimensionamento. Para evitar atualizações automáticas, defina o tipo de atualização do MIG como oportunista.
Não é possível aplicar a configuração de todas as instâncias a VMs criadas por meio de solicitações de redimensionamento.
Não é possível definir configurações por instância em VMs criadas por solicitações de redimensionamento.
Só é possível definir o modo de pool em espera do MIG como
manual
(padrão).Se um MIG tiver solicitações de redimensionamento aceitas, não será possível fazer o seguinte:
Não é possível adicionar um segundo modelo de instância para iniciar uma atualização canário no MIG.
Não é possível alterar o tamanho de destino do MIG.
Não é possível excluir as instâncias gerenciadas em um status
CREATING
que o MIG cria para uma solicitação de redimensionamento. Para excluir essas instâncias gerenciadas, cancele a solicitação de redimensionamento.Não é possível recriar, suspender ou parar uma VM criada com uma solicitação de redimensionamento.
Cota para VMs de GPU com duração de execução solicitada
As VMs de GPU configuradas para serem excluídas automaticamente após um tempo de execução predefinido de até 7 dias podem consumir cotas de alocação padrão ou preemptivas. Esse comportamento é intencional para ajudar você a melhorar a capacidade de obtenção da cota de alocação para cargas de trabalho temporárias, mas sem interrupções. Para mais informações sobre este comportamento, consulte VMs de GPU e cotas de alocação preemptivas.Preços
Não há custos associados à criação, ao cancelamento ou à exclusão de solicitações de redimensionamento. Você só vai receber cobranças pelas VMs criadas por uma solicitação de redimensionamento, desde o momento em que o MIG cria as VMs até que ele as exclua automaticamente no final da duração da execução ou que você as exclua manualmente.
Se um MIG criar apenas algumas das VMs solicitadas e não conseguir criar as demais, você ainda poderá incorrer em cobranças pelas VMs criadas até que o MIG as exclua automaticamente.
A seguir
Saiba como criar solicitações de redimensionamento em um MIG.
Saiba como visualizar, cancelar ou excluir solicitações de redimensionamento em um MIG.