Este documento oferece uma visão geral das VMs de início flexível, detalhando as principais características delas, bem como os requisitos e limitações aplicados ao criá-las.
As VMs de início flexível são instâncias de máquina virtual (VM) projetadas para cargas de trabalho que podem ser iniciadas a qualquer momento. As VMs de início flexível começam quando os recursos estão disponíveis e são executadas por até sete dias. Você cria VMs de início flexível usando o modelo de provisionamento de início flexível. Esse modelo depende do Dynamic Workload Scheduler (DWS) para provisionar recursos de um pool seguro de capacidade, aumentando suas chances de conseguir recursos de alta demanda, como GPUs.
As VMs de início flexível são ideais para executar as seguintes cargas de trabalho:
Pré-treinamento de modelo pequeno
Ajuste de modelos
Simulação de computação de alto desempenho (HPC)
Inferência em lote
As VMs de início flexível são compatíveis com todos os tipos de máquina otimizados para aceleradores (exceto A4X e G4) e com os tipos de máquina H4D. Para os tipos de máquina A4, A3, A2 e H4D, você recebe vCPUs, memória e GPUs anexadas a um preço com desconto.
Para cargas de trabalho que exigem recursos por mais de sete dias ou com uma garantia de capacidade maior, é possível criar uma solicitação de reserva adiantada no modo de calendário para ainda se beneficiar dos descontos do DWS.
Principais características das VMs de início flexível
Em comparação com outros tipos de instâncias do Compute Engine, as VMs de início flexível têm as seguintes características:
Um tempo de espera para alocar recursos: é possível criar VMs de início flexível antes que o Compute Engine aloque os recursos solicitados. No entanto, as VMs só serão iniciadas se os recursos ficarem disponíveis dentro do período especificado. Se os recursos não estiverem disponíveis, a solicitação de criação da VM vai falhar.
Para mais informações, consulte Tempo de espera da VM de início flexível neste documento.
Duração limitada: as VMs de início flexível podem ser executadas por até sete dias. Depois desse período, o Compute Engine interrompe ou exclui automaticamente as VMs com base na ação de encerramento especificada nas propriedades da VM.
Para mais informações, consulte Duração limitada da execução de VMs de início flexível neste documento.
Modelo de provisionamento de início flexível: você cria VMs de início flexível usando esse modelo. Esse modelo oferece melhor disponibilidade de recursos e preços com desconto em comparação com as VMs criadas usando o modelo de provisionamento padrão.
Para mais informações sobre cada modelo de provisionamento, consulte Modelos de provisionamento de instâncias do Compute Engine.
Tempo de espera da VM de início flexível
Quando você cria uma VM de início flexível, ela não é iniciada imediatamente. O Compute Engine tenta alocar os recursos solicitados e iniciar a VM em um período específico. Se você tiver cota suficiente para os recursos solicitados e o Compute Engine os alocar até o final do tempo de espera, a VM de início flexível será iniciada em até dois minutos após a disponibilidade da capacidade. Caso contrário, a solicitação de criação da VM vai falhar.
O tempo de espera varia de acordo com o método usado para criar VMs:
Tempo de espera de VMs independentes de início flexível
Para criar uma VM independente de início flexível, especifique um tempo de espera usando o campo requestValidForDuration
. É possível definir um tempo de espera de zero segundos ou entre 90 segundos e 7.200 segundos (duas horas).
Com base nos requisitos zonais da sua carga de trabalho, recomendamos os seguintes tempos de espera para aumentar as chances de sucesso da solicitação de criação de VM de início flexível:
Requisitos zonais estritos: se a carga de trabalho exigir a criação de uma VM de início flexível em uma zona específica, recomendamos que você defina o campo
requestValidForDuration
como 90 segundos ou mais, até duas horas. Quanto mais tempo você esperar, maiores serão suas chances de conseguir recursos. A VM permanece no estadoPENDING
durante todo esse período.Sem requisitos zonais: se a VM de início flexível puder ser executada em qualquer zona da região, recomendamos definir o campo
requestValidForDuration
como zero segundos. Esse valor especifica que o Compute Engine só aloca recursos se eles estiverem disponíveis imediatamente. Se a solicitação falhar porque os recursos não estão disponíveis, tente criar a VM Flex-start em uma zona diferente.
Para interromper uma solicitação de criação de VM enquanto o Compute Engine tenta alocar recursos, exclua a VM de início flexível.
Tempo de espera das solicitações de redimensionamento do MIG
Se você adicionar VMs de início flexível de uma só vez a um grupo gerenciado de instâncias (MIG) usando solicitações de redimensionamento, o tempo de espera para provisionar todos os recursos solicitados será indefinido. Depois de criar uma solicitação de redimensionamento do MIG, ela permanece no estado ACCEPTED
até que os recursos fiquem disponíveis. Se e quando os recursos solicitados ficarem disponíveis, o estado da solicitação de redimensionamento do MIG mudará para SUCCEEDED
, e o Compute Engine criará as VMs de início flexível.
Para interromper uma solicitação de criação de VM enquanto o Compute Engine tenta alocar recursos, cancele a solicitação de redimensionamento do MIG. Para mais informações, consulte Sobre solicitações de redimensionamento de MIG.
Duração limitada da execução de uma VM de início flexível
Ao criar uma VM de início flexível, especifique o seguinte:
A duração da execução da VM: especifique por quanto tempo as VMs podem ser executadas. A duração da execução pode ser entre 10 minutos e 7 dias. Se você não precisar mais das VMs, poderá interromper ou excluir as VMs autônomas ou excluir as VMs criadas usando uma solicitação de redimensionamento do MIG.
A ação de encerramento da VM: escolha se o Compute Engine vai parar ou excluir automaticamente as VMs ao final da duração da execução.
Cota
Para criar ou reiniciar uma VM de início flexível, é preciso ter cota preemptiva suficiente para as vCPUs, a memória e as GPUs ou os discos SSD locais anexados.
Se você tentar criar ou reiniciar uma VM de início flexível sem cota suficiente, uma das seguintes situações vai ocorrer:
Solicitações de criação de VM: sua solicitação permanece pendente até que você adquira cota suficiente. Se você não adquirir a cota necessária antes do fim do tempo de espera, a solicitação vai falhar.
Solicitações de reinicialização da VM: sua solicitação falha imediatamente.
Preços
Para VMs de início flexível, as cobranças são feitas da seguinte forma:
Você paga conforme usa (PAYG). Para mais informações sobre o preço de uma VM durante o ciclo de vida dela, consulte Preços.
Para os tipos de máquina A4, A3, A2 e H4D, você recebe vCPUs, memória e GPUs anexadas a um preço com desconto. Outros tipos de máquinas com otimização para aceleradores não estão qualificados para descontos. Para mais informações, consulte Preços do DWS.
Limitações
As VMs de início flexível têm as seguintes limitações:
As VMs de início flexível só podem usar os seguintes tipos de máquina:
Qualquer tipo de máquina com otimização para acelerador, exceto A4X e G4
Tipos de máquina H4D
É necessário criar VMs de início flexível usando o modelo de provisionamento de início flexível.
Você precisa especificar se as VMs de início flexível serão interrompidas ou excluídas ao final da duração da execução usando os campos
instanceTerminationAction
emaxRunDuration
.É necessário interromper as VMs de início flexível durante eventos de manutenção do host.
Não é possível aplicar políticas de posicionamento a VMs de início flexível.
Não é possível usar reservas.
A seguir
Para saber como criar uma VM independente de início flexível, consulte Criar uma VM de início flexível.
Para saber mais sobre como criar várias VMs de início flexível de uma só vez em um MIG, consulte Sobre solicitações de redimensionamento de MIG.
Faça um teste
Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho do Compute Engine em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
Faça uma avaliação gratuita do Compute Engine