Este documento fornece uma vista geral das VMs de início flexível, detalhando as respetivas características principais, bem como os requisitos e as limitações que aplica quando as cria.
As VMs de início flexível são instâncias de máquinas virtuais (VMs) concebidas para cargas de trabalho que podem ser iniciadas em qualquer altura. As VMs de início flexível são iniciadas quando os recursos estão disponíveis e são executadas durante um máximo de sete dias. Cria VMs de início flexível através do modelo de aprovisionamento de início flexível. Este modelo baseia-se no programador de cargas de trabalho dinâmicas (DWS) para aprovisionar recursos a partir de um conjunto seguro de capacidade, o que aumenta as suas probabilidades de obter recursos de elevada procura, como GPUs.
As VMs de início flexível são ideais para executar as seguintes cargas de trabalho:
Pré-treino de modelos pequenos
Ajuste do modelo
Simulação de computação de alto desempenho (HPC)
Inferência em lote
As VMs de início flexível suportam todos os tipos de máquinas otimizados para aceleradores (exceto A4X e G4) e os tipos de máquinas H4D. Para os tipos de máquinas A4, A3, A2 e H4D, obtém vCPUs, memória e quaisquer GPUs anexadas a um preço com desconto.
Para cargas de trabalho que requerem recursos durante mais de sete dias ou com uma garantia de capacidade superior, pode criar um pedido de reserva futura no modo de calendário para continuar a beneficiar dos descontos de DWS.
Principais caraterísticas das VMs de início flexível
Em comparação com outros tipos de instâncias do Compute Engine, as VMs de início flexível têm as seguintes caraterísticas:
Um tempo de espera para a atribuição de recursos: pode criar VMs de início flexível antes de o Compute Engine poder atribuir os recursos pedidos. No entanto, as VMs só são iniciadas se os recursos ficarem disponíveis no período especificado. Se os recursos não estiverem disponíveis, o pedido de criação da VM falha
Para mais informações, consulte a secção Tempo de espera do início flexível da VM neste documento.
Uma duração de execução limitada: as VMs de início flexível podem ser executadas durante um máximo de sete dias. Após esse período, o Compute Engine para ou elimina automaticamente as VMs com base na ação de encerramento especificada nas propriedades da VM.
Para mais informações, consulte o artigo Duração de execução limitada da VM de início flexível neste documento.
O modelo de aprovisionamento de início flexível: cria VMs de início flexível através do modelo de aprovisionamento de início flexível. Este modelo de aprovisionamento oferece uma melhor disponibilidade de recursos e preços com desconto em comparação com as VMs que cria através do modelo de aprovisionamento padrão.
Para mais informações sobre cada modelo de aprovisionamento, consulte o artigo Modelos de aprovisionamento de instâncias do Compute Engine.
Tempo de espera da VM de início flexível
Quando cria uma VM de início flexível, a VM não é iniciada imediatamente. O Compute Engine tenta atribuir os recursos pedidos e iniciar a VM num prazo específico. Se tiver quota suficiente para os recursos pedidos e o Compute Engine os atribuir até ao final do tempo de espera, a VM de início flexível é iniciada no prazo de dois minutos após a disponibilidade de capacidade. Caso contrário, o pedido de criação de VM falha.
O tempo de espera varia consoante o método que usa para criar VMs:
Tempo de espera das VMs de início flexível autónomas
Para criar uma VM de início flexível autónoma, tem de especificar um tempo de espera
através do campo requestValidForDuration
. Pode definir um tempo de espera de zero segundos ou entre 90 segundos e 7200 segundos (duas horas).
Com base nos requisitos zonais da sua carga de trabalho, recomendamos os seguintes tempos de espera para ajudar a aumentar as probabilidades de êxito do pedido de criação de VMs de início flexível:
Requisitos zonais rigorosos: se a sua carga de trabalho exigir que crie uma VM de início flexível numa zona específica, recomendamos que defina o campo
requestValidForDuration
para 90 segundos ou mais, até duas horas. Os tempos de espera mais longos ajudam a aumentar as suas hipóteses de obter recursos. A VM permanece no estadoPENDING
durante este período.Sem requisitos zonais: se a VM de início flexível puder ser executada em qualquer zona na região, recomendamos que defina o campo
requestValidForDuration
para zero segundos. Este valor especifica que o Compute Engine só atribui recursos se estiverem imediatamente disponíveis. Se o seu pedido falhar porque os recursos estão indisponíveis, experimente criar a VM de início flexível numa zona diferente.
Para parar um pedido de criação de VM enquanto o Compute Engine tenta atribuir recursos, elimine a VM de início flexível.
Tempo de espera dos pedidos de redimensionamento do MIG
Se adicionar VMs de início flexível de uma só vez a um grupo de instâncias gerido (MIG) através de pedidos de redimensionamento, o tempo de espera para aprovisionar todos os recursos pedidos é indefinido. Depois de criar um pedido de redimensionamento de MIG, o pedido permanece no estado ACCEPTED
até que os recursos fiquem disponíveis. Quando os recursos pedidos ficarem disponíveis, o estado do pedido de redimensionamento do MIG muda para SUCCEEDED
e o Compute Engine cria as VMs de início flexível.
Para parar um pedido de criação de VM enquanto o Compute Engine tenta atribuir recursos, cancele o pedido de redimensionamento do MIG. Para mais informações, consulte o artigo Acerca dos pedidos de redimensionamento de MIGs.
Duração de execução limitada da VM de início flexível
Quando cria uma VM de início flexível, tem de especificar o seguinte:
A duração da execução da VM: tem de especificar durante quanto tempo as VMs podem ser executadas. A duração da execução pode ser entre 10 minutos e 7 dias. Se já não precisar das VMs, pode parar ou eliminar opcionalmente as VMs autónomas ou eliminar as VMs criadas através de um pedido de redimensionamento de MIG.
A ação de encerramento da VM: tem de escolher se o Compute Engine para ou elimina automaticamente as VMs no final da respetiva duração de execução.
Quota
Para criar ou reiniciar uma VM de início flexível, tem de ter uma quota preemptível suficiente para as vCPUs, a memória e quaisquer GPUs ou discos SSD locais anexados pedidos.
Se tentar criar ou reiniciar uma VM de início flexível sem uma quota suficiente, ocorre uma das seguintes situações:
Pedidos de criação de VMs: o seu pedido permanece pendente até adquirir quota suficiente. Se não adquirir a quota necessária antes do fim do tempo de espera, o pedido falha.
Pedidos de reinício de VMs: o pedido falha imediatamente.
Preços
Para VMs de início flexível, incorre em custos da seguinte forma:
Paga mediante utilização (PAYG). Para mais informações sobre o preço de uma VM durante o respetivo ciclo de vida, consulte a secção Preços.
Para os tipos de máquinas A4, A3, A2 e H4D, obtém vCPUs, memória e quaisquer GPUs anexadas a um preço com desconto. Outros tipos de máquinas otimizados para aceleradores suportados não são elegíveis para descontos. Para mais informações, consulte os preços do DWS.
Limitações
As VMs de início flexível têm as seguintes limitações:
As VMs de início flexível só podem usar os seguintes tipos de máquinas:
Qualquer tipo de máquina otimizado pelo acelerador, exceto A4X e G4
Tipos de máquinas H4D
Tem de criar VMs de início flexível através do modelo de aprovisionamento de início flexível.
Tem de especificar se quer parar ou eliminar VMs de início flexível no final da respetiva duração de execução através dos campos
instanceTerminationAction
emaxRunDuration
.Tem de parar as VMs de início flexível durante os eventos de manutenção do anfitrião.
Não pode aplicar políticas de posicionamento a VMs de início flexível.
Não pode usar as reservas.
O que se segue?
Para saber como criar uma VM de início flexível autónoma, consulte o artigo Crie uma VM de início flexível.
Para saber como criar várias VMs de início flexível ao mesmo tempo num MIG, consulte o artigo Acerca dos pedidos de redimensionamento do MIG.
Experimente
Se está a usar o Google Cloud pela primeira vez, crie uma conta para avaliar o desempenho do Compute Engine em cenários reais. Os novos clientes também recebem 300 USD em créditos gratuitos para executar, testar e implementar cargas de trabalho.
Experimente o Compute Engine gratuitamente