Os modelos de provisionamento determinam a disponibilidade, o ciclo de vida e o preço das suas instâncias. Se você entender esses modelos, poderá escolher a melhor opção para sua carga de trabalho.
Modelos de provisionamento disponíveis
Ao criar uma instância de computação, é possível especificar um dos seguintes modelos de provisionamento. Se você não especificar um modelo de provisionamento, o Compute Engine usará o modelo padrão por padrão.
Com base na disponibilidade de recursos, é possível criar instâncias imediatamente.
Você pode controlar quando interromper ou excluir instâncias.
Com base na disponibilidade de recursos, é possível criar instâncias imediatamente.
Você pode controlar quando interromper ou excluir instâncias. No entanto, você
também permite que o Compute Engine interrompa ou exclua instâncias a qualquer
momento para recuperar a capacidade.
Depois de criar um grupo gerenciado de instâncias (MIG) zonal, peça ao Compute Engine para adicionar instâncias com GPUs anexadas ao MIG. O Compute Engine programa o provisionamento das
instâncias com base na disponibilidade de recursos.
Você pode controlar quando excluir instâncias. No entanto, não é possível interromper,
suspender ou recriar esses itens. As instâncias são executadas por até sete dias.
Em seguida, o Compute Engine os exclui.
É possível solicitar a reserva de capacidade em uma data futura para criar
instâncias com GPUs anexadas. Se Google Cloud aprovar sua solicitação,
o Compute Engine vai criar uma reserva. No início do período de reserva, é possível consumir a reserva criando instâncias de GPU que correspondam a ela.
Durante o período de reserva aprovado, é possível parar, reiniciar, excluir e recriar instâncias para consumir a reserva conforme necessário.
Quando o período de reserva termina, o Compute Engine exclui a reserva e interrompe ou exclui todas as instâncias que a consomem.
Casos de uso
Ideal para cargas de trabalho que exigem estabilidade e operação contínua, como:
Servidores da Web
Bancos de dados
Aplicativos empresariais
Desenvolvimento e teste
Ideal para cargas de trabalho que podem tolerar interrupções, como as
seguintes:
Processamento em lote
Computação de alto desempenho (HPC)
Integração e implantação contínuas (CI/CD)
Análise de dados
Codificação de mídia
Inferência on-line
Cargas de trabalho que exigem estabilidade e precisam ser executadas por no máximo sete dias, como as seguintes:
Pré-treinamento de modelo pequeno
Ajuste de modelos
Simulação de HPC
Inferência em lote
Ideal para cargas de trabalho que exigem estabilidade e um tempo de execução específico, como:
Para cargas de trabalho que duram até 90 dias:
Jobs de pré-treinamento de modelo
Jobs de ajuste de modelo
Cargas de trabalho de simulação de HPC
Aumentos esperados de curto prazo nas cargas de trabalho de inferência
Com base na família de máquinas usada pelas suas instâncias, você recebe até 53% de desconto em vCPUs e GPUs. Além disso, você vai receber cobranças com base
em como reserva capacidade para criar instâncias da seguinte forma:
Na data e hora de entrega escolhidas, o Compute Engine provisiona
a capacidade solicitada. Em seguida, você pode consumir a capacidade criando instâncias.
Série de máquinas compatível
É possível usar qualquer série de máquinas, exceto A4X, A4 e A3 Ultra.
É possível usar qualquer série de máquinas, exceto as seguintes:
M2 e M3
G4
Instâncias bare metal
Você só pode usar as seguintes séries de máquinas:
É possível criar instâncias a qualquer momento, desde que os recursos solicitados estejam disponíveis.
É possível criar instâncias a qualquer momento, desde que os recursos solicitados estejam disponíveis.
Só é possível criar instâncias criando
solicitações de redimensionamento em um MIG. O Compute Engine usa o
DWS para programar o provisionamento da capacidade solicitada com base na
disponibilidade de recursos. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs.
Só é possível criar instâncias depois de reservar capacidade para uma data futura. Na data solicitada, o Compute Engine entrega a capacidade pedida, que pode ser usada para criar instâncias. Se você
reservar recursos usando reservas adiantadas no modo de calendário, o
Compute Engine usará
DWS para provisionar a capacidade solicitada. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs.
Ciclo de vida da instância
Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos:
Se o tipo de máquina usado pela instância não for compatível com a migração em tempo real, o Compute Engine vai interromper as instâncias durante os eventos de manutenção do host.
Em casos raros, a instância pode ser interrompida devido a um erro do host.
Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos:
O Compute Engine pode interromper ou excluir a instância a qualquer
momento para recuperar a capacidade. Esse processo é chamado de
preempção.
Se o tipo de máquina usado pela instância não for compatível com a migração
em tempo real, o Compute Engine vai interromper as instâncias durante os
eventos de
manutenção do host.
Em casos raros, a instância pode ser interrompida devido a um erro do host.
As instâncias provisionadas são executadas durante o período escolhido, que pode ser de até sete dias. Não é possível interromper, suspender ou recriar instâncias.
O Compute Engine exclui instâncias quando uma das seguintes situações
acontece:
Você solicita a exclusão de instâncias.
As instâncias atingem o fim da duração da execução.
Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos:
A reserva criada automaticamente para provisionar a capacidade solicitada atinge o fim do período de reserva comprometida. Nesse momento, o Compute Engine exclui a reserva e interrompe ou exclui todas as instâncias que a consomem.
Em casos raros, a instância pode ser interrompida devido a um erro do host.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-04 UTC."],[],[],null,["# Compute Engine instances provisioning models\n\nLinux Windows\n\n*** ** * ** ***\n\nThis document describes the provisioning models for Compute Engine instances.\nTo learn more about deployment options, see\n[Choose a Compute Engine deployment strategy for your workload](/compute/docs/choose-compute-deployment-option).\n\n*Provisioning models* determine the availability, lifespan, and pricing of your\ninstances. If you understand these models, then you can choose the best option\nfor your workload.\n\nAvailable provisioning models\n-----------------------------\n\nWhen you create a compute instance, you can specify one of the following\nprovisioning models. If you don't specify a provisioning model, then\nCompute Engine uses the standard provisioning model by default.\n\n- Standard\n\n- Spot\n\n- Flex-start ([Preview](/products#product-launch-stages))\n\n- Reservation-bound\n\nThe following table helps you compare the use cases and pricing for each\nprovisioning model:\n\nInstance availability and lifespan\n----------------------------------\n\nThe following table shows you the compute instances availability and lifespan\nfor each provisioning model:\n\nWhat's next\n-----------\n\n- Read an\n [overview of creating Compute Engine instances](/compute/docs/instances/instance-creation-overview).\n\n- To create instances by using the spot provisioning model, see\n [Spot VMs](/compute/docs/instances/spot).\n\n- To create instances by using the flex-start provisioning model, see\n [About resize requests in a MIG](/compute/docs/instance-groups/about-resize-requests-mig).\n\n- To reserve capacity to create instances by using the reservation-bound\n model, see one of the following options:\n\n - [About future reservation requests in calendar mode](/compute/docs/instances/future-reservations-calendar-mode-overview)\n\n - [Reserve capacity in AI Hypercomputer](/ai-hypercomputer/docs/reserve-capacity)"]]