Neste documento, descrevemos os modelos de provisionamento para instâncias do Compute Engine. Para saber mais sobre as opções de implantação, consulte Escolher uma estratégia de implantação do Compute Engine para sua carga de trabalho.
Os modelos de provisionamento determinam a disponibilidade, o ciclo de vida e o preço das suas instâncias. Se você entender esses modelos, poderá escolher a melhor opção para sua carga de trabalho.
Modelos de provisionamento disponíveis
Ao criar uma instância de computação, é possível especificar um dos seguintes modelos de provisionamento. Se você não especificar um modelo de provisionamento, o Compute Engine usará o modelo padrão por padrão.
Padrão
Spot
Início flexível (pré-lançamento)
Vinculada à reserva
A tabela a seguir ajuda a comparar os casos de uso e os preços de cada modelo de provisionamento:
Padrão | Spot | Início flexível (pré-lançamento) | Vinculada à reserva | |
---|---|---|---|---|
Resumo |
|
|
|
|
Casos de uso |
Ideal para cargas de trabalho que exigem estabilidade e operação contínua, como:
|
Ideal para cargas de trabalho que toleram interrupções, como as seguintes:
|
Cargas de trabalho que exigem estabilidade e precisam ser executadas por no máximo sete dias, como:
|
Ideal para cargas de trabalho que exigem estabilidade e um tempo de execução específico, como:
|
Preços | Você paga os preços padrão das instâncias. Para mais informações, consulte Preços de instâncias de VM. | A maioria das vCPUs, GPUs e SSDs locais está disponível com um desconto de 60% a 91%. Para mais informações, consulte Preços das VMs spot. | Com base na família de máquinas usada pelas suas instâncias, você recebe até 53% de desconto em vCPUs e GPUs. Consulte Preços do Dynamic Workload Scheduler (DWS). |
Com base na família de máquinas usada pelas suas instâncias, você recebe até 53% de desconto em vCPUs e GPUs. Além disso, você recebe cobranças com base em como reserva capacidade para criar instâncias da seguinte forma:
|
Cota | Quando você cria uma instância, a cota padrão é consumida. | Quando você cria uma instância, a cota preemptiva é consumida. Se o projeto não tiver uma cota preemptiva, a cota padrão será consumida. Os créditos do Nível gratuito doGoogle Cloud não se aplicam às VMs do Spot. | Quando o MIG adiciona instâncias ao grupo, a cota preemptiva é consumida. Se o projeto não tiver uma cota preemptiva, a cota padrão será consumida. | A cota não se aplica ao modelo de provisionamento vinculado à reserva. |
Disponibilidade e vida útil da instância
A tabela a seguir mostra a disponibilidade e o ciclo de vida das instâncias de computação para cada modelo de provisionamento:
Padrão | Spot | Início flexível (pré-lançamento) | Vinculada à reserva | |
---|---|---|---|---|
Pré-requisitos de criação | Não há pré-requisitos para a criação. | Não há pré-requisitos para a criação. | Não há pré-requisitos para a criação. |
Para criar instâncias, primeiro reserve capacidade usando um dos seguintes métodos:
Na data e hora de entrega escolhidas, o Compute Engine provisiona a capacidade solicitada. Em seguida, você pode consumir a capacidade criando instâncias. |
Série de máquinas compatível | Você pode usar qualquer série de máquinas, exceto A4X, A4 e A3 Ultra. | É possível usar qualquer série de máquinas, exceto instâncias A4X, G4, X4 e bare metal. |
Você só pode usar as seguintes séries de máquinas: |
Dependendo de como você reserva capacidade para criar VMs, só é possível usar as seguintes séries de máquinas:
|
Disponibilidade da instância | É possível criar instâncias a qualquer momento, desde que os recursos solicitados estejam disponíveis. | É possível criar instâncias a qualquer momento, desde que os recursos solicitados estejam disponíveis. | Só é possível criar instâncias criando solicitações de redimensionamento em um MIG. O Compute Engine usa o DWS para programar o provisionamento da capacidade solicitada com base na disponibilidade de recursos. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs. | Só é possível criar instâncias depois de reservar capacidade para uma data futura. Na data solicitada, o Compute Engine entrega a capacidade pedida, que pode ser usada para criar instâncias. Se você reservar recursos usando reservas adiantadas no modo de calendário, o Compute Engine usará DWS para provisionar a capacidade solicitada. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs. |
Garantia de capacidade | Com base no método de criação. A garantia de capacidade varia de acordo com o método usado para criar instâncias, da seguinte forma:
|
Melhor esforço. Ao criar VMs do Spot, o Compute Engine faz o possível para provisionar a capacidade solicitada. | Melhor esforço. Quando você cria uma solicitação de redimensionamento de MIG, o Compute Engine faz o possível para programar o provisionamento da capacidade solicitada. | Muito alto. Se o Google Cloud aprovar sua solicitação de reserva, você terá uma garantia muito alta de que o Compute Engine vai provisionar a capacidade reservada na data e hora de entrega escolhidas. Você tem acesso exclusivo à capacidade reservada durante o período da reserva. |
Ciclo de vida da instância |
Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos:
|
Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos:
|
As instâncias provisionadas são executadas pela duração escolhida, que pode ser de até sete dias. Não é possível interromper, suspender ou recriar instâncias. O Compute Engine exclui instâncias quando uma das seguintes situações acontece:
|
Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos:
|
A seguir
Leia uma visão geral da criação de instâncias do Compute Engine.
Para criar instâncias usando o modelo de provisionamento spot, consulte VMs spot.
Para criar instâncias usando o modelo de provisionamento de início flexível, consulte Sobre solicitações de redimensionamento em um MIG.
Para reservar capacidade e criar instâncias usando o modelo vinculado à reserva, consulte uma das seguintes opções: