Esta página foi traduzida pela API Cloud Translation.

Modelos de aprovisionamento de instâncias do Compute Engine

Linux Windows

Este documento descreve os modelos de aprovisionamento para instâncias do Compute Engine. Para saber mais sobre as opções de implementação, consulte o artigo Escolha uma estratégia de implementação do Compute Engine para a sua carga de trabalho.

Os modelos de aprovisionamento determinam a disponibilidade, a duração e os preços das suas instâncias. Se compreender estes modelos, pode escolher a melhor opção para a sua carga de trabalho.

Modelos de aprovisionamento disponíveis

Quando cria uma instância de computação, pode especificar um dos seguintes modelos de aprovisionamento. Se não especificar um modelo de aprovisionamento, o Compute Engine usa o modelo de aprovisionamento padrão por predefinição.

Standard
Espaço
Flex-start
Restrito a reserva

A tabela seguinte ajuda a comparar os exemplos de utilização e os preços de cada modelo de aprovisionamento:

	Standard	Espaço	Flex-start	Restrito a reserva
Resumo	Com base na disponibilidade de recursos, pode criar imediatamente instâncias. Pode controlar quando parar ou eliminar instâncias.	Com base na disponibilidade de recursos, pode criar imediatamente instâncias. Pode controlar quando parar ou eliminar instâncias. No entanto, também permite que o Compute Engine pare ou elimine instâncias em qualquer altura para reaver capacidade.	Depois de criar um grupo de instâncias geridas (MIG) zonal, pede ao Compute Engine para adicionar instâncias com GPUs anexadas ao MIG. O Compute Engine agenda o aprovisionamento das instâncias com base na disponibilidade de recursos. Pode controlar quando eliminar instâncias. No entanto, não pode pará-los, suspender nem recriá-los. As instâncias são executadas durante um máximo de sete dias. Em seguida, o Compute Engine elimina-os.	Pode pedir para reservar capacidade numa data futura para criar instâncias com GPUs anexadas. Se a Google Google Cloud aprovar o seu pedido, o Compute Engine cria uma reserva. No início do período de reserva, pode consumir a reserva criando instâncias de GPU que correspondam à reserva. Durante o período de reserva aprovado, pode parar, reiniciar, eliminar e recriar instâncias para consumir a reserva conforme necessário. Quando o período de reserva termina, o Compute Engine elimina a reserva e para ou elimina todas as instâncias que consomem a reserva.
Exemplos de utilização	Ideais para cargas de trabalho que requerem estabilidade e funcionamento contínuo, como as seguintes cargas de trabalho: Servidores Web Bases de dados Aplicações empresariais Desenvolvimento e testes	Ideais para cargas de trabalho que podem tolerar interrupções, como as seguintes cargas de trabalho: Processamento em lote Informática de elevado desempenho (HPC) Integração contínua e implementação contínua (CI/CD) Análise de dados Codificação de multimédia Inferência online	Cargas de trabalho que requerem estabilidade e têm de ser executadas durante, no máximo, sete dias, como as seguintes cargas de trabalho: Pré-treino de modelos pequenos Ajuste do modelo Simulação de HPC Inferência em lote	Ideal para cargas de trabalho que requerem estabilidade e um tempo de execução específico, como as seguintes: Para cargas de trabalho com duração máxima de 90 dias: Tarefas de pré-treino de modelos Tarefas de ajuste do modelo Cargas de trabalho de simulação de HPC Aumentos esperados a curto prazo nas cargas de trabalho de inferência Para cargas de trabalho com mais de 90 dias: Cargas de trabalho de preparação Cargas de trabalho de inferência
Preços	Incorre em preços padrão para instâncias. Veja os preços das instâncias de VM. Incorre em custos com base no método que usa para criar instâncias: Se criar instâncias imediatamente, paga à medida que usa (PAYG). Se criar instâncias através de uma reserva a pedido ou uma reserva criada automaticamente para uma reserva futura, então é-lhe cobrado o valor até a reserva existir. Para mais informações, consulte a faturação de reservas.	Recebe descontos entre 60% e 91% na maioria das vCPUs, na memória e nas GPUs. Além disso, recebe descontos mais pequenos para quaisquer tipos de máquinas A4 ou A3 e GPUs, discos SSD locais, endereços IP externos e custos de rede de Tier_1. Para mais informações, consulte os preços das VMs de capacidade instantânea. Paga à medida que usa.	Com base na série de máquinas que as suas instâncias usam, recebe um desconto da seguinte forma: Para as séries de máquinas A4, A3 e A2, recebe um desconto de 53% nas vCPUs, na memória e nas GPUs. Para a série de máquinas H4D, recebe um desconto de 25% nas vCPUs e na memória. Outras séries de máquinas suportadas não são elegíveis para descontos. Para mais informações, consulte os preços do Dynamic Workload Scheduler (DWS). Paga à medida que usa.	Incorre em custos com base na forma como reserva capacidade para criar instâncias da seguinte forma: Se reservar capacidade no AI Hypercomputer, incorre em custos com base nos preços das VMs otimizadas para aceleradores. Se reservar recursos durante um ano ou mais, tem de comprar e anexar um compromisso baseado em recursos aos seus recursos reservados. Se reservar capacidade através de reservas futuras no modo de calendário, incorre em custos com base nos preços do Dynamic Workload Scheduler (DWS). O valor é cobrado pelo período de reserva. Para mais informações, consulte a faturação de reservas.
Quota	Quando cria uma instância, é consumida a quota padrão.	Quando cria uma instância, é consumida a quota de instâncias preemptíveis . Se o seu projeto não tiver quota preemptível, é consumida a quota padrão. Google Cloud Os créditos do nível gratuito não se aplicam a VMs do Spot.	Quando o MIG adiciona instâncias ao grupo, a quota preemptível é consumida. Se o seu projeto não tiver quota preemptível, a quota padrão é consumida.	A quota não se aplica ao modelo de aprovisionamento associado a reservas.

Disponibilidade e duração das instâncias

A tabela seguinte mostra a disponibilidade e a duração das instâncias de computação para cada modelo de aprovisionamento:

	Standard	Espaço	Flex-start	Restrito a reserva
Pré-requisitos de criação	Não existem pré-requisitos de criação.	Não existem pré-requisitos de criação.	Não existem pré-requisitos de criação.	Para criar instâncias, primeiro tem de reservar capacidade através de um dos seguintes métodos: Para reservar capacidade para cargas de trabalho de longa duração, use reservas futuras no AI Hypercomputer. Para reservar capacidade para cargas de trabalho que são executadas durante um período máximo de 90 dias, use reservas futuras no modo de calendário. Na data e hora de entrega escolhidas, o Compute Engine aprovisiona a capacidade pedida. Em seguida, pode consumir a capacidade criando instâncias.
Séries de máquinas suportadas	Pode usar qualquer série de máquinas, exceto A4X, A4 e A3 Ultra.	Pode usar qualquer série de máquinas, exceto instâncias A4X, X4 e bare metal.	Só pode usar as seguintes séries de máquinas: Séries de máquinas A4, A3, A2 e G2 Instâncias de máquinas virtuais (VMs) N1 com GPUs anexadas Série de máquinas H4D	Com base na forma como reserva capacidade para criar VMs, só pode usar as seguintes séries de máquinas: Se reservar capacidade no AI Hypercomputer, só pode usar as séries de máquinas A4X, A4 e A3 Ultra. Se criar uma reserva futura no modo de calendário, só pode usar as séries de máquinas A4 e A3 Ultra.
Disponibilidade da instância	Pode criar instâncias em qualquer altura, desde que os recursos pedidos estejam disponíveis.	Pode criar instâncias em qualquer altura, desde que os recursos pedidos estejam disponíveis.	Pode criar instâncias da seguinte forma: Crie uma instância autónoma. Crie um pedido de redimensionamento do MIG. O Compute Engine usa o DWS para agendar o aprovisionamento da capacidade pedida com base na disponibilidade de recursos. O DWS ajuda a obter recursos de elevada procura, como GPUs.	Só pode criar instâncias depois de reservar capacidade para uma data futura. Na data pedida, o Compute Engine fornece a capacidade pedida, que pode usar para criar instâncias. Se reservar recursos através de reservas futuras no modo de calendário, o Compute Engine usa o DWS para aprovisionar a capacidade pedida. O DWS ajuda a obter recursos de elevada procura, como GPUs.
Garantia de capacidade	Com base no método de criação. A garantia de capacidade varia consoante o método que usa para criar instâncias, da seguinte forma: Se criar instâncias imediatamente, o Compute Engine faz tentativas da melhor forma possível para aprovisionar a capacidade pedida. Se criar instâncias consumindo uma reserva a pedido ou uma reserva criada automaticamente para uma reserva futura, tem uma garantia muito elevada de que o Compute Engine aprovisiona a capacidade pedida se a reserva tiver capacidade reservada disponível.	Melhor esforço. Quando cria VMs Spot, o Compute Engine faz tentativas de melhor esforço para aprovisionar a capacidade pedida.	Melhor esforço. Quando cria um pedido de redimensionamento de GIG, o Compute Engine faz tentativas de melhor esforço para agendar o aprovisionamento da capacidade pedida.	Muito elevado. Se o Google Cloud Platform aprovar o seu pedido de reserva, tem uma garantia muito elevada de que o Compute Engine aprovisiona a sua capacidade reservada na data e hora de entrega escolhidas. Google Cloud Tem acesso exclusivo à capacidade reservada durante o período de reserva.
Ciclo de vida da instância	Pode controlar quando parar ou eliminar uma instância. No entanto, se o tipo de máquina que a instância usa não suportar a migração em direto, o Compute Engine para a instância durante os eventos de manutenção do anfitrião.	Pode controlar quando parar ou eliminar uma instância, exceto nos seguintes casos: O Compute Engine para ou elimina a instância para recuperar a capacidade. Este processo é denominado preempção. Se o tipo de máquina que a instância usa não suportar a migração em direto, o Compute Engine para a instância durante os eventos de manutenção do anfitrião.	Antes de uma instância atingir o fim da respetiva duração de execução, pode fazer o seguinte: Parar a instância: pode parar a instância em qualquer altura apenas se tiver sido criada como uma instância autónoma. Eliminar a instância: pode eliminar a instância em qualquer altura. Quando uma instância atinge o fim da duração da execução, o Compute Engine elimina-a.	Pode controlar quando parar ou eliminar uma instância, exceto nos seguintes casos: O Compute Engine para a instância durante os eventos de manutenção do anfitrião. A reserva criada automaticamente para aprovisionar a capacidade pedida atinge o fim do respetivo período de reserva comprometido. Nessa altura, o Compute Engine elimina a reserva e para ou elimina todas as instâncias que consomem a reserva com base na ação de rescisão especificada na respetiva configuração.

O que se segue?

Leia uma vista geral da criação de instâncias do Compute Engine.
Para criar instâncias através do modelo de aprovisionamento de spot, consulte o artigo VMs do Spot.
Para criar uma instância autónoma que use o modelo de aprovisionamento, consulte o artigo Acerca das VMs de início flexível.
Para criar várias instâncias através do modelo de aprovisionamento de início flexível, consulte o artigo Acerca dos pedidos de redimensionamento num MIG.
Para reservar capacidade para criar instâncias através do modelo associado a reservas, consulte uma das seguintes opções:
- Acerca dos pedidos de reserva futuros no modo de calendário
- Reserve capacidade no hipercomputador de IA