Esta página foi traduzida pela API Cloud Translation.

Vista geral da criação de uma instância com GPUs anexadas

Linux Windows

Este documento oferece uma vista geral dos passos necessários para criar uma instância do Compute Engine com unidades de processamento de gráficos (GPUs) anexadas. Pode usar GPUs para acelerar cargas de trabalho específicas, como a aprendizagem automática e o processamento de dados.

Também pode usar alguns tipos de máquinas com GPU no hipercomputador de IA. O AI Hypercomputer é um sistema de supercomputação otimizado para suportar as suas cargas de trabalho de inteligência artificial (IA) e aprendizagem automática (AA). Esta opção é recomendada para criar uma infraestrutura densamente alocada e otimizada para o desempenho que tenha integrações para o Google Kubernetes Engine (GKE) e os programadores do Slurm.

Para mais informações sobre as GPUs no Compute Engine, consulte o artigo Acerca das GPUs.

Selecione o modelo de GPU

Para ver uma lista dos modelos de GPU disponíveis, consulte o artigo Plataformas de GPU. Tome também nota do tipo de máquina suportado para o modelo de GPU selecionado.

Para cada modelo, também pode ser útil rever o seguinte:

Regiões e zonas suportadas.
Preços das GPUs para compreender o custo de utilização de cada modelo de GPU nas suas instâncias. Para instâncias que usam máquinas otimizadas para aceleradores, reveja também os preços das instâncias de VM.

Limitações

Além das restrições para todas as instâncias com GPUs, cada série de máquinas com GPUs anexadas tem as seguintes limitações:

Instâncias A4X

Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina A4X.
Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina A4X.
Só pode usar um tipo de máquina A4X em determinadas regiões e zonas.
Não pode usar o disco persistente (regional ou zonal) numa instância que use um tipo de máquina A4X.
O tipo de máquina A4X só está disponível na plataforma NVIDIA Grace.
Aviso: o Contrato de Nível de Serviço (SLA) do Compute Engine não se aplica à série de máquinas A4X.
Não é possível alterar o tipo de máquina de uma instância existente para um tipo de máquina A4X. Só pode criar novas instâncias do A4X. Depois de criar uma instância com um tipo de máquina A4X, não pode alterar o tipo de máquina.
Não pode executar sistemas operativos Windows num tipo de máquina A4X.
As instâncias A4X não suportam o seguinte:
- Arrendamento exclusivo
- VMs do Spot

Instâncias A4

Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina A4.
Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina A4.
Só pode usar um tipo de máquina A4 em determinadas regiões e zonas.
Não pode usar um disco persistente (regional ou zonal) numa instância que use um tipo de máquina A4.
O tipo de máquina A4 só está disponível na plataforma de CPU Emerald Rapids.
Não é possível alterar o tipo de máquina de uma instância existente para um tipo de máquina A4. Só pode criar novas instâncias A4. Depois de criar uma instância com um tipo de máquina A4, não pode alterar o tipo de máquina.
Os tipos de máquinas A4 não suportam posse única.
Não pode executar sistemas operativos Windows num tipo de máquina A4.

Instâncias A3 Ultra

Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina A3 Ultra.
Não recebe descontos por utilização sustentada nem descontos de fidelidade flexíveis para instâncias que usam um tipo de máquina A3 Ultra.
Só pode usar um tipo de máquina A3 Ultra em determinadas regiões e zonas.
Não pode usar o disco persistente (regional ou zonal) numa instância que use um tipo de máquina A3 Ultra.
O tipo de máquina A3 Ultra só está disponível na plataforma de CPU Emerald Rapids.
Não pode alterar o tipo de máquina de uma instância existente para um tipo de máquina A3 Ultra. Só pode criar novas instâncias A3-ultra. Depois de criar uma instância com um tipo de máquina A3 Ultra, não pode alterar o tipo de máquina.
Os tipos de máquinas A3 Ultra não suportam posse exclusiva.
Não pode executar sistemas operativos Windows num tipo de máquina A3 Ultra.

Instâncias A3 Mega

Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina A3 Mega.
Não recebe descontos por utilização sustentada nem descontos de fidelidade flexíveis para instâncias que usam um tipo de máquina A3 Mega.
Só pode usar um tipo de máquina A3 Mega em determinadas regiões e zonas.
Não pode usar um disco persistente regional numa instância que use um tipo de máquina A3 Mega.
O tipo de máquina A3 Mega só está disponível na plataforma de CPU Sapphire Rapids.
Não é possível alterar o tipo de máquina de uma instância existente para um tipo de máquina A3 Mega. Só pode criar novas instâncias A3-mega. Depois de criar uma instância com um tipo de máquina A3 Mega, não pode alterar o tipo de máquina.
Os tipos de máquinas A3 Mega não suportam posse exclusiva.
Não pode executar sistemas operativos Windows num tipo de máquina A3 Mega.

Instâncias A3 High

Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina A3 High.
Não recebe descontos de fidelidade e descontos de fidelidade flexível para instâncias que usam um tipo de máquina A3 High.
Só pode usar um tipo de máquina A3 High em determinadas regiões e zonas.
Não pode usar um disco persistente regional numa instância que use um tipo de máquina A3 High.
O tipo de máquina A3 High só está disponível na plataforma de CPU Sapphire Rapids.
Não é possível alterar o tipo de máquina de uma instância existente para um tipo de máquina A3 High. Só pode criar novas instâncias A3 de alta capacidade. Depois de criar uma instância com um tipo de máquina A3 High, não pode alterar o tipo de máquina.
Os tipos de máquinas A3 High não suportam posse exclusiva.
Não pode executar sistemas operativos Windows num tipo de máquina A3 High.
Para os tipos de máquinas a3-highgpu-1g, a3-highgpu-2g e a3-highgpu-4g, tem de criar instâncias com VMs Spot ou uma funcionalidade que use o Dynamic Workload Scheduler (DWS), como pedidos de redimensionamento num GIG. Para ver instruções detalhadas sobre qualquer uma destas opções, reveja o seguinte:
- Para criar VMs Spot, defina o modelo de aprovisionamento como SPOT quando criar uma VM otimizada para aceleradores.
- Para criar um pedido de redimensionamento num MIG, que usa DWS, consulte o artigo Crie um MIG com VMs de GPU.
Só pode usar uma VM confidencial com um tipo de máquina a3-highgpu-1g em regiões e zonas limitadas, e aplicam-se todas as limitações da VM confidencial em execução no tipo de máquina A3 High.

Instâncias A3 Edge

Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina A3 Edge.
Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina A3 Edge.
Só pode usar um tipo de máquina A3 Edge em determinadas regiões e zonas.
Não pode usar um disco persistente regional numa instância que use um tipo de máquina A3 Edge.
O tipo de máquina A3 Edge só está disponível na plataforma de CPU Sapphire Rapids.
Não é possível alterar o tipo de máquina de uma instância existente para um tipo de máquina A3 Edge. Só pode criar novas instâncias A3-edge. Depois de criar uma instância com um tipo de máquina A3 Edge, não pode alterar o tipo de máquina.
Os tipos de máquinas A3 Edge não suportam posse exclusiva.
Não pode executar sistemas operativos Windows num tipo de máquina A3 Edge.

Instâncias A2 Standard

Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina padrão A2.
Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina padrão A2.
Só pode usar um tipo de máquina A2 Standard em determinadas regiões e zonas.
O tipo de máquina A2 Standard só está disponível na plataforma Cascade Lake.
Se a sua instância usar um tipo de máquina A2 Standard, só pode mudar de um tipo de máquina A2 Standard para outro tipo de máquina A2 Standard. Não pode alterar o tipo de máquina. Para mais informações, consulte o artigo Modifique instâncias otimizadas para aceleradores.
Não pode usar o sistema operativo Windows com os a2-megagpu-16gtipos de máquinas A2 Standard. Quando usar sistemas operativos Windows, escolha um tipo de máquina padrão A2 diferente.
Não pode fazer uma formatação rápida dos SSDs locais anexados em instâncias do Windows que usam tipos de máquinas padrão A2. Para formatar estes SSDs locais, tem de fazer uma formatação completa através do utilitário diskpart e especificar format fs=ntfs label=tmpfs.
Os tipos de máquinas padrão A2 não suportam a ocupação exclusiva.

Instâncias A2 Ultra

Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina A2 Ultra.
Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina A2 Ultra.
Só pode usar um tipo de máquina A2 Ultra em determinadas regiões e zonas.
O tipo de máquina A2 Ultra só está disponível na plataforma Cascade Lake.
Se a sua instância usar um tipo de máquina A2 Ultra, não pode alterar o tipo de máquina. Se precisar de usar um tipo de máquina A2 Ultra diferente ou qualquer outro tipo de máquina, tem de criar uma nova instância.
Não pode alterar nenhum outro tipo de máquina para um tipo de máquina A2 Ultra. Se precisar de uma instância que use um tipo de máquina A2 Ultra, tem de criar uma nova instância.
Não pode fazer uma formatação rápida dos SSDs locais anexados em instâncias do Windows que usam tipos de máquinas A2 Ultra. Para formatar estes SSDs locais, tem de fazer uma formatação completa através do utilitário diskpart e especificar format fs=ntfs label=tmpfs.

Instâncias G4

Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina G4.
Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina G4.
Só pode usar um tipo de máquina G4 em determinadas regiões e zonas.
Não pode usar o disco persistente (regional ou zonal) numa instância que use um tipo de máquina G4.
O tipo de máquina G4 só está disponível na plataforma AMD EPYC Turin de 5.ª geração.
Só pode criar instâncias a pedido. As reservas, o início flexível ou as VMs Spot não são suportados. Para começar a usar instâncias G4, contacte a equipa da sua Conta Google.
Só pode criar instâncias G4 em us-central1-b.
Só pode usar os tipos de discos Hyperdisk Balanced e Hyperdisk Extreme numa instância que use um tipo de máquina G4.
Não pode aplicar descontos por utilização de fidelidade a instâncias que usam um tipo de máquina G4.
Não pode criar instâncias de Confidential VM que usem um tipo de máquina G4.
Não pode criar instâncias G4 em nós de inquilino único.
Não pode criar instâncias G4 que usem a estação de trabalho virtual (vWS) NVIDIA RTX.

Instâncias G2

Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina G2.
Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina G2.
Só pode usar um tipo de máquina G2 em determinadas regiões e zonas.
O tipo de máquina G2 só está disponível na plataforma Cascade Lake.
O Persistent Disk padrão (pd-standard) não é suportado em instâncias que usam o tipo de máquina G2. Para ver os tipos de discos suportados, consulte o artigo Tipos de discos suportados para G2.
Não pode criar GPUs de várias instâncias numa instância que use um tipo de máquina G2.
Se precisar de alterar o tipo de máquina de uma instância G2, reveja o artigo Modifique instâncias otimizadas para aceleradores.
Não pode usar imagens de VMs de aprendizagem profunda como discos de arranque para instâncias que usam o tipo de máquina G2.
O controlador predefinido atual para o SO otimizado para contentores não suporta GPUs L4 em execução em tipos de máquinas G2. Além disso, o SO otimizado para contentores só suporta um conjunto selecionado de controladores. Se quiser usar o SO otimizado para contentores em tipos de máquinas G2, reveja as seguintes notas:
- Use uma versão do SO otimizado para contentores que suporte a versão mínima recomendada do controlador da NVIDIA 525.60.13 ou posterior. Para mais informações, reveja as notas de lançamento do SO otimizado para contentores.
- Quando instalar o controlador, especifique a versão mais recente disponível que funciona para as GPUs L4. Por exemplo, sudo cos-extensions install gpu -- -version=525.60.13.
Tem de usar a Google Cloud CLI ou a REST para criar instâncias G2 para os seguintes cenários:
- Quer especificar valores de memória personalizados.
- Quer personalizar o número de núcleos do CPU visíveis.

Instâncias N1+GPU

Para saber mais sobre as limitações das instâncias N1 com GPUs, consulte as funcionalidades da série de máquinas N1 e as GPUs da série de máquinas N1.

Escolha um sistema operativo

Se estiver a usar GPUs para aprendizagem automática, use um dos seguintes sistemas operativos:

Imagens otimizadas para cargas de trabalho de IA. Pode usar imagens do Ubuntu e do Rocky, que estão disponíveis em versões otimizadas para aceleradores com controladores da NVIDIA e o CUDA Toolkit pré-instalado. Consulte as imagens do SO na documentação do hipercomputador de IA.
Deep Learning VM Images. Cada VM de aprendizagem profunda tem uma ferramenta de instalação de controladores de GPU e inclui pacotes como o TensorFlow e o PyTorch. Também pode usar uma VM de aprendizagem profunda para cargas de trabalho de GPU gerais. Para saber mais sobre as imagens disponíveis e os pacotes instalados nestas imagens, consulte o artigo Escolher uma imagem na documentação da VM de aprendizagem profunda.

Aviso: não pode usar imagens de VM de aprendizagem profunda em discos de arranque para as VMs que usam tipos de máquinas G2. Os tipos de máquinas G2 são séries de máquinas otimizadas para aceleradores que têm GPUs NVIDIA L4 anexadas.

Em alternativa, pode usar uma imagem pública ou personalizada. Para a maioria das imagens públicas ou imagens personalizadas, tem de instalar os controladores da NVIDIA e o CUDA Toolkit. Para ajudar a identificar que controladores são adequados para o seu modelo de GPU, consulte o artigo sobre a instalação de controladores de GPU.

Verifique a quota da GPU

Para proteger os sistemas e os utilizadores do Compute Engine, os novos projetos têm uma quota de GPU global, que limita o número total de GPUs que pode criar em qualquer zona suportada. Para rever a quota de GPU, consulte o artigo Quota de GPU.

Se precisar de mais quota de GPU, peça um aumento da quota. Quando pede quota de GPU, tem de pedir quota para os tipos de GPU que quer criar em cada região e uma quota global adicional para o número total de GPUs de todos os tipos em todas as zonas.

Se o seu projeto tiver um histórico de faturação estabelecido, recebe automaticamente a quota depois de enviar o pedido.

Instâncias de GPU e quotas de atribuição preemptivas

Normalmente, as instâncias que usam o modelo de aprovisionamento padrão não podem usar quotas de alocação preemptíveis. As quotas preemptivas destinam-se a cargas de trabalho temporárias e estão normalmente mais disponíveis. Se o seu projeto não tiver uma quota preemptível e nunca a tiver pedido, todas as instâncias no seu projeto consomem quotas de alocação padrão.

Se pedir uma quota de alocação preemptível, as instâncias que usam o modelo de aprovisionamento padrão têm de cumprir todos os seguintes critérios para consumir a quota de alocação preemptível:

As instâncias têm GPUs anexadas.
As instâncias estão configuradas para serem eliminadas automaticamente após um tempo de execução predefinido através do campo maxRunDuration ou terminationTime. Para mais informações, consulte o seguinte:
- Limite o tempo de execução de uma instância
- Limite o tempo de execução das instâncias num MIG
A instância não tem autorização para consumir reservas. Para mais informações, consulte o artigo Impeça que as instâncias de computação consumam reservas.

Quando consome a atribuição preemptível para cargas de trabalho de GPU com limite de tempo, pode beneficiar de um tempo de execução ininterrupto e da elevada obtenção da quota de atribuição preemptível. Para mais informações, consulte o artigo Quotas preemptíveis.

Crie uma instância com GPUs anexadas

Para criar uma instância com GPUs anexadas, conclua os seguintes passos:

Crie a instância. O método usado para criar uma instância depende do modelo de GPU selecionado.
- Para criar uma instância com superchips NVIDIA GB200 Grace Blackwell anexados, consulte a vista geral das opções de implementação na documentação do hipercomputador de IA.
- Para criar uma instância com GPUs NVIDIA B200 ou H200 anexadas, consulte o artigo Crie uma instância A3 Ultra ou A4.
- Para criar uma instância com GPUs NVIDIA H100, A100 ou L4 anexadas, consulte o artigo Crie uma instância A3, A2 ou G2.
- Para obter informações sobre como começar a usar instâncias G4 com GPUs NVIDIA RTX PRO 6000 anexadas, contacte a equipa da sua Conta Google.
- Para criar uma instância com GPUs NVIDIA T4, P4, P100 ou V100 anexadas, consulte o artigo Crie uma instância N1 com GPUs anexadas.
Para que a instância use a GPU, tem de instalar o controlador da GPU na instância. Se ativou uma estação de trabalho virtual NVIDIA RTX (anteriormente conhecida como NVIDIA GRID), instale um controlador para a estação de trabalho virtual.

O que se segue?

Saiba mais sobre as plataformas de GPU.
Saiba mais sobre as funcionalidades e as limitações da utilização de GPUs.

Saiba como ver a utilização real e prevista das suas GPUs.