Esta página foi traduzida pela API Cloud Translation.

Visão geral da criação de uma instância com GPUs anexadas

Linux Windows

Este documento fornece uma visão geral das etapas necessárias para criar uma instância do Compute Engine com unidades de processamento gráfico (GPUs) anexadas. Use GPUs para acelerar cargas de trabalho específicas, como machine learning e processamento de dados.

Também é possível usar alguns tipos de máquinas com GPU no AI Hypercomputer. O Hipercomputador de IA é um sistema de supercomputação otimizado para oferecer suporte às suas cargas de trabalho de inteligência artificial (IA) e machine learning (ML). Essa opção é recomendada para criar uma infraestrutura densamente alocada e otimizada para performance com integrações para o Google Kubernetes Engine (GKE) e os programadores do Slurm.

Para mais informações sobre GPUs no Compute Engine, consulte Sobre GPUs.

Selecione o modelo da GPU

Para ver uma lista dos modelos de GPU disponíveis, consulte Plataformas de GPU. Anote também o tipo de máquina aceito pelo modelo de GPU selecionado.

Para cada modelo, também pode ser útil revisar o seguinte:

Zonas e regiões compatíveis
Preços de GPU para entender o custo do uso de cada modelo de GPU nas instâncias. Para instâncias que usam máquinas otimizadas para aceleradores, consulte também os preços das instâncias de VM.

Limitações

Além das restrições para todas as instâncias com GPUs, cada série de máquinas com GPUs anexadas tem as seguintes limitações:

Instâncias A4X

Só é possível solicitar capacidade usando as opções de consumo compatíveis para um tipo de máquina A4X.
Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível para instâncias que usam um tipo de máquina A4X.
Só é possível usar um tipo de máquina A4X em determinadas regiões e zonas.
Não é possível usar um disco permanente (regional ou zonal) em uma instância que usa um tipo de máquina A4X.
O tipo de máquina A4X só está disponível na plataforma NVIDIA Grace.
Atenção:o Contrato de nível de serviço (SLA) do Compute Engine não se aplica à série de máquinas A4X.
Não é possível mudar o tipo de máquina de uma instância atual para um tipo A4X. Só é possível criar novas instâncias A4X. Depois de criar uma instância usando um tipo de máquina A4X, não é possível mudar o tipo de máquina.
Não é possível executar sistemas operacionais Windows em um tipo de máquina A4X.
As instâncias A4X não oferecem suporte ao seguinte:

Instâncias A4

Só é possível solicitar capacidade usando as opções de consumo aceitas para um tipo de máquina A4.
Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível para instâncias que usam um tipo de máquina A4.
Só é possível usar um tipo de máquina A4 em determinadas regiões e zonas.
Não é possível usar um disco permanente (regional ou zonal) em uma instância que usa um tipo de máquina A4.
O tipo de máquina A4 só está disponível na plataforma de CPU Emerald Rapids.
Não é possível mudar o tipo de máquina de uma instância atual para um tipo A4. Só é possível criar novas instâncias A4. Depois de criar uma instância usando um tipo de máquina A4, não é possível mudar o tipo.
Os tipos de máquina A4 não são compatíveis com locatário único.
Não é possível executar sistemas operacionais Windows em um tipo de máquina A4.

Instâncias A3 Ultra

Só é possível solicitar capacidade usando as opções de consumo aceitas para um tipo de máquina A3 Ultra.
Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível para instâncias que usam um tipo de máquina A3 ultra.
Só é possível usar um tipo de máquina A3 Ultra em determinadas regiões e zonas.
Não é possível usar um Persistent Disk (regional ou zonal) em uma instância que usa um tipo de máquina A3 Ultra.
O tipo de máquina A3 Ultra só está disponível na plataforma de CPU Emerald Rapids.
Não é possível mudar o tipo de máquina de uma instância atual para um tipo A3 Ultra. Só é possível criar novas instâncias A3-ultra. Depois de criar uma instância usando um tipo de máquina A3 Ultra, não é possível mudar o tipo de máquina.
Os tipos de máquina A3 Ultra não são compatíveis com locatário único.
Não é possível executar sistemas operacionais Windows em um tipo de máquina A3 Ultra.

Instâncias A3 Mega

Só é possível solicitar capacidade usando as opções de consumo aceitas para um tipo de máquina A3 Mega.
Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível para instâncias que usam um tipo de máquina A3 Mega.
Só é possível usar um tipo de máquina A3 Mega em determinadas regiões e zonas.
Não é possível usar um Persistent Disk regional em uma instância que usa um tipo de máquina A3 Mega.
O tipo de máquina A3 Mega só está disponível na plataforma de CPU Sapphire Rapids.
Não é possível mudar o tipo de máquina de uma instância para um tipo de máquina A3 mega. Só é possível criar novas instâncias A3-mega. Depois de criar uma instância usando um tipo de máquina A3 Mega, não é possível mudar o tipo de máquina.
Os tipos de máquina A3 Mega não dão suporte a locatário único.
Não é possível executar sistemas operacionais Windows em um tipo de máquina A3 Mega.

Instâncias A3 High

Só é possível solicitar capacidade usando as opções de consumo compatíveis para um tipo de máquina A3 High.
Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível para instâncias que usam um tipo de máquina A3 High.
Só é possível usar um tipo de máquina A3 High em determinadas regiões e zonas.
Não é possível usar Persistent Disk regional em uma instância que usa um tipo de máquina A3 High.
O tipo de máquina A3 High só está disponível na plataforma de CPU Sapphire Rapids.
Não é possível mudar o tipo de máquina de uma instância para um tipo de máquina A3 High. Só é possível criar novas instâncias A3-high. Depois de criar uma instância usando um tipo de máquina A3 High, não é possível mudar o tipo de máquina.
Os tipos de máquina A3 High não oferecem suporte a locatário único.
Não é possível executar sistemas operacionais Windows em um tipo de máquina A3 High.
Para os tipos de máquina a3-highgpu-1g, a3-highgpu-2g e a3-highgpu-4g, crie instâncias usando VMs do Spot ou VMs de início flexível. Para instruções detalhadas sobre essas opções, consulte o seguinte:
- Para criar VMs do Spot, defina o modelo de provisionamento como SPOT ao criar uma VM otimizada para aceleradores.
- Para criar VMs de início flexível, use um dos seguintes métodos:
  - Crie uma VM independente e defina o modelo de provisionamento como FLEX_START ao criar uma VM otimizada para aceleradores.
  - Crie uma solicitação de redimensionamento em um grupo gerenciado de instâncias (MIG). Para instruções, consulte Criar um MIG com VMs de GPU.
Só é possível usar uma VM confidencial com um tipo de máquina a3-highgpu-1g em regiões e zonas limitadas, e todas as limitações para VMs confidenciais executadas no tipo de máquina A3 High se aplicam.

Instâncias A3 Edge

Só é possível solicitar capacidade usando as opções de consumo aceitas para um tipo de máquina A3 Edge.
Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível para instâncias que usam um tipo de máquina A3 Edge.
Só é possível usar um tipo de máquina A3 Edge em determinadas regiões e zonas.
Não é possível usar um Persistent Disk regional em uma instância que usa um tipo de máquina A3 Edge.
O tipo de máquina A3 Edge só está disponível na plataforma de CPU Sapphire Rapids.
Não é possível mudar o tipo de máquina de uma instância atual para um tipo de máquina A3 Edge. Só é possível criar novas instâncias A3-edge. Depois de criar uma instância usando um tipo de máquina A3 Edge, não é possível mudar o tipo de máquina.
Os tipos de máquina A3 Edge não são compatíveis com locatário único.
Não é possível executar sistemas operacionais Windows em um tipo de máquina A3 Edge.

Instâncias A2 padrão

Só é possível solicitar capacidade usando as opções de consumo aceitas para um tipo de máquina padrão A2.
Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível para instâncias que usam um tipo de máquina A2 padrão.
Só é possível usar um tipo de máquina padrão A2 em determinadas regiões e zonas.
Os tipos de máquina A2 padrão só estão disponíveis na plataforma Cascade Lake.
Se a instância usa um tipo de máquina padrão A2, só é possível trocar esse tipo A2 padrão por outro tipo A2 padrão. Não é possível mudar para outro tipo de máquina. Para mais informações, consulte Modificar instâncias otimizadas para aceleradores.
Não é possível usar o sistema operacional Windows com o tipo de máquina a2-megagpu-16g. Ao usar um sistema operacional Windows, escolha outro tipo de máquina A2.
Não é possível fazer um formato rápido dos SSDs locais anexados em instâncias do Windows que usam tipos de máquina padrão A2. Para formatar esses SSDs locais, é preciso usar o utilitário diskpart e especificar format fs=ntfs label=tmpfs.
Os tipos de máquina A2 padrão não dão suporte a locatário único.

Instâncias A2 Ultra

Você só pode solicitar capacidade usando as opções de consumo aceitas para um tipo de máquina A2 Ultra.
Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível para instâncias que usam um tipo de máquina A2 ultra.
Você só pode usar um tipo de máquina A2 ultra em determinadas regiões e zonas.
Os tipos de máquina A2 ultra só estão disponíveis na plataforma Cascade Lake.
Se a instância usa um tipo de máquina ultra A2, não é possível mudar o tipo de máquina. Se você precisar usar outro tipo de máquina ultra A2 ou qualquer outro tipo de máquina, crie uma nova instância.
Não é possível trocar nenhum tipo de máquina por um tipo de máquina A2 ultra. Se você precisar de uma instância que use um tipo de máquina A2 Ultra, crie uma nova instância.
Não é possível fazer um formato rápido dos SSDs locais anexados em instâncias do Windows que usam tipos de máquina A2 ultra. Para formatar esses SSDs locais, é preciso usar o utilitário diskpart e especificar format fs=ntfs label=tmpfs.

Instâncias G4

Só é possível solicitar capacidade usando as opções de consumo compatíveis para um tipo de máquina G4.
Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível para instâncias que usam um tipo de máquina G4.
Só é possível usar um tipo de máquina G4 em determinadas regiões e zonas.
Não é possível usar o Persistent Disk (regional ou zonal) em uma instância que usa um tipo de máquina G4.
O tipo de máquina G4 está disponível apenas na plataforma AMD EPYC Turin de 5ª geração.
Não é possível criar instâncias de VM confidencial que usam um tipo de máquina G4.
Não é possível criar instâncias G4 em nós de locatário individual.
Não é possível usar sistemas operacionais Windows em instâncias g4-standard-384.

Instâncias G2

Só é possível solicitar capacidade usando as opções de consumo compatíveis para um tipo de máquina G2.
Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível para instâncias que usam um tipo de máquina G2.
Só é possível usar um tipo de máquina G2 em determinadas regiões e zonas.
Os tipos de máquina G2 só estão disponíveis na plataforma Cascade Lake.
O disco permanente padrão (pd-standard) não é compatível com instâncias que usam o tipo de máquina G2. Para saber quais são os tipos de disco compatíveis, consulte Tipos de disco compatíveis com a G2.
Não é possível criar GPUs de várias instâncias em uma instância que usa um tipo de máquina G2.
Se precisar mudar o tipo de máquina de uma instância G2, consulte Modificar instâncias otimizadas para aceleradores.
Não é possível usar o Deep Learning VM Images como discos de inicialização para instâncias que usam o tipo de máquina G2.
O driver padrão atual para o Container-Optimized OS não oferece suporte a GPUs L4 em execução nos tipos de máquina G2. Além disso, o Container-Optimized OS é compatível apenas com um conjunto selecionado de drivers. Se você quiser usar o Container-Optimized OS em tipos de máquina G2, leia as seguintes observações:
- Use uma versão do Container-Optimized OS que seja compatível com a versão mínima recomendada do driver NVIDIA ou 525.60.13. Para mais informações, consulte as Notas de lançamento do Container-Optimized OS.
- Ao instalar o driver, especifique a versão mais recente disponível que funciona para as GPUs L4. Por exemplo, sudo cos-extensions install gpu -- -version=525.60.13.
Use a Google Cloud CLI ou REST para criar instâncias G2 nos seguintes cenários:
- Você quer especificar valores de memória personalizados.
- Você quer personalizar o número de núcleos de CPU visíveis.

Instâncias N1+GPU

Para saber mais sobre as limitações das instâncias N1 com GPUs, consulte recursos da série de máquinas N1 e GPUs da série de máquinas N1.

Escolher um sistema operacional

Se você estiver usando GPUs para o aprendizado de máquina, use um dos seguintes sistemas operacionais:

Imagens otimizadas para cargas de trabalho de IA. Você pode usar imagens do Ubuntu e do Rocky, que estão disponíveis em versões otimizadas para aceleradores com drivers NVIDIA e kit de ferramentas CUDA pré-instalados. Consulte Imagens do SO na documentação do Hipercomputador de IA.
Deep Learning VM Images. Cada VM de aprendizado profundo tem uma ferramenta de instalação de driver de GPU e inclui pacotes como TensorFlow e PyTorch. Você também pode usar uma VM de aprendizado profundo para cargas de trabalho gerais de GPU. Para saber mais sobre as imagens disponíveis e os pacotes instalados nelas, consulte Como escolher uma imagem na documentação de VMs de aprendizado profundo.

Cuidado:não é possível usar Deep Learning VM Images em discos de inicialização para VMs que usam tipos de máquina G2. Os tipos de máquina G2 são séries de máquinas com otimização de aceleradores que têm GPUs NVIDIA L4 conectadas.

Também é possível usar uma imagem pública ou personalizada. Para a maioria das imagens públicas ou personalizadas, é necessário instalar os drivers da NVIDIA e o kit de ferramentas CUDA. Para ajudar a identificar quais drivers são adequados para seu modelo de GPU, consulte Como instalar drivers de GPU.

Verificar a cota de GPU

Para proteger os usuários e sistemas do Compute Engine, novos projetos têm uma cota global de GPU, o que limita o número total de GPUs que podem ser criadas em qualquer zona compatível. Para analisar a cota de GPU, consulte Cota de GPU.

Se você precisar de uma cota extra de GPU, solicite um aumento de cota. Quando você solicita cota de GPU, precisa pedir uma cota para os tipos de GPU que quer criar em cada região e outra cota global para o número total de GPUs de todos os tipos em todas as zonas.

Se seu projeto tiver um histórico de faturamento estabelecido, ele receberá cota automaticamente depois que você enviar a solicitação.

Instâncias de GPU e cotas de alocação preemptivas

As instâncias que usam o modelo de provisionamento padrão geralmente não podem usar cotas de alocação preemptivas. As cotas preemptivas são para cargas de trabalho temporárias e geralmente estão mais disponíveis. Se o projeto não tiver cota preemptiva e você nunca tiver solicitado uma, todas as instâncias do projeto vão consumir cotas de alocação padrão.

Se você solicitar cota de alocação preemptiva, as instâncias que usam o modelo de provisionamento padrão precisarão atender a todos os critérios a seguir para consumir a cota de alocação preemptiva:

As instâncias têm GPUs anexadas.
As instâncias estão configuradas para serem excluídas automaticamente após um tempo de execução predefinido pelo campo maxRunDuration ou terminationTime. Para mais informações, consulte os seguintes tópicos:
- Limitar o tempo de execução de uma instância
- Limitar o tempo de execução de instâncias em um MIG
A instância não tem permissão para consumir reservas. Para mais informações, consulte Impedir que instâncias de computação consumam reservas.

Ao consumir a alocação preemptiva para cargas de trabalho de GPU com limite de tempo, você pode aproveitar o tempo de execução ininterrupto e a alta disponibilidade da cota de alocação preemptiva. Para mais informações, consulte Cotas preemptivas

Criar uma instância com GPUs anexadas

Para criar uma instância com GPUs anexadas, siga estas etapas:

Crie a instância. O método usado para criar uma instância depende da carga de trabalho que você quer executar.

Tipos de máquina de GPU
Cargas de trabalho de IA e ML	Gráficos e visualização	Outras cargas de trabalho de GPU
Os tipos de máquina da série A otimizados para aceleradores são projetados para cargas de trabalho de computação de alto desempenho (HPC), inteligência artificial (IA) e machine learning (ML). Para esses tipos de máquina, o modelo de GPU é anexado automaticamente à instância.	Os tipos de máquina da série G otimizados para aceleradores são projetados para cargas de trabalho como as de simulação do NVIDIA Omniverse, aplicativos com uso intensivo de gráficos, transcodificação de vídeo e desktops virtuais. Esses tipos de máquina são compatíveis com NVIDIA RTX Virtual Workstations (vWS). Para esses tipos de máquina, o modelo de GPU é anexado automaticamente à instância.	Para tipos de máquinas de uso geral N1, exceto o núcleo compartilhado N1 (`f1-micro` e `g1-small`), é possível anexar um conjunto selecionado de modelos de GPU. Alguns desses modelos de GPU também são compatíveis com as estações de trabalho virtuais NVIDIA RTX (vWS).
Para cargas de trabalho de IA, ML e HPC, escolha uma das seguintes opções: Para criar instâncias A4X (GB200), A4 (B200) ou A3 Ultra (H200), consulte Visão geral das opções de implantação na documentação do AI Hypercomputer. Para criar instâncias A3 High (H100), Mega (H100), Edge (H100) ou A2 (A100), consulte Criar uma instância A3 ou A2.	Para criar uma instância G2 (L4) ou G4 (RTX PRO 6000), consulte Criar uma instância G2 ou G4.	Para criar uma instância N1 com GPUs NVIDIA T4, P4, P100 ou V100 anexadas, consulte Criar uma instância N1 com GPUs anexadas.

Tipos de máquina de GPU

Cargas de trabalho de IA e ML Gráficos e visualização Outras cargas de trabalho de GPU

Os tipos de máquina da série A otimizados para aceleradores são projetados para cargas de trabalho de computação de alto desempenho (HPC), inteligência artificial (IA) e machine learning (ML).

Para esses tipos de máquina, o modelo de GPU é anexado automaticamente à instância.

Os tipos de máquina da série G otimizados para aceleradores são projetados para cargas de trabalho como as de simulação do NVIDIA Omniverse, aplicativos com uso intensivo de gráficos, transcodificação de vídeo e desktops virtuais. Esses tipos de máquina são compatíveis com NVIDIA RTX Virtual Workstations (vWS).

Para esses tipos de máquina, o modelo de GPU é anexado automaticamente à instância.

Para tipos de máquinas de uso geral N1, exceto o núcleo compartilhado N1 (f1-micro e g1-small), é possível anexar um conjunto selecionado de modelos de GPU. Alguns desses modelos de GPU também são compatíveis com as estações de trabalho virtuais NVIDIA RTX (vWS).

Para cargas de trabalho de IA, ML e HPC, escolha uma das seguintes opções:

Para criar instâncias A4X (GB200), A4 (B200) ou A3 Ultra (H200), consulte Visão geral das opções de implantação na documentação do AI Hypercomputer.
Para criar instâncias A3 High (H100), Mega (H100), Edge (H100) ou A2 (A100), consulte Criar uma instância A3 ou A2.

Para criar uma instância G2 (L4) ou G4 (RTX PRO 6000), consulte Criar uma instância G2 ou G4.

Para criar uma instância N1 com GPUs NVIDIA T4, P4, P100 ou V100 anexadas, consulte Criar uma instância N1 com GPUs anexadas.

Para que a instância use a GPU, é necessário instalar o driver da GPU na instância. Se você ativou uma estação de trabalho virtual NVIDIA RTX (anteriormente conhecida como NVIDIA GRID), instale um driver para a estação de trabalho virtual.

A seguir

Saiba mais sobre as plataformas de GPU.
Saiba mais sobre os recursos e limitações do uso de GPUs.

Saiba como conferir o uso real e previsto das GPUs.