Vista geral da criação de uma instância com GPUs anexadas


Este documento oferece uma vista geral dos passos necessários para criar uma instância do Compute Engine com unidades de processamento de gráficos (GPUs) anexadas. Pode usar GPUs para acelerar cargas de trabalho específicas, como a aprendizagem automática e o processamento de dados.

Também pode usar alguns tipos de máquinas com GPU no hipercomputador de IA. O AI Hypercomputer é um sistema de supercomputação otimizado para suportar as suas cargas de trabalho de inteligência artificial (IA) e aprendizagem automática (AA). Esta opção é recomendada para criar uma infraestrutura densamente alocada e otimizada para o desempenho que tenha integrações para o Google Kubernetes Engine (GKE) e os programadores do Slurm.

Para mais informações sobre as GPUs no Compute Engine, consulte o artigo Acerca das GPUs.

Selecione o modelo de GPU

Para ver uma lista dos modelos de GPU disponíveis, consulte o artigo Plataformas de GPU. Tome também nota do tipo de máquina suportado para o modelo de GPU selecionado.

Para cada modelo, também pode ser útil rever o seguinte:

Limitações

Além das restrições para todas as instâncias com GPUs, cada série de máquinas com GPUs anexadas tem as seguintes limitações:

Instâncias A4X

Instâncias A4

Instâncias A3 Ultra

  • Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina A3 Ultra.
  • Não recebe descontos por utilização sustentada nem descontos de fidelidade flexíveis para instâncias que usam um tipo de máquina A3 Ultra.
  • Só pode usar um tipo de máquina A3 Ultra em determinadas regiões e zonas.
  • Não pode usar o disco persistente (regional ou zonal) numa instância que use um tipo de máquina A3 Ultra.
  • O tipo de máquina A3 Ultra só está disponível na plataforma de CPU Emerald Rapids.
  • Não pode alterar o tipo de máquina de uma instância existente para um tipo de máquina A3 Ultra. Só pode criar novas instâncias A3-ultra. Depois de criar uma instância com um tipo de máquina A3 Ultra, não pode alterar o tipo de máquina.
  • Os tipos de máquinas A3 Ultra não suportam posse exclusiva.
  • Não pode executar sistemas operativos Windows num tipo de máquina A3 Ultra.

Instâncias A3 Mega

Instâncias A3 High

Instâncias A3 Edge

Instâncias A2 Standard

  • Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina padrão A2.
  • Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina padrão A2.
  • Só pode usar um tipo de máquina A2 Standard em determinadas regiões e zonas.
  • O tipo de máquina A2 Standard só está disponível na plataforma Cascade Lake.
  • Se a sua instância usar um tipo de máquina A2 Standard, só pode mudar de um tipo de máquina A2 Standard para outro tipo de máquina A2 Standard. Não pode alterar o tipo de máquina. Para mais informações, consulte o artigo Modifique instâncias otimizadas para aceleradores.
  • Não pode usar o sistema operativo Windows com os a2-megagpu-16gtipos de máquinas A2 Standard. Quando usar sistemas operativos Windows, escolha um tipo de máquina padrão A2 diferente.
  • Não pode fazer uma formatação rápida dos SSDs locais anexados em instâncias do Windows que usam tipos de máquinas padrão A2. Para formatar estes SSDs locais, tem de fazer uma formatação completa através do utilitário diskpart e especificar format fs=ntfs label=tmpfs.
  • Os tipos de máquinas padrão A2 não suportam a ocupação exclusiva.

Instâncias A2 Ultra

  • Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina A2 Ultra.
  • Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina A2 Ultra.
  • Só pode usar um tipo de máquina A2 Ultra em determinadas regiões e zonas.
  • O tipo de máquina A2 Ultra só está disponível na plataforma Cascade Lake.
  • Se a sua instância usar um tipo de máquina A2 Ultra, não pode alterar o tipo de máquina. Se precisar de usar um tipo de máquina A2 Ultra diferente ou qualquer outro tipo de máquina, tem de criar uma nova instância.
  • Não pode alterar nenhum outro tipo de máquina para um tipo de máquina A2 Ultra. Se precisar de uma instância que use um tipo de máquina A2 Ultra, tem de criar uma nova instância.
  • Não pode fazer uma formatação rápida dos SSDs locais anexados em instâncias do Windows que usam tipos de máquinas A2 Ultra. Para formatar estes SSDs locais, tem de fazer uma formatação completa através do utilitário diskpart e especificar format fs=ntfs label=tmpfs.

Instâncias G4

  • Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina G4.
  • Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina G4.
  • Só pode usar um tipo de máquina G4 em determinadas regiões e zonas.
  • Não pode usar o disco persistente (regional ou zonal) numa instância que use um tipo de máquina G4.
  • O tipo de máquina G4 só está disponível na plataforma AMD EPYC Turin de 5.ª geração.
  • Só pode criar instâncias a pedido. As reservas, o início flexível ou as VMs Spot não são suportados. Para começar a usar instâncias G4, contacte a equipa da sua Conta Google.
  • Só pode criar instâncias G4 em us-central1-b.
  • Só pode usar os tipos de discos Hyperdisk Balanced e Hyperdisk Extreme numa instância que use um tipo de máquina G4.
  • Não pode aplicar descontos por utilização de fidelidade a instâncias que usam um tipo de máquina G4.
  • Não pode criar instâncias de Confidential VM que usem um tipo de máquina G4.
  • Não pode criar instâncias G4 em nós de inquilino único.
  • Não pode criar instâncias G4 que usem a estação de trabalho virtual (vWS) NVIDIA RTX.

Instâncias G2

Instâncias N1+GPU

Para saber mais sobre as limitações das instâncias N1 com GPUs, consulte as funcionalidades da série de máquinas N1 e as GPUs da série de máquinas N1.

Escolha um sistema operativo

Se estiver a usar GPUs para aprendizagem automática, use um dos seguintes sistemas operativos:

  • Imagens otimizadas para cargas de trabalho de IA. Pode usar imagens do Ubuntu e do Rocky, que estão disponíveis em versões otimizadas para aceleradores com controladores da NVIDIA e o CUDA Toolkit pré-instalado. Consulte as imagens do SO na documentação do hipercomputador de IA.

  • Deep Learning VM Images. Cada VM de aprendizagem profunda tem uma ferramenta de instalação de controladores de GPU e inclui pacotes como o TensorFlow e o PyTorch. Também pode usar uma VM de aprendizagem profunda para cargas de trabalho de GPU gerais. Para saber mais sobre as imagens disponíveis e os pacotes instalados nestas imagens, consulte o artigo Escolher uma imagem na documentação da VM de aprendizagem profunda.

Em alternativa, pode usar uma imagem pública ou personalizada. Para a maioria das imagens públicas ou imagens personalizadas, tem de instalar os controladores da NVIDIA e o CUDA Toolkit. Para ajudar a identificar que controladores são adequados para o seu modelo de GPU, consulte o artigo sobre a instalação de controladores de GPU.

Verifique a quota da GPU

Para proteger os sistemas e os utilizadores do Compute Engine, os novos projetos têm uma quota de GPU global, que limita o número total de GPUs que pode criar em qualquer zona suportada. Para rever a quota de GPU, consulte o artigo Quota de GPU.

Se precisar de mais quota de GPU, peça um aumento da quota. Quando pede quota de GPU, tem de pedir quota para os tipos de GPU que quer criar em cada região e uma quota global adicional para o número total de GPUs de todos os tipos em todas as zonas.

Se o seu projeto tiver um histórico de faturação estabelecido, recebe automaticamente a quota depois de enviar o pedido.

Instâncias de GPU e quotas de atribuição preemptivas

Normalmente, as instâncias que usam o modelo de aprovisionamento padrão não podem usar quotas de alocação preemptíveis. As quotas preemptivas destinam-se a cargas de trabalho temporárias e estão normalmente mais disponíveis. Se o seu projeto não tiver uma quota preemptível e nunca a tiver pedido, todas as instâncias no seu projeto consomem quotas de alocação padrão.

Se pedir uma quota de alocação preemptível, as instâncias que usam o modelo de aprovisionamento padrão têm de cumprir todos os seguintes critérios para consumir a quota de alocação preemptível:

Quando consome a atribuição preemptível para cargas de trabalho de GPU com limite de tempo, pode beneficiar de um tempo de execução ininterrupto e da elevada obtenção da quota de atribuição preemptível. Para mais informações, consulte o artigo Quotas preemptíveis.

Crie uma instância com GPUs anexadas

Para criar uma instância com GPUs anexadas, conclua os seguintes passos:

  1. Crie a instância. O método usado para criar uma instância depende do modelo de GPU selecionado.

  2. Para que a instância use a GPU, tem de instalar o controlador da GPU na instância. Se ativou uma estação de trabalho virtual NVIDIA RTX (anteriormente conhecida como NVIDIA GRID), instale um controlador para a estação de trabalho virtual.

O que se segue?