Adicione ou remova GPUs

O Compute Engine fornece unidades de processamento de gráficos (GPUs) que pode adicionar às suas instâncias de máquinas virtuais (VMs). Pode usar estas GPUs para acelerar cargas de trabalho específicas nas suas VMs, como aprendizagem automática e processamento de dados.

Só pode usar duas famílias de máquinas quando executa GPUs no Compute Engine:

  • A família de máquinas otimizadas pelo acelerador. Todos os tipos de máquinas otimizados pelo acelerador têm GPUs anexadas.
  • A família de máquinas de utilização geral N1. Pode usar a maioria dos tipos de máquinas N1, exceto o tipo de máquina N1 com núcleo partilhado. Se não estiver a usar uma máquina de uso geral N1, pode mudar para uma máquina de uso geral N1 e, em seguida, adicionar as GPUs.

Antes de começar

  • Para rever passos pré-requisitos adicionais, como selecionar uma imagem do SO e verificar a quota de GPU, reveja o documento de vista geral.
  • Se ainda não o tiver feito, configure a autenticação. A autenticação valida a sua identidade para aceder a Google Cloud serviços e APIs. Para executar código ou exemplos a partir de um ambiente de desenvolvimento local, pode autenticar-se no Compute Engine selecionando uma das seguintes opções:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    REST

    Para usar os exemplos da API REST nesta página num ambiente de desenvolvimento local, usa as credenciais que fornece à CLI gcloud.

      Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:

      gcloud init

      Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.

    Para mais informações, consulte o artigo Autenticar para usar REST na Google Cloud documentação de autenticação.

VMs otimizadas pelo acelerador

Cada tipo de máquina otimizado para aceleradores tem um modelo específico de GPUs NVIDIA anexado. Se tiver cargas de trabalho com muitos gráficos, como a visualização 3D, também pode criar estações de trabalho virtuais que usam estações de trabalho virtuais (vWS) NVIDIA RTX. A estação de trabalho virtual NVIDIA RTX está disponível para alguns modelos de GPU.

Tipo de máquina Modelo da GPU Modelo NVIDIA RTX Virtual Workstation (vWS)
A4X Superchips NVIDIA GB200 Grace Blackwell (nvidia-gb200).

Cada Superchip contém quatro GPUs NVIDIA B200 Blackwell.

A4 GPUs NVIDIA B200 Blackwell (nvidia-b200)
A3 Ultra GPUs NVIDIA H200 SXM (nvidia-h200-141gb)
A3 Mega GPUs NVIDIA H100 SXM (nvidia-h100-mega-80gb)
A3 High, A3 Edge GPUs NVIDIA H100 SXM (nvidia-h100-80gb)
A2 Ultra GPUs NVIDIA A100 de 80 GB (nvidia-a100-80gb)
A2 Standard GPUs NVIDIA A100 de 40 GB (nvidia-a100-40gb)
G4 (pré-visualização) NVIDIA RTX PRO 6000 Blackwell Server Edition (nvidia-rtx-pro-6000)
G2 GPUs NVIDIA L4 (nvidia-l4) GPUs NVIDIA L4 Virtual Workstation (nvidia-l4-vws)

Pode modificar cada VM otimizada para aceleradores da seguinte forma:

  • Para VMs A4X, A4, A3 e A2 Ultra, não pode modificar o tipo de máquina. Se estiver a usar algum destes tipos de máquinas para a sua VM e precisar de alterar o tipo de máquina, crie uma nova VM.

  • Para VMs A2 Standard, pode modificar a quantidade de GPUs mudando de um tipo de máquina A2 Standard para outro tipo de máquina A2 Standard.

  • Para VMs G2, pode fazer o seguinte:

    • Pode modificar a quantidade de GPUs mudando de um tipo de máquina G2 para outro tipo de máquina G2.
    • Pode mudar de um tipo de máquina G2 para um tipo de máquina de uma família de máquinas diferente, como de utilização geral ou otimizado para computação. Consulte o artigo Edite o tipo de máquina de uma VM.
  • Não pode remover GPUs de nenhum dos tipos de máquinas otimizados para aceleradores.

Modifique a quantidade de GPUs

Pode modificar a quantidade de GPUs de uma VM padrão A2 ou otimizada para aceleradores G2 através da Google Cloud consola ou da API REST.

Consola

Pode modificar o número de GPUs da sua VM parando a VM e editando a configuração da VM.

  1. Verifique se todas as suas aplicações críticas estão paradas na VM.

  2. Na Google Cloud consola, aceda à página Instâncias de VM para ver a sua lista de VMs.

    Aceder às instâncias de VM

  3. Clique no nome da VM para a qual quer modificar o número de GPUs. É apresentada a página Detalhes.

  4. Conclua os seguintes passos na página Detalhes.

    1. Se a VM estiver em execução, clique em Parar para parar a VM. Se não existir a opção Parar, clique em Mais ações > Parar.

    2. Clique em Editar.

    3. Na secção Configuração da máquina, selecione a família de máquinas GPUs e, de seguida, faça o seguinte:

      1. Na lista Número de GPUs, aumente ou diminua a quantidade de GPUs.

    4. Para aplicar as alterações, clique em Guardar.

    5. Para reiniciar a VM, clique em Iniciar/Retomar.

REST

Pode modificar o número de GPUs na sua VM parando a VM e alterando o tipo de máquina. Cada tipo de máquina otimizado para aceleradores tem um número específico de GPUs associadas. Se alterar o tipo de máquina, isto ajusta o número de GPUs anexadas à VM.

  1. Verifique se todas as aplicações críticas estão paradas na VM e, em seguida, crie um comando POST para parar a VM, de modo que possa ser movida para um sistema anfitrião onde as GPUs estejam disponíveis.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
    
  2. Depois de parar a VM, crie um pedido POST para modificar o tipo de máquina.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineType
    
    {
       machineType: "zones/ZONE/machineTypes/MACHINE_TYPE"
    }
    
  3. Inicie a VM.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
    

Substitua o seguinte:

  • PROJECT_ID: o ID do seu projeto.
  • VM_NAME: o nome da VM à qual quer adicionar GPUs.
  • ZONE: a zona onde a VM está localizada. Esta zona tem de suportar GPUs.
  • MACHINE_TYPE: o tipo de máquina que quer usar. Tem de ser uma das seguintes opções:

    • Se a sua VM usar uma máquina padrão A2, selecione outro tipo de máquina A2.
    • Se a sua VM usar um tipo de máquina G2, selecione outro tipo de máquina G2. Os tipos de máquinas G2 também suportam memória personalizada. A memória tem de ser um múltiplo de 1024 MB e estar dentro do intervalo de memória suportado. Por exemplo, para criar uma VM com 4 vCPUs e 19 GB de memória, especifique --machine-type=g2-custom-4-19456.

Limitações

VMs A2

  • Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina padrão A2.
  • Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina padrão A2.
  • Só pode usar um tipo de máquina A2 Standard em determinadas regiões e zonas.
  • O tipo de máquina A2 Standard só está disponível na plataforma Cascade Lake.
  • Se a sua instância usar um tipo de máquina A2 Standard, só pode mudar de um tipo de máquina A2 Standard para outro tipo de máquina A2 Standard. Não pode alterar o tipo de máquina. Para mais informações, consulte o artigo Modifique instâncias otimizadas para aceleradores.
  • Não pode usar o sistema operativo Windows com os a2-megagpu-16gtipos de máquinas A2 Standard. Quando usar sistemas operativos Windows, escolha um tipo de máquina padrão A2 diferente.
  • Não pode fazer uma formatação rápida dos SSDs locais anexados em instâncias do Windows que usam tipos de máquinas padrão A2. Para formatar estes SSDs locais, tem de fazer uma formatação completa através do utilitário diskpart e especificar format fs=ntfs label=tmpfs.
  • Os tipos de máquinas padrão A2 não suportam a ocupação exclusiva.

VMs G2

VMs de utilização geral N1

Esta secção aborda como adicionar, modificar ou remover GPUs de uma máquina de uso geral N1.

Em resumo, o processo para adicionar, modificar ou remover GPUs de uma VM existente é o seguinte:

  1. Verifique se a VM tem um tamanho do disco de arranque de, pelo menos, 40 GB.
  2. Parar a VM.
  3. Adicione, modifique ou remova as GPUs.

    Se a sua VM não tinha GPUs anexadas anteriormente, tem de concluir os seguintes passos:

    1. Prepare a VM para a modificação.
    2. Modifique a definição de manutenção do anfitrião para a VM. Não é possível migrar ao vivo VMs com GPUs porque estão atribuídas a dispositivos de hardware específicos. Para mais informações, consulte o artigo Restrições da GPU.
    3. Altere o tipo de máquina. As GPUs só são suportadas em tipos de máquinas selecionados.
    4. Instale um controlador de GPU na VM, para que o sistema possa usar o dispositivo.

Prepare a VM

Quando uma GPU é adicionada a uma VM, a ordem da interface de rede pode mudar.

A maioria das imagens públicas no Compute Engine não tem nomes de interface de rede persistentes e ajusta-se à nova ordem.

No entanto, se estiver a usar o SLES ou uma imagem personalizada, tem de atualizar a definição do sistema para impedir que a interface de rede persista. Para impedir que a interface de rede persista, execute o seguinte comando na sua VM:

 rm /etc/udev/rules.d/70-persistent-net.rules 

Adicione GPUs ou modifique o tipo de GPU em VMs existentes

Esta secção aborda como adicionar GPUs ou modificar o tipo de GPU em VMs de uso geral N1 existentes. Este procedimento suporta os seguintes tipos de GPU:

GPUs NVIDIA:

  • NVIDIA T4: nvidia-tesla-t4
  • NVIDIA P4: nvidia-tesla-p4
  • NVIDIA P100: nvidia-tesla-p100
  • NVIDIA V100: nvidia-tesla-v100

NVIDIA RTX Virtual Workstation (vWS) (anteriormente conhecida como NVIDIA GRID):

  • Estação de trabalho virtual NVIDIA T4: nvidia-tesla-t4-vws
  • Estação de trabalho virtual NVIDIA P4: nvidia-tesla-p4-vws
  • NVIDIA P100 Virtual Workstation: nvidia-tesla-p100-vws

    Para estas estações de trabalho virtuais, é adicionada automaticamente uma licença da estação de trabalho virtual (vWS) NVIDIA RTX à sua instância.

Consola

Para adicionar GPUs ou modificar o tipo de GPU, conclua os seguintes passos.

  1. Verifique se todas as suas aplicações críticas estão paradas na VM.

  2. Na Google Cloud consola, aceda à página Instâncias de VM para ver a sua lista de VMs.

    Aceder às instâncias de VM

  3. Clique no nome da MV que quer atualizar. É apresentada a página Detalhes.

  4. Conclua os seguintes passos na página Detalhes.

    1. Se a VM estiver em execução, clique em Parar. Se não existir a opção Parar, clique em Mais ações > Parar.

    2. Clique em Editar.

    3. Na secção Configuração da máquina, selecione a família de máquinas GPUs e, de seguida, faça o seguinte:

      1. Na lista Tipo de GPU, selecione ou mude para qualquer um dos tipos de GPU suportados em VMs N1.

      2. Na lista Número de GPUs, selecione o número de GPUs.

      3. Se o seu modelo de GPU suportar estações de trabalho virtuais (vWS) NVIDIA RTX para cargas de trabalho de gráficos, e planeia executar cargas de trabalho com utilização intensiva de gráficos nesta VM, selecione Ativar estação de trabalho virtual (NVIDIA GRID).

    4. Se a sua VM não tiver GPUs anexadas anteriormente, conclua o seguinte:

      1. Se a VM tiver um tipo de máquina com núcleo partilhado, tem de alterar o tipo de máquina. Na lista Tipo de máquina, selecione um dos tipos de máquinas N1 predefinidos. Em alternativa, também pode especificar definições de tipo de máquina personalizadas.

      2. Na secção Gestão, conclua o seguinte:

        1. Na lista Manutenção no anfitrião, selecione Terminar instância de VM. Não é possível migrar VMs com GPUs anexadas em direto. Consulte o artigo Tratar eventos do anfitrião da GPU.

        2. Na lista Reinício automático, selecione Ativado.

    5. Para aplicar as alterações, clique em Guardar.

    6. Para reiniciar a VM, clique em Iniciar/Retomar.

REST

Pode adicionar ou modificar GPUs na sua VM parando a VM e alterando a configuração da VM através da API.

  1. Verifique se todas as aplicações críticas estão paradas na VM e, em seguida, crie um comando POST para parar a VM, de modo que possa ser movida para um sistema anfitrião onde as GPUs estejam disponíveis.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
    
  2. Se a sua VM não tinha GPUs anexadas anteriormente, conclua os seguintes passos:

    1. Identifique o tipo de GPU que quer adicionar à sua VM. Pode enviar um GETpedido para listar os tipos de GPU disponíveis para o seu projeto numa zona específica.

      GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes
      
    2. Se a VM tiver um tipo de máquina com núcleo partilhado, tem de alterar o tipo de máquina para ter um ou mais vCPUs. Não pode adicionar aceleradores a VMs com tipos de máquinas de núcleo partilhado.

    3. Crie um comando POST para definir as opções de agendamento da VM.

      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setScheduling
      
      {
      "onHostMaintenance": "TERMINATE",
      "automaticRestart": true
      }
      
  3. Crie um pedido POST para adicionar ou modificar as GPUs associadas à sua VM.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineResources
    
        {
         "guestAccelerators": [
          {
            "acceleratorCount": ACCELERATOR_COUNT,
            "acceleratorType": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE"
          }
         ]
        }
    
  4. Inicie a VM.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
    

    Substitua o seguinte:

    • PROJECT_ID: o ID do seu projeto.
    • VM_NAME: o nome da VM à qual quer adicionar GPUs.
    • ZONE: a zona onde a VM está localizada.
    • ACCELERATOR_COUNT: o número de GPUs que quer anexar à sua VM. Para ver uma lista dos limites de GPU com base no tipo de máquina da sua VM, consulte o artigo GPUs no Compute Engine.
    • ACCELERATOR_TYPE: o modelo de GPU que quer associar ou mudar. Se planeia executar cargas de trabalho com grande exigência gráfica nesta VM, use um dos modelos de estação de trabalho virtual.

      Escolha um dos seguintes valores:

      • GPUs NVIDIA:

        • NVIDIA T4: nvidia-tesla-t4
        • NVIDIA P4: nvidia-tesla-p4
        • NVIDIA P100: nvidia-tesla-p100
        • NVIDIA V100: nvidia-tesla-v100
      • NVIDIA RTX Virtual Workstation (vWS) (anteriormente conhecida como NVIDIA GRID):

        • Estação de trabalho virtual NVIDIA T4: nvidia-tesla-t4-vws
        • Estação de trabalho virtual NVIDIA P4: nvidia-tesla-p4-vws
        • NVIDIA P100 Virtual Workstation: nvidia-tesla-p100-vws

        Para estas estações de trabalho virtuais, é adicionada automaticamente uma licença da NVIDIA RTX Virtual Workstation (vWS) à sua instância.

Instale controladores

Para instalar os controladores, escolha uma das seguintes opções:

Remova GPUs

Esta secção aborda como remover os seguintes tipos de GPUs de uma VM de uso geral N1 existente.

GPUs NVIDIA:

  • NVIDIA T4: nvidia-tesla-t4
  • NVIDIA P4: nvidia-tesla-p4
  • NVIDIA P100: nvidia-tesla-p100
  • NVIDIA V100: nvidia-tesla-v100

NVIDIA RTX Virtual Workstation (vWS) (anteriormente conhecida como NVIDIA GRID):

  • Estação de trabalho virtual NVIDIA T4: nvidia-tesla-t4-vws
  • Estação de trabalho virtual NVIDIA P4: nvidia-tesla-p4-vws
  • NVIDIA P100 Virtual Workstation: nvidia-tesla-p100-vws

    Para estas estações de trabalho virtuais, é adicionada automaticamente uma licença da estação de trabalho virtual (vWS) NVIDIA RTX à sua instância.

Pode usar o Google Cloud console para remover GPUs de uma VM existente. Para remover GPUs, conclua os passos seguintes:

  1. Verifique se todas as suas aplicações críticas estão paradas na VM.

  2. Na Google Cloud consola, aceda à página Instâncias de VM para ver a sua lista de VMs.

    Aceder às instâncias de VM

  3. Clique no nome da VM da qual quer remover GPUs. É apresentada a página Detalhes.

  4. Conclua os seguintes passos na página Detalhes.

    1. Se a VM estiver em execução, clique em Parar para parar a VM. Se não existir a opção Parar, clique em Mais ações > Parar.

    2. Na barra de ferramentas, clique em Editar.

    3. Na secção Configuração da máquina, selecione a família de máquinas de uso geral e, de seguida, faça o seguinte:

      1. Para ver as GPUs anexadas, expanda Configurações avançadas.

      2. Na secção GPUs, remova GPUs através de uma das seguintes opções:

        • Para remover algumas GPUs, na lista Número de GPUs, selecione um novo número.

        • Para remover todas as GPUs, clique em Eliminar GPU.

    4. Opcional: modifique a definição da política de manutenção do anfitrião da VM. As VMs com GPUs têm de ter a política de manutenção do anfitrião definida como Terminar instância de VM. No entanto, se removeu todas as GPUs, tem a opção de migrar esta VM em direto durante a manutenção do anfitrião. Para mais informações, consulte o artigo Defina a política de manutenção do anfitrião da VM.

    5. Para aplicar as alterações, clique em Guardar.

    6. Para reiniciar a VM, clique em Iniciar/Retomar.

O que se segue?