Adicione ou remova GPUs

O Compute Engine fornece unidades de processamento de gráficos (GPUs) que pode adicionar às suas instâncias de máquinas virtuais (VMs). Pode usar estas GPUs para acelerar cargas de trabalho específicas nas suas VMs, como aprendizagem automática e processamento de dados.

Só pode usar duas famílias de máquinas quando executa GPUs no Compute Engine:

  • A família de máquinas otimizadas pelo acelerador. Todos os tipos de máquinas otimizados pelo acelerador têm GPUs anexadas.
  • A família de máquinas de utilização geral N1. Pode usar a maioria dos tipos de máquinas N1, exceto o tipo de máquina N1 com núcleo partilhado. Se não estiver a usar uma máquina de uso geral N1, pode mudar para uma máquina de uso geral N1 e, em seguida, adicionar as GPUs.

Antes de começar

  • Para rever passos pré-requisitos adicionais, como selecionar uma imagem do SO e verificar a quota de GPU, reveja o documento de vista geral.
  • Se ainda não o tiver feito, configure a autenticação. A autenticação valida a sua identidade para aceder a Google Cloud serviços e APIs. Para executar código ou exemplos a partir de um ambiente de desenvolvimento local, pode autenticar-se no Compute Engine selecionando uma das seguintes opções:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    REST

    Para usar os exemplos da API REST nesta página num ambiente de desenvolvimento local, usa as credenciais que fornece à CLI gcloud.

      Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:

      gcloud init

      Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.

    Para mais informações, consulte o artigo Autenticar para usar REST na Google Cloud documentação de autenticação.

VMs otimizadas pelo acelerador

Cada tipo de máquina otimizado para aceleradores tem um modelo específico de GPUs NVIDIA anexado para suportar o tipo de carga de trabalho recomendado.

Cargas de trabalho de IA e ML Gráficos e visualização
Os tipos de máquinas da série A otimizados para aceleradores foram concebidos para cargas de trabalho de computação de elevado desempenho (HPC), inteligência artificial (IA) e aprendizagem automática (ML).

Para estes tipos de máquinas, o modelo de GPU é anexado automaticamente à instância.

Os tipos de máquinas da série G otimizados para aceleradores foram concebidos para cargas de trabalho como cargas de trabalho de simulação do NVIDIA Omniverse, aplicações com utilização intensiva de gráficos, transcodificação de vídeo e computadores virtuais. Estes tipos de máquinas suportam as estações de trabalho virtuais (vWS) NVIDIA RTX.

Para estes tipos de máquinas, o modelo de GPU é anexado automaticamente à instância.

  • A4X (NVIDIA GB200 Superchips)
    (nvidia-gb200)
  • A4 (NVIDIA B200)
    (nvidia-b200)
  • A3 Ultra (NVIDIA H200)
    (nvidia-h200-141gb)
  • A3 Mega (NVIDIA H100)
    (nvidia-h100-mega-80gb)
  • A3 High (NVIDIA H100)
    (nvidia-h100-80gb)
  • A3 Edge (NVIDIA H100)
    (nvidia-h100-80gb)
  • A2 Ultra (NVIDIA A100 80GB)
    (nvidia-a100-80gb)
  • A2 Standard (NVIDIA A100)
    (nvidia-a100-40gb)
  • G4 (NVIDIA RTX PRO 6000)
    (nvidia-rtx-pro-6000)
    (nvidia-rtx-pro-6000-vws)
  • G2 (NVIDIA L4)
    (nvidia-l4)
    (nvidia-l4-vws)

Pode modificar cada instância otimizada para aceleradores da seguinte forma:

  • Para instâncias A4X, A4, A3 e A2 Ultra, não pode modificar o tipo de máquina. Se estiver a usar algum destes tipos de máquinas para a sua instância e precisar de alterar o tipo de máquina, crie uma nova instância.

  • Para instâncias A2 Standard, pode modificar a quantidade de GPUs mudando de um tipo de máquina A2 Standard para outro tipo de máquina A2 Standard.

  • Para instâncias G4, pode modificar a quantidade de GPUs mudando de um tipo de máquina G4 para outro tipo de máquina G4.

  • Para instâncias G2, pode fazer o seguinte:

    • Pode modificar a quantidade de GPUs mudando de um tipo de máquina G2 para outro tipo de máquina G2.
    • Pode mudar de um tipo de máquina G2 para um tipo de máquina de uma família de máquinas diferente, como de utilização geral ou otimizado para computação. Consulte o artigo Edite o tipo de máquina de uma VM.
  • Não pode remover GPUs de nenhum dos tipos de máquinas otimizados para aceleradores.

Modifique a quantidade de GPUs

Pode modificar a quantidade de GPUs de uma instância otimizada para aceleradores A2 standard, G4 ou G2 através da Google Cloud consola ou da API REST.

Consola

Pode modificar o número de GPUs da instância parando a instância e editando a configuração da instância.

  1. Verifique se todas as suas aplicações críticas estão paradas na instância.

  2. Na Google Cloud consola, aceda à página Instâncias de VM para ver a sua lista de instâncias.

    Aceder às instâncias de VM

  3. Clique no nome da instância para a qual quer modificar o número de GPUs. É apresentada a página Detalhes.

  4. Conclua os seguintes passos na página Detalhes.

    1. Se a instância estiver em execução, clique em Parar para parar a instância. Se não existir a opção Parar, clique em Mais ações > Parar.

    2. Clique em Editar.

    3. Na secção Configuração da máquina, selecione a família de máquinas GPUs e, de seguida, faça o seguinte:

      1. Na lista Número de GPUs, aumente ou diminua a quantidade de GPUs.

    4. Para aplicar as alterações, clique em Guardar.

    5. Para reiniciar a instância, clique em Iniciar/Retomar.

REST

Pode modificar o número de GPUs na sua instância parando a instância e alterando o tipo de máquina. Cada tipo de máquina otimizado para aceleradores tem um número específico de GPUs anexadas. Se alterar o tipo de máquina, isto ajusta o número de GPUs anexadas à instância.

  1. Verifique se todas as suas aplicações críticas estão paradas na instância e, em seguida, crie um comando POST para parar a instância, de modo que possa ser movida para um sistema anfitrião onde as GPUs estejam disponíveis.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
    
  2. Depois de a instância parar, crie um pedido POST para modificar o tipo de máquina.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineType
    
    {
       machineType: "zones/ZONE/machineTypes/MACHINE_TYPE"
    }
    
  3. Inicie a instância.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
    

Substitua o seguinte:

  • PROJECT_ID: o ID do seu projeto.
  • VM_NAME: o nome da instância à qual quer adicionar GPUs.
  • ZONE: a zona onde a instância está localizada. Esta zona tem de suportar GPUs.
  • MACHINE_TYPE: o tipo de máquina que quer usar. Tem de ser uma das seguintes opções:

    • Se a sua instância usar uma máquina padrão A2, selecione outro tipo de máquina padrão A2.
    • Se a sua instância usar uma máquina G4, selecione outro tipo de máquina G4.
    • Se a sua instância usar um tipo de máquina G2, selecione outro tipo de máquina G2. Os tipos de máquinas G2 também suportam memória personalizada. A memória tem de ser um múltiplo de 1024 MB e estar dentro do intervalo de memória suportado. Por exemplo, o nome do tipo de máquina para uma instância com 4 vCPUs e 19 GB de memória seria g2-custom-4-19456.

Limitações

Instâncias A2

  • Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina padrão A2.
  • Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina padrão A2.
  • Só pode usar um tipo de máquina A2 Standard em determinadas regiões e zonas.
  • O tipo de máquina A2 Standard só está disponível na plataforma Cascade Lake.
  • Se a sua instância usar um tipo de máquina A2 Standard, só pode mudar de um tipo de máquina A2 Standard para outro tipo de máquina A2 Standard. Não pode alterar o tipo de máquina. Para mais informações, consulte o artigo Modifique instâncias otimizadas para aceleradores.
  • Não pode usar o sistema operativo Windows com o tipo de máquina a2-megagpu-16g. Quando usar um sistema operativo Windows, escolha um tipo de máquina padrão A2 diferente.
  • Não pode fazer uma formatação rápida dos SSDs locais anexados em instâncias do Windows que usam tipos de máquinas padrão A2. Para formatar estes SSDs locais, tem de fazer uma formatação completa através do utilitário diskpart e especificar format fs=ntfs label=tmpfs.
  • Os tipos de máquinas padrão A2 não suportam a posse exclusiva.

Instâncias G2

Instâncias G4

Instâncias de utilização geral N1

Esta secção aborda como adicionar, modificar ou remover GPUs de uma máquina de uso geral N1.

Em resumo, o processo para adicionar, modificar ou remover GPUs de uma instância existente é o seguinte:

  1. Verifique se a sua instância tem um tamanho do disco de arranque de, pelo menos, 40 GB.
  2. Pare a instância.
  3. Adicione, modifique ou remova as GPUs.

    Se a sua instância N1 não tiver nenhuma GPU anexada, tem de concluir os seguintes passos:

    1. Prepare a instância para a modificação.
    2. Modifique a definição de manutenção do anfitrião para a instância. Não é possível migrar em direto instâncias com GPUs porque estão atribuídas a dispositivos de hardware específicos. Para mais informações, consulte o artigo Restrições da GPU.
    3. Altere o tipo de máquina. As GPUs só são suportadas em tipos de máquinas N1 selecionados.
    4. Instale um controlador de GPU na sua instância, para que o seu sistema possa usar o dispositivo de GPU.

Prepare a sua instância

Quando uma GPU é adicionada a uma instância, a ordem da interface de rede pode mudar.

A maioria das imagens públicas no Compute Engine não tem nomes de interface de rede persistentes e ajusta-se à nova ordem.

No entanto, se estiver a usar o SLES ou uma imagem personalizada, tem de atualizar a definição do sistema para impedir que a interface de rede persista. Para impedir que a interface de rede persista, execute o seguinte comando na sua instância:

 rm /etc/udev/rules.d/70-persistent-net.rules 

Adicione GPUs ou modifique o tipo de GPU em instâncias existentes

Esta secção aborda como adicionar GPUs ou modificar o tipo de GPU numa instância de uso geral N1 existente. Este procedimento suporta os seguintes tipos de GPU:

GPUs NVIDIA:

  • NVIDIA T4: nvidia-tesla-t4
  • NVIDIA P4: nvidia-tesla-p4
  • NVIDIA P100: nvidia-tesla-p100
  • NVIDIA V100: nvidia-tesla-v100

NVIDIA RTX Virtual Workstation (vWS) (anteriormente conhecida como NVIDIA GRID):

  • Estação de trabalho virtual NVIDIA T4: nvidia-tesla-t4-vws
  • Estação de trabalho virtual NVIDIA P4: nvidia-tesla-p4-vws
  • NVIDIA P100 Virtual Workstation: nvidia-tesla-p100-vws

    Para estas estações de trabalho virtuais, é adicionada automaticamente uma licença da estação de trabalho virtual (vWS) NVIDIA RTX à sua instância.

Consola

Para adicionar GPUs ou modificar o tipo de GPU, conclua os seguintes passos.

  1. Verifique se todas as suas aplicações críticas estão paradas na instância.

  2. Na Google Cloud consola, aceda à página Instâncias de VM para ver a sua lista de instâncias.

    Aceder às instâncias de VM

  3. Clique no nome da instância que quer atualizar. É apresentada a página Detalhes.

  4. Conclua os seguintes passos na página Detalhes.

    1. Se a instância estiver em execução, clique em Parar. Se não existir a opção Parar, clique em Mais ações > Parar.

    2. Clique em Editar.

    3. Na secção Configuração da máquina, selecione a família de máquinas GPUs e, de seguida, faça o seguinte:

      1. Na lista Tipo de GPU, selecione ou mude para qualquer um dos tipos de GPU suportados em VMs N1.

      2. Na lista Número de GPUs, selecione o número de GPUs.

      3. Se o seu modelo de GPU suportar estações de trabalho virtuais (vWS) NVIDIA RTX para cargas de trabalho de gráficos, e planeia executar cargas de trabalho com utilização intensiva de gráficos nesta instância, selecione Ativar estação de trabalho virtual (NVIDIA GRID).

    4. Se a sua instância não tinha GPUs anexadas anteriormente, conclua o seguinte:

      1. Se a instância tiver um tipo de máquina com núcleo partilhado, tem de alterar o tipo de máquina. Na lista Tipo de máquina, selecione um dos tipos de máquinas N1 predefinidos. Em alternativa, também pode especificar definições de tipo de máquina personalizadas.

      2. Na secção Gestão, conclua o seguinte:

        1. Na lista Manutenção no anfitrião, selecione Terminar instância de VM. Não é possível migrar instâncias com GPUs anexadas em tempo real. Consulte o artigo Trate eventos do anfitrião da GPU.

        2. Na lista Reinício automático, selecione Ativado.

    5. Para aplicar as alterações, clique em Guardar.

    6. Para reiniciar a VM, clique em Iniciar/Retomar.

REST

Pode adicionar ou modificar GPUs na sua instância parando a instância e alterando a configuração da instância através da API.

  1. Verifique se todas as aplicações críticas estão paradas na instância e, em seguida, crie um comando POST para parar a instância, para que possa ser movida para um sistema anfitrião onde as GPUs estão disponíveis.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
    
  2. Se a sua instância não tiver nenhuma GPU anexada, conclua os seguintes passos:

    1. Identifique o tipo de GPU que quer adicionar à sua instância. Pode enviar um GETpedido para listar os tipos de GPU disponíveis para o seu projeto numa zona específica.

      GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes
      
    2. Se a instância tiver um tipo de máquina com núcleo partilhado, tem de alterar o tipo de máquina para ter um ou mais vCPUs. Não pode adicionar aceleradores a instâncias com tipos de máquinas de núcleo partilhado.

    3. Crie um comando POST para definir as opções de agendamento da instância.

      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setScheduling
      
      {
      "onHostMaintenance": "TERMINATE",
      "automaticRestart": true
      }
      
  3. Crie um pedido POST para adicionar ou modificar as GPUs associadas à sua instância.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineResources
    
        {
         "guestAccelerators": [
          {
            "acceleratorCount": ACCELERATOR_COUNT,
            "acceleratorType": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE"
          }
         ]
        }
    
  4. Inicie a instância.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
    

    Substitua o seguinte:

    • PROJECT_ID: o ID do seu projeto.
    • VM_NAME: o nome da instância à qual quer adicionar GPUs.
    • ZONE: a zona onde a instância está localizada.
    • ACCELERATOR_COUNT: o número de GPUs que quer anexar à sua instância. Para ver uma lista dos limites de GPU com base no tipo de máquina da sua instância, consulte o artigo GPUs no Compute Engine.
    • ACCELERATOR_TYPE: o modelo de GPU que quer associar ou mudar. Se planeia executar cargas de trabalho com grande exigência gráfica nesta instância, use um dos modelos de estação de trabalho virtual.

      Escolha um dos seguintes valores:

      • GPUs NVIDIA:

        • NVIDIA T4: nvidia-tesla-t4
        • NVIDIA P4: nvidia-tesla-p4
        • NVIDIA P100: nvidia-tesla-p100
        • NVIDIA V100: nvidia-tesla-v100
      • NVIDIA RTX Virtual Workstation (vWS) (anteriormente conhecida como NVIDIA GRID):

        • Estação de trabalho virtual NVIDIA T4: nvidia-tesla-t4-vws
        • Estação de trabalho virtual NVIDIA P4: nvidia-tesla-p4-vws
        • NVIDIA P100 Virtual Workstation: nvidia-tesla-p100-vws

        Para estas estações de trabalho virtuais, é adicionada automaticamente uma licença da NVIDIA RTX Virtual Workstation (vWS) à sua instância.

Instale controladores

Para instalar os controladores, escolha uma das seguintes opções:

Remova GPUs

Esta secção aborda como remover os seguintes tipos de GPUs de uma instância de uso geral N1 existente.

GPUs NVIDIA:

  • NVIDIA T4: nvidia-tesla-t4
  • NVIDIA P4: nvidia-tesla-p4
  • NVIDIA P100: nvidia-tesla-p100
  • NVIDIA V100: nvidia-tesla-v100

NVIDIA RTX Virtual Workstation (vWS) (anteriormente conhecida como NVIDIA GRID):

  • Estação de trabalho virtual NVIDIA T4: nvidia-tesla-t4-vws
  • Estação de trabalho virtual NVIDIA P4: nvidia-tesla-p4-vws
  • NVIDIA P100 Virtual Workstation: nvidia-tesla-p100-vws

    Para estas estações de trabalho virtuais, é adicionada automaticamente uma licença da estação de trabalho virtual (vWS) NVIDIA RTX à sua instância.

Pode usar o comando Google Cloud console para remover GPUs de uma instância existente. Para remover GPUs, conclua os passos seguintes:

  1. Verifique se todas as suas aplicações críticas estão paradas na instância.

  2. Na Google Cloud consola, aceda à página Instâncias de VMs para ver a sua lista de instâncias.

    Aceder às instâncias de VM

  3. Clique no nome da instância da qual quer remover GPUs. É apresentada a página Detalhes.

  4. Conclua os seguintes passos na página Detalhes.

    1. Se a instância estiver em execução, clique em Parar para parar a instância. Se não existir a opção Parar, clique em Mais ações > Parar.

    2. Na barra de ferramentas, clique em Editar.

    3. Na secção Configuração da máquina, selecione a família de máquinas de uso geral e, de seguida, faça o seguinte:

      1. Para ver as GPUs anexadas, expanda Configurações avançadas.

      2. Na secção GPUs, remova GPUs através de uma das seguintes opções:

        • Para remover algumas GPUs, na lista Número de GPUs, selecione um novo número.

        • Para remover todas as GPUs, clique em Eliminar GPU.

    4. Opcional: modifique a definição da política de manutenção do anfitrião da instância. As instâncias com GPUs têm de ter a política de manutenção do anfitrião definida como Terminar instância de VM. No entanto, se removeu todas as GPUs, tem a opção de migrar esta instância em direto durante a manutenção do anfitrião. Para mais informações, consulte o artigo Defina a política de manutenção do anfitrião da VM.

    5. Para aplicar as alterações, clique em Guardar.

    6. Para reiniciar a instância, clique em Iniciar/Retomar.

O que se segue?