Esta página foi traduzida pela API Cloud Translation.

Instalar os drivers da GPU

Linux Windows

Depois que você cria uma instância de máquina virtual (VM) com uma ou mais GPUs, o sistema exige drivers de dispositivo NVIDIA para que os aplicativos possam acessar o dispositivo. Verifique se as instâncias de máquina virtual (VM) têm espaço livre suficiente em disco. Escolha pelo menos 40 GB para o disco de inicialização ao criar a nova VM.

Para instalar os drivers, você tem estas duas opções:

Se você precisar de GPUs para gráficos 3D com aceleração de hardware, como área de trabalho remota ou jogos, consulte Instalar drivers para estações de trabalho virtuais (vWS) NVIDIA RTX.
Para outras cargas de trabalho, siga as instruções neste documento para instalar o driver NVIDIA.

Dica profissional:também é possível ignorar essa configuração criando VMs que usam imagens com drivers instalados. Consulte Como escolher um sistema operacional para mais informações.

Driver NVIDIA, kit de ferramentas CUDA e versões do ambiente de execução CUDA

Há diferentes componentes da versão dos drivers e do ambiente de execução que podem ser necessários no seu ambiente. Eles incluem os seguintes componentes:

Driver NVIDIA
Kit de ferramentas CUDA
Ambiente de execução CUDA

Ao instalar esses componentes, é possível configurar o ambiente de maneira que atenda às suas necessidades. Por exemplo, se você tiver uma versão anterior do TensorFlow que funcione melhor com uma versão anterior do kit de ferramentas CUDA, mas a GPU que você quer usar exija uma versão mais recente do driver NVIDIA, será possível instalar uma versão anterior de um kit de ferramentas CUDA com uma versão mais recente do driver NVIDIA.

No entanto, é preciso garantir que o driver NVIDIA e as versões do kit de ferramentas CUDA sejam compatíveis. Para o kit de ferramentas CUDA e a compatibilidade do driver NVIDIA, consulte a documentação da NVIDIA sobre a compatibilidade com CUDA.

Entender as ramificações do driver da NVIDIA

A NVIDIA oferece as três ramificações de driver a seguir:

Ramificação de suporte de longo prazo (LTSB): prioriza a estabilidade e minimiza a manutenção, com um ciclo de vida de suporte estendido de três anos. A LTSB mais recente testada e verificada pelo Google é a R580, que tem uma data de fim de suporte em agosto de 2028.
Ramificação de produção (PB): oferece melhorias de desempenho e suporte para o hardware mais recente. Ele oferece suporte total a cargas de trabalho de produção, mas tem um ciclo de vida de suporte mais curto, de até um ano. O PB mais recente testado e verificado pelo Google é o R570, que tem fim do suporte em fevereiro de 2026.
Nova ramificação de recursos (NFB): essa ramificação é para os primeiros usuários testarem novos recursos e não é recomendada para ambientes de produção.

Para cargas de trabalho de produção, use a ramificação de produção ou a ramificação de suporte de longo prazo. Para mais detalhes sobre as ramificações da NVIDIA, consulte a documentação da NVIDIA.

Ramificações recomendadas do driver NVIDIA

Use a tabela nesta seção para determinar a melhor ramificação do driver NVIDIA para seu tipo de máquina de GPU.

Na tabela a seguir, EOS indica que a NVIDIA lista essa ramificação como chegando ao fim do suporte. N/A indica que o sistema operacional (SO) especificado não pode ser executado no tipo de máquina.

Tipo de máquina	Modelo de GPU	Ramificações compatíveis	Ramificação recomendada (data de fim do suporte)	Driver mínimo para ramificação recomendada
A4X	Superchip NVIDIA Blackwell GB200	R570 ou mais recente	R580 (agosto de 2028)	Linux: `580.82.07` ou posterior Windows: N/A
A4	NVIDIA Blackwell B200	R570 ou mais recente	R580 (agosto de 2028)	Linux: `580.82.07` ou posterior Windows: N/A
A3 Ultra	NVIDIA H200	R570 ou mais recente	R580 (agosto de 2028)	Linux: `580.82.07` ou posterior Windows: N/A
A3 Mega, High, Edge	NVIDIA H100	R535 ou mais recente	R535 (junho de 2026)	Linux: `535.230.02` ou posterior Windows: N/A
G4	NVIDIA RTX PRO 6000	R580 ou mais recente	R580 (agosto de 2028)	Linux: `580.95.05` ou posterior Windows: `581.42` ou mais recente
G2	NVIDIA L4	R535 ou mais recente	R535 (junho de 2026)	Linux: `535.230.02` ou posterior Windows: `538.67` ou mais recente
A2 Standard, A2 Ultra	NVIDIA A100	R535 ou mais recente	R535 (junho de 2026)	Linux: `535.230.02` ou posterior Windows: `538.67` ou mais recente
N1	NVIDIA T4	R535 ou mais recente	R535 (junho de 2026)	Linux: `535.230.02` ou posterior Windows: `538.67` ou mais recente
N1	NVIDIA V100, P100, P4	R35 a R580¹	R535 (junho de 2026)	Linux: `535.230.02` ou posterior Windows: `538.67` ou mais recente

¹A NVIDIA anunciou que o R580 é a última ramificação de driver compatível com a arquitetura Pascal (P4 e P100) e Volta (V100).

Instalar drivers de GPU em VMs usando os guias do kit de ferramentas CUDA

Uma maneira de instalar o driver NVIDIA na maioria das VMs é instalar o Kit de ferramentas CUDA.

Para instalar o kit de ferramentas CUDA, siga estas etapas:

Selecione uma versão do kit de ferramentas CUDA que seja compatível com a versão do driver necessária.

Tipo de máquina	Modelo de GPU	Kit de ferramentas CUDA recomendado
A4X	Superchip NVIDIA Blackwell GB200	CUDA 12.8.1 ou mais recente
A4	NVIDIA Blackwell B200	CUDA 12.8.1 ou mais recente
A3 Ultra	NVIDIA H200	CUDA 12.4 ou mais recente
G4	NVIDIA RTX PRO 6000	CUDA 13.1 ou mais recente
G2	NVIDIA L4	CUDA 12.2.2 ou mais recente
A3 Mega, High, Edge	NVIDIA H100	CUDA 12.2.2 ou mais recente
A2 Standard, A2 Ultra	NVIDIA A100	CUDA 12.2.2 ou mais recente
N1	NVIDIA T4	CUDA 12.2.2 ou mais recente
N1	NVIDIA V100, P100, P4	CUDA 12.2.2 para CUDA 12 (versão final)¹

¹O CUDA Toolkit 12 é o último a oferecer suporte às arquiteturas Pascal (P4 e P100) e Volta (V100). A NVIDIA anunciou que a compilação off-line e o suporte a bibliotecas para essas arquiteturas serão removidos a partir do lançamento da versão principal do CUDA Toolkit 13.0. Para mais informações, consulte as notas da versão do driver NVIDIA 13.0.

Conecte-se à VM em que você quer instalar o driver.
Na VM, faça o download e instale o kit de ferramentas CUDA. Para encontrar o pacote do kit de ferramentas CUDA e as instruções de instalação, consulte o Arquivo do kit de ferramentas CUDA na documentação da NVIDIA.

Instalar drivers de GPU em VMs usando o script de instalação

Use os scripts a seguir para automatizar o processo de instalação. Para analisar esses scripts, consulte o repositório do GitHub (em inglês).

Linux

Use estas instruções para instalar drivers de GPU em uma VM em execução.

Sistemas operacionais compatíveis

O script de instalação do Linux foi testado nos seguintes sistemas operacionais:

Debian 12
Red Hat Enterprise Linux (RHEL) 8 e 9
Rocky Linux 8 e 9
Ubuntu 22 e 24

Se você usar esse script em outros sistemas operacionais, a instalação falhará. Esse script pode instalar drivers da NVIDIA e também o Kit de ferramentas do CUDA.

Para instalar os drivers de GPU e o kit de ferramentas CUDA, siga estas etapas:

Se você tiver a versão 2.38.0 ou posterior do Agente de operações que coleta métricas da GPU na VM, interrompa o agente antes de instalar ou fazer upgrade dos drivers de GPU. usando este script de instalação.

Para encerrar o agente de operações, execute o seguinte comando:
```
sudo systemctl stop google-cloud-ops-agent
```
Verifique se o Python 3 está instalado no seu sistema operacional.

Faça o download do script de instalação.

curl -L https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz --output cuda_installer.pyz

Execute o script de instalação.
```
sudo python3 cuda_installer.pyz install_driver --installation-mode=INSTALLATION_MODE --installation-branch=BRANCH
```
- INSTALLATION_MODE: o método de instalação. Use um dos seguintes valores:
  - repo: (padrão) instala o driver do repositório oficial de pacotes da NVIDIA.
  - binary: instala o driver usando o pacote de instalação binária.
- BRANCH: a ramificação do driver que você quer instalar. Use um dos seguintes valores:
  - prod: (padrão) a ramificação de produção. Essa ramificação é qualificada para uso em ambientes de produção para GPUs empresariais e de data center.
  - nfb: a nova ramificação de recurso. Essa ramificação inclui as atualizações mais recentes para usuários iniciais. Essa ramificação não é recomendada para ambientes de produção.
  - lts: a ramificação de suporte de longo prazo. Essa ramificação é mantida por um período mais longo do que uma ramificação de produção normal.
O script leva algum tempo para ser executado. A VM será reiniciada. Quando a VM for reiniciada, execute o script novamente para continuar a instalação.
Verifique a instalação. Consulte Verificar a instalação do driver da GPU.
Também é possível usar essa ferramenta para instalar o guia de ferramentas CUDA. Para instalar o kit de ferramentas CUDA, execute o seguinte comando:
```
sudo python3 cuda_installer.pyz install_cuda --installation-mode=INSTALLATION_MODE --installation-branch=BRANCH
```
Use os mesmos valores para INSTALLATION_MODE e BRANCH que você usou durante a instalação do driver.

O script vai levar um tempo para ser executado. A VM será reiniciada. Quando a VM for reiniciada, execute o script novamente para continuar a instalação.
Verificar a instalação do kit de ferramentas CUDA.
```
python3 cuda_installer.pyz verify_cuda
```
Depois de concluir a instalação, reinicie a VM.

Linux (script de inicialização)

Use estas instruções para instalar drivers de GPU durante a inicialização de uma VM.

Sistemas operacionais compatíveis

O script de instalação do Linux foi testado nos seguintes sistemas operacionais:

Debian 12
Red Hat Enterprise Linux (RHEL) 8 e 9
Rocky Linux 8 e 9
Ubuntu 22 e 24

Se você usar esse script em outros sistemas operacionais, a instalação falhará. Esse script pode instalar drivers da NVIDIA e também o Kit de ferramentas do CUDA.

Use o seguinte script de inicialização. para automatizar o driver e a instalação do kit de ferramentas do CUDA:

#!/bin/bash
if test -f /opt/google/cuda-installer
then
  exit
fi

mkdir -p /opt/google/cuda-installer
cd /opt/google/cuda-installer/ || exit

if test -f cuda_installation
then
  exit
fi

curl -fSsL -O https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz
python3 cuda_installer.pyz install_cuda

É possível anexar as flags --installation-mode INSTALLATION_MODE e --installation-branch BRANCH ao comando de instalação para indicar qual modo de instalação e qual ramificação de driver você quer instalar.

INSTALLATION_MODE: o método de instalação. Use um dos seguintes valores:
- repo: (padrão) instala o driver do repositório oficial de pacotes da NVIDIA.
- binary: instala o driver usando o pacote de instalação binária.
BRANCH: a ramificação do driver que você quer instalar. Use um dos seguintes valores:
- prod: (padrão) a ramificação de produção. Essa ramificação é qualificada para uso em ambientes de produção para GPUs empresariais e de data center.
- nfb: a nova ramificação de recurso. Essa ramificação inclui as atualizações mais recentes para usuários iniciais. Essa ramificação não é recomendada para ambientes de produção.
- lts: a ramificação de suporte de longo prazo. Essa ramificação é mantida por um período mais longo do que uma ramificação de produção normal.

Windows

Esse script de instalação pode ser usado em VMs com inicialização segura ativada.

Para VMs do Windows que usam uma série de máquinas G2, esse script instala apenas o driver da NVIDIA.
Para outros tipos de máquina, o script instala o driver da NVIDIA e o kit de ferramentas CUDA.

Abra um terminal do PowerShell como administrador e conclua as seguintes etapas:

Se você estiver usando o Windows Server 2016, defina a versão do Transport Layer Security (TLS) como 1.2.
```
[Net.ServicePointManager]::SecurityProtocol = 'Tls12'
```

Faça o download do script.

Invoke-WebRequest https://github.com/GoogleCloudPlatform/compute-gpu-installation/raw/main/windows/install_gpu_driver.ps1 -OutFile C:\install_gpu_driver.ps1

Execute o script.
```
C:\install_gpu_driver.ps1
```
O script leva algum tempo para ser executado. Nenhum prompt de comando é fornecido durante o processo de instalação. Depois que o script é encerrado, o driver é instalado.

Esse script instala os drivers no seguinte local padrão na VM: C:\Program Files\NVIDIA Corporation\\.
Verifique a instalação. Consulte Verificar a instalação do driver da GPU.

Instalar drivers de GPU (VMs com inicialização segura)

Estas instruções são para instalar drivers de GPU em VMs do Linux que usam inicialização segura.

Suporte a GPUs

Os procedimentos nesta seção são compatíveis com todos os modelos de GPU disponíveis no Compute Engine.

Não é possível usar esses procedimentos para instalar drivers em instâncias de inicialização segura que tenham versões de estações de trabalho virtuais (vWS) NVIDIA RTX das nossas GPUs anexadas.

Se você está usando uma VM do Windows ou uma VM do Linux que não usa a inicialização segura, analise uma das seguintes instruções:

A instalação do driver em uma VM com inicialização segura é diferente para VMs do Linux, porque elas exigem que todos os módulos do kernel tenham uma assinatura de certificado confiável.

Instalação

Use uma das seguintes opções para instalar drivers com certificados confiáveis:

Crie um certificado confiável para seus motoristas. Para essa opção, escolha uma das seguintes opções:
- Método automatizado: use uma ferramenta de criação de imagens para criar imagens de inicialização com certificados confiáveis para seus drivers instalados.
- Método manual: gere seu próprio certificado e use-o para assinar os módulos do kernel do driver de GPU.
Use drivers pré-assinados com um certificado confiável. Esse método só é compatível com o Ubuntu.

Autoassinatura (automatizada)

Sistemas operacionais compatíveis:

Esse método automatizado de autoassinatura foi testado nos seguintes sistemas operacionais:

Debian 12
Red Hat Enterprise Linux (RHEL) 8 e 9
Rocky Linux 8 e 9
Ubuntu 22 e 24

Procedimento

Para criar uma imagem do SO com certificados autoassinados, siga estas etapas:

1. In the Google Cloud console, activate Cloud Shell.
  
  Activate Cloud Shell
  
  At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
2. Faça o download da ferramenta cuda_installer. Para fazer o download da versão mais recente do script, execute o seguinte comando:
```
curl -L https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz --output cuda_installer.pyz
```
3. Crie uma imagem com a inicialização segura ativada executando o seguinte comando: O processo de criação da imagem pode levar até 20 minutos.
```
PROJECT=PROJECT_ID
ZONE=ZONE
BASE_IMAGE=BASE_IMAGE_NAME
SECURE_BOOT_IMAGE=IMAGE_NAME

python3 cuda_installer.pyz build_image \
  --project $PROJECT \
  --vm-zone $ZONE \
  --base-image $BASE_IMAGE $SECURE_BOOT_IMAGE
```
  Substitua:
  - PROJECT_ID: ID do projeto em que a imagem será criada
  - ZONE: zona em que uma VM temporária será criada. Por exemplo, us-west4-a.
  - IMAGE_NAME: nome da imagem que será criada.
  - BASE_IMAGE_NAME: selecione uma das seguintes opções:
    - debian-12
    - rhel-8 ou rhel-9
    - rocky-8 ou rocky-9
    - ubuntu-22 ou ubuntu-24
  Você também pode adicionar a flag --family NAME para adicionar a nova imagem a uma família de imagens.
  
  Para conferir todas as opções de personalização da imagem, execute python3 cuda_installer.pyz build_image --help. Você também pode revisar a documentação do cuda_installer no GitHub (em inglês).
4. Verifique a imagem. Siga estas etapas para verificar se a imagem tem a inicialização segura ativada e pode criar instâncias de GPU com drivers NVIDIA instalados.
  1. Crie uma instância de VM de teste para verificar se a imagem está configurada corretamente e se os drivers de GPU são carregados. O exemplo a seguir cria um tipo de máquina N1 com um único acelerador NVIDIA T4 anexado. No entanto, é possível usar qualquer tipo de máquina com GPU compatível.
```
TEST_INSTANCE_NAME=TEST_INSTANCE_NAME
ZONE=ZONE

gcloud compute instances create $TEST_INSTANCE_NAME \
 --project=$PROJECT \
 --zone=$ZONE \
 --machine-type=n1-standard-4 \
 --accelerator=count=1,type=nvidia-tesla-t4 \
 --create-disk=auto-delete=yes,boot=yes,device-name=$TEST_INSTANCE_NAME,image=projects/$PROJECT/global/images/$SECURE_BOOT_IMAGE,mode=rw,size=100,type=pd-balanced \
 --shielded-secure-boot \
 --shielded-vtpm \
 --shielded-integrity-monitoring \
 --maintenance-policy=TERMINATE
```
    Substitua:
    - TEST_INSTANCE_NAME: um nome para a instância de VM de teste
    - ZONE: uma zona com GPUs T4 ou a GPU de sua escolha. Para mais informações, consulte Regiões e zonas de GPU.
  2. Verifique se a Inicialização segura está ativada executando o comando mokutil --sb-state na VM de teste usando gcloud compute ssh.
```
gcloud compute ssh --project=$PROJECT --zone=$ZONE $TEST_INSTANCE_NAME --command "mokutil --sb-state"
```
  3. Verifique se o driver está instalado executando o comando nvidia-smi na VM de teste usando gcloud compute ssh.
```
gcloud compute ssh --project=$PROJECT --zone=$ZONE $TEST_INSTANCE_NAME --command "nvidia-smi"
```
    Se você tiver instalado o CUDA Toolkit, use a ferramenta cuda_installer para verificar a instalação da seguinte maneira:
```
gcloud compute ssh --project=$PROJECT --zone=$ZONE $TEST_INSTANCE_NAME --command "python3 cuda_installer.pyz verify_cuda"
```
5. Fazer a limpeza. Depois de verificar se a imagem personalizada funciona, não é necessário manter a VM de verificação. Para excluir a VM, execute o comando a seguir:
```
gcloud compute instances delete --zone=$ZONE --project=$PROJECT $TEST_INSTANCE_NAME
```
6. Opcional: para excluir a imagem de disco criada, execute o seguinte comando:
```
gcloud compute images delete --project=$PROJECT $SECURE_BOOT_IMAGE
```

Verificar a instalação do driver da GPU

Depois de concluir as etapas de instalação do driver, verifique se o driver foi instalado e inicializado corretamente.

Linux

Conecte-se à instância do Linux e use o comando nvidia-smi para verificar se o driver está funcionando corretamente.

sudo nvidia-smi

O resultado será assim:

  +-----------------------------------------------------------------------------------------+
  | NVIDIA-SMI 580.82.07              Driver Version: 580.82.07      CUDA Version: 13.0     |
  +-----------------------------------------+------------------------+----------------------+
  | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
  | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
  |                                         |                        |               MIG M. |
  |=======================================+====================+====================|
  |   0  Tesla T4                       On  |   00000000:00:04.0 Off |                    0 |
  | N/A   53C    P8             17W /   70W |       0MiB /  15360MiB |      0%      Default |
  |                                         |                        |                  N/A |
  +-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
  | Processes:                                                                              |
  |  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
  |        ID   ID                                                               Usage      |
  |=========================================================================================|
  |  No running processes found                                                             |
  +-----------------------------------------------------------------------------------------+

Se esse comando falhar, verifique se as GPUs estão anexadas à VM. Para verificar se há dispositivos NVIDIA PCI, execute o seguinte comando:

sudo lspci | grep -i "nvidia"

Windows Server

Conecte-se à instância do Windows Server e abra um terminal do PowerShell. Em seguida, execute o comando a seguir para verificar se o driver está sendo executado corretamente.

nvidia-smi

O resultado será assim:

+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 538.67                 Driver Version: 538.67       CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                     TCC/WDDM  | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  NVIDIA L4                    WDDM  | 00000000:00:03.0 Off |                    0 |
| N/A   66C    P8              17W /  72W |    128MiB / 23034MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A      4888    C+G   ...CBS_cw5n1h2txyewy\TextInputHost.exe    N/A      |
|    0   N/A  N/A      5180    C+G   ....Search_cw5n1h2txyewy\SearchApp.exe    N/A      |
+---------------------------------------------------------------------------------------+

A seguir

Consulte Monitorar o desempenho da GPU para mais informações sobre esse assunto.

Para lidar com a manutenção do host da GPU, consulte Manipular eventos de manutenção do host da GPU.
Para melhorar o desempenho da rede, consulte Usar uma largura de banda de rede maior.
Para resolver problemas de VMs de GPU, consulte este link.

Instalar os drivers da GPU

Driver NVIDIA, kit de ferramentas CUDA e versões do ambiente de execução CUDA

Entender as ramificações do driver da NVIDIA

Ramificações recomendadas do driver NVIDIA

Instalar drivers de GPU em VMs usando os guias do kit de ferramentas CUDA

Instalar drivers de GPU em VMs usando o script de instalação

Linux

Linux (script de inicialização)

Windows

Instalar drivers de GPU (VMs com inicialização segura)

Suporte a GPUs

Instalação

Autoassinatura (automatizada)

Autoassinatura (manual)

Pré-assinada (somente Ubuntu)

Ubuntu PRO e LTS

Ubuntu PRO FIPS

Ubuntu 18.04

Ubuntu 20.04

Ubuntu 22.04

Verificar a instalação do driver da GPU

Linux

Windows Server

A seguir