Como instalar drivers de GPU

Depois que você criar uma instância com uma ou mais GPUs, o sistema precisará de drivers para que os aplicativos possam acessar o dispositivo. Neste guia, mostramos as maneiras de instalar drivers proprietários da NVIDIA em instâncias com imagens públicas.

Para instalar drivers GRID para estações de trabalho virtuais, consulte Como instalar de drivers GRID para estações de trabalho virtuais.

Antes de começar

Cada versão do CUDA requer uma versão mínima do driver da GPU ou uma versão posterior. Para verificar o driver mínimo necessário para sua versão do CUDA, consulte Kit de ferramentas CUDA e versões compatíveis do driver.

Nas GPUs NVIDIA em execução no Compute Engine, as seguintes versões do driver precisam ser utilizadas:

  • Instâncias do Linux:

    • Driver NVIDIA 410.79 ou superior
  • Instâncias do Windows Server:

    • Driver NVIDIA 426.00 ou superior

Geralmente, para conseguir esses drivers, basta instalar o Kit de ferramentas CUDA do NVIDIA.

Siga as etapas a seguir para instalar o CUDA e os drivers associados às GPUs NVIDIA®. Analise as necessidades do seu aplicativo para determinar a versão do driver que funciona melhor. Se o software que você está usando requer uma versão específica de CUDA, modifique os comandos para fazer o download da versão de CUDA que você precisa.

Para mais informações sobre a compatibilidade com o CUDA e para modificar a instalação do CUDA, consulte a Documentação do kit de ferramentas do CUDA.

Use este processo para instalar manualmente drivers em instâncias com a maioria das imagens públicas. Para imagens personalizadas, pode ser preciso modificar o processo para que funcione em seu ambiente único.

Para garantir uma instalação bem-sucedida, o sistema operacional precisa ter as atualizações mais recentes.

CentOS/RHEL

  1. Instale o pacote mais recente do kernel. Se necessário, esse comando também reinicializa o sistema.

    sudo yum clean all
    sudo yum install -y kernel | grep -q 'already installed' || sudo reboot
    
  2. Se o sistema foi reinicializado na etapa anterior, reconecte-se à instância.

  3. Instale cabeçalhos de kernel e pacotes de desenvolvimento.

    sudo yum install -y kernel-devel-$(uname -r) kernel-headers-$(uname -r)
    
  4. Selecione um repositório de drivers para o kit de ferramentas do CUDA e adicione-o à instância.

    • CentOS/RHEL 8

      sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/cuda-repo-rhel8-10.1.243-1.x86_64.rpm
      
    • CentOS/RHEL 7

      sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-repo-rhel7-10.0.130-1.x86_64.rpm
      
    • CentOS/RHEL 6

      sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel6/x86_64/cuda-repo-rhel6-10.0.130-1.x86_64.rpm
      
  5. Instale o repositório epel-release. Esse repositório inclui os pacotes DKMS, que são necessários para instalar drivers da NVIDIA no CentOS.

    • CentOS 6/7/8 e RHEL 6/7

      sudo yum install epel-release
      
    • Somente RHEL 8

      sudo yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
      
  6. Limpe o cache do Yum:

    sudo yum clean all
    
  7. Instale o CUDA. Este pacote inclui o driver NVIDIA.

    sudo yum install cuda
    

SLES

  1. Conecte-se à instância em que você quer instalar o driver.

  2. Instale o pacote mais recente do kernel. Se necessário, esse comando também reinicializa o sistema.

    sudo zypper refresh
    sudo zypper up -y kernel-default | grep -q 'already installed' || sudo reboot
    
  3. Se o sistema foi reinicializado na etapa anterior, reconecte-se à instância.

  4. Selecione um repositório de drivers para o kit de ferramentas do CUDA e adicione-o à instância.

    • SLES 15

      sudo rpm --import https://developer.download.nvidia.com/compute/cuda/repos/sles15/x86_64/7fa2af80.pub
      sudo zypper install https://developer.download.nvidia.com/compute/cuda/repos/sles15/x86_64/cuda-repo-sles15-10.0.130-1.x86_64.rpm
      
    • SLES 12 com Service Pack 4

      sudo rpm --import https://developer.download.nvidia.com/compute/cuda/repos/sles124/x86_64/7fa2af80.pub
      sudo zypper install https://developer.download.nvidia.com/compute/cuda/repos/sles124/x86_64/cuda-repo-sles124-10.1.243-1.x86_64.rpm
      
  5. Atualize o Zypper.

    sudo zypper refresh
    
  6. Instale o CUDA, que inclui o driver NVIDIA.

    sudo zypper install cuda
    

Ubuntu

  1. Conecte-se à instância em que você quer instalar o driver.

  2. Selecione um repositório de drivers para o kit de ferramentas do CUDA e adicione-o à instância.

    • Ubuntu 20.04

      curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
      sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
      sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/7fa2af80.pub
      sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/ /"
      
    • Ubuntu 18.04 LTS

      curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
      sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
      sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
      sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ /"
      
    • Ubuntu 16.04 LTS

      curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-ubuntu1604.pin
      sudo mv cuda-ubuntu1604.pin /etc/apt/preferences.d/cuda-repository-pin-600
      sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub
      sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/ /"
      
  3. Atualize as listas de pacotes.

    sudo apt update
    
  4. Instale o CUDA, que inclui o driver NVIDIA.

    sudo apt install cuda
    

Windows Server

  1. Conecte-se à instância em que você quer instalar o driver.

  2. Faça o download do arquivo de instalação .exe na instância que contém o branch R426: driver NVIDIA 426.00 ou versão posterior. Para a maioria das instâncias do Windows Server, é possível usar uma das seguintes opções:

    Por exemplo, no Windows Server 2019, é possível abrir um terminal do PowerShell como administrador e usar o comando wget para fazer o download do instalador do driver necessário.

    PS C:\> wget https://developer.download.nvidia.com/compute/cuda/10.1/Prod/network_installers/cuda_10.1.243_win10_network.exe -O cuda_10.1.243_win10_network.exe
  3. Execute o instalador .exe. Por exemplo, abra um terminal do PowerShell como administrador e execute o seguinte comando:

    PS C:\> .\\cuda_10.1.243_win10_network.exe
    

Como verificar a instalação do driver da GPU

Depois de concluir as etapas de instalação do driver, verifique se o driver foi instalado e inicializado corretamente.

Linux

Conecte-se à instância do Linux e use o comando nvidia-smi para verificar se o driver está funcionando corretamente.

nvidia-smi

A saída será assim:

Wed Jan  2 19:51:51 2019
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.79       Driver Version: 410.79       CUDA Version: 10.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla P4            Off  | 00000000:00:04.0 Off |                    0 |
| N/A   42C    P8     7W /  75W |     62MiB /  7611MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

Windows Server

Conecte-se à instância do Windows Server e use a ferramenta nvidia-smi.exe para verificar se o driver está sendo executado corretamente.

"C:\Program Files\NVIDIA Corporation\NVSMI\nvidia-smi.exe"

A saída será assim:

Mon Aug 26 18:09:03 2019
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 426.00      Driver Version: 426.00       CUDA Version: 10.1      |
|-------------------------------+----------------------+----------------------+
| GPU  Name            TCC/WDDM | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla P4            TCC  | 00000000:00:04.0 Off |                    0 |
| N/A   27C    P8     7W /  75W |      0MiB /  7611MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

A seguir