Installer des pilotes de GPU

Une fois que vous avez créé une instance avec un ou plusieurs GPU, votre système requiert des pilotes de périphérique pour que vos applications puissent accéder au périphérique. Ce guide montre comment installer des pilotes propriétaires NVIDIA sur des instances avec des images publiques.

Pour installer des pilotes GRID pour les postes de travail virtuels, consultez la section Installer des pilotes GRID pour les postes de travail virtuels.

Avant de commencer

Chaque version de CUDA exige une version minimale du pilote de GPU ou une version ultérieure. Pour vérifier la version minimale requise pour votre version de CUDA, consultez les versions de pilote compatibles avec le CUDA Toolkit.

Les GPU NVIDIA exécutés sur Compute Engine doivent utiliser les versions de pilotes suivantes :

  • Instances Linux :

    • Pilote NVIDIA 410.79 ou supérieur
  • Instances Windows Server :

    • Pilote NVIDIA 426.00 ou supérieur

Pour la plupart des installations de pilotes, vous pouvez obtenir ces pilotes en installant le NVIDIA CUDA Toolkit.

Suivez la procédure décrite ci-dessous pour installer CUDA et les pilotes associés pour les GPU NVIDIA®. Passez en revue les besoins de votre application pour déterminer la version de pilote la plus adaptée. Si le logiciel que vous utilisez nécessite une version spécifique de CUDA, modifiez les commandes afin de télécharger la version de CUDA dont vous avez besoin.

Pour plus d'informations sur la prise en charge de CUDA et sur les étapes à suivre pour modifier votre installation CUDA, consultez la documentation relative au CUDA Toolkit.

Vous pouvez utiliser ce processus pour installer manuellement des pilotes sur des instances avec la plupart des images publiques. Pour les images personnalisées, vous devrez peut-être modifier le processus afin qu'il fonctionne dans votre environnement spécifique.

Pour garantir la réussite de l'installation, veillez à ce que votre système d'exploitation dispose des dernières mises à jour des packages.

CentOS/RHEL

  1. Installez la dernière version du package de noyau. Si nécessaire, cette commande entraîne également le redémarrage du système.

    sudo yum clean all
    sudo yum install -y kernel | grep -q 'already installed' || sudo reboot
    
  2. Si le système a redémarré à l'étape précédente, reconnectez-vous à l'instance.

  3. Installez les en-têtes de noyau et les packages de développement.

    sudo yum install -y kernel-devel-$(uname -r) kernel-headers-$(uname -r)
    
  4. Sélectionnez un dépôt de pilotes pour le CUDA Toolkit et ajoutez-le à votre instance.

    • CentOS/RHEL 8

      sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/cuda-repo-rhel8-10.1.243-1.x86_64.rpm
      
    • CentOS/RHEL 7

      sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-repo-rhel7-10.0.130-1.x86_64.rpm
      
    • CentOS/RHEL 6

      sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel6/x86_64/cuda-repo-rhel6-10.0.130-1.x86_64.rpm
      
  5. Installez le dépôt epel-release. Ce dépôt comprend les packages DKMS requis pour installer les pilotes NVIDIA sur CentOS.

    • CentOS 6/7/8 et RHEL 6/7

      sudo yum install epel-release
      
    • RHEL 8 uniquement

      sudo yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
      
  6. Nettoyez le cache Yum :

    sudo yum clean all
    
  7. Installez le package CUDA, qui inclut le pilote NVIDIA.

    sudo yum install cuda
    

SLES

  1. Connectez-vous à l'instance sur laquelle vous souhaitez installer le pilote.

  2. Installez la dernière version du package de noyau. Si nécessaire, cette commande entraîne également le redémarrage du système.

    sudo zypper refresh
    sudo zypper up -y kernel-default | grep -q 'already installed' || sudo reboot
    
  3. Si le système a redémarré à l'étape précédente, reconnectez-vous à l'instance.

  4. Sélectionnez un dépôt de pilotes pour le CUDA Toolkit et ajoutez-le à votre instance.

    • SLES 15

      sudo rpm --import https://developer.download.nvidia.com/compute/cuda/repos/sles15/x86_64/7fa2af80.pub
      sudo zypper install https://developer.download.nvidia.com/compute/cuda/repos/sles15/x86_64/cuda-repo-sles15-10.0.130-1.x86_64.rpm
      
    • SLES 12 Service Pack 4

      sudo rpm --import https://developer.download.nvidia.com/compute/cuda/repos/sles124/x86_64/7fa2af80.pub
      sudo zypper install https://developer.download.nvidia.com/compute/cuda/repos/sles124/x86_64/cuda-repo-sles124-10.1.243-1.x86_64.rpm
      
  5. Actualisez Zypper.

    sudo zypper refresh
    
  6. Installez CUDA, qui inclut le pilote NVIDIA.

    sudo zypper install cuda
    

Ubuntu

  1. Connectez-vous à l'instance sur laquelle vous souhaitez installer le pilote.

  2. Sélectionnez un dépôt de pilotes pour le CUDA Toolkit et ajoutez-le à votre instance.

    • Ubuntu 20.04

      curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
      sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
      sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/7fa2af80.pub
      sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/ /"
      
    • Ubuntu 18.04 LTS

      curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
      sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
      sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
      sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ /"
      
    • Ubuntu 16.04 LTS

      curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-ubuntu1604.pin
      sudo mv cuda-ubuntu1604.pin /etc/apt/preferences.d/cuda-repository-pin-600
      sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub
      sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/ /"
      
  3. Mettez à jour les listes de packages.

    sudo apt update
    
  4. Installez CUDA, qui inclut le pilote NVIDIA.

    sudo apt install cuda
    

Windows Server

  1. Connectez-vous à l'instance sur laquelle vous souhaitez installer le pilote.

  2. Téléchargez sur votre instance un fichier d'installation .exe contenant la branche R426 (pilote NVIDIA 426.00 ou supérieur). Pour la plupart des instances Windows Server, vous pouvez utiliser l'une des options suivantes :

    Par exemple, dans Windows Server 2019, vous pouvez ouvrir un terminal PowerShell en tant qu'administrateur et utiliser la commande wget pour télécharger le programme d'installation du pilote dont vous avez besoin.

    PS C:\> wget https://developer.download.nvidia.com/compute/cuda/10.1/Prod/network_installers/cuda_10.1.243_win10_network.exe -O cuda_10.1.243_win10_network.exe
  3. Lancez le programme d'installation .exe. Par exemple, vous pouvez ouvrir un terminal PowerShell en tant qu'administrateur et exécuter la commande suivante :

    PS C:\> .\\cuda_10.1.243_win10_network.exe
    

Vérifier l'installation du pilote de GPU

Une fois l'installation du pilote effectuée, vérifiez que celui-ci est correctement installé et initialisé.

Linux

Connectez-vous à l'instance Linux et utilisez la commande nvidia-smi pour vérifier que le pilote fonctionne correctement.

nvidia-smi

Le résultat se présente comme suit :

Wed Jan  2 19:51:51 2019
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.79       Driver Version: 410.79       CUDA Version: 10.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla P4            Off  | 00000000:00:04.0 Off |                    0 |
| N/A   42C    P8     7W /  75W |     62MiB /  7611MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

Windows Server

Connectez-vous à l'instance Windows Server et utilisez l'outil nvidia-smi.exe pour vérifier que le pilote fonctionne correctement.

"C:\Program Files\NVIDIA Corporation\NVSMI\nvidia-smi.exe"

Le résultat se présente comme suit :

Mon Aug 26 18:09:03 2019
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 426.00      Driver Version: 426.00       CUDA Version: 10.1      |
|-------------------------------+----------------------+----------------------+
| GPU  Name            TCC/WDDM | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla P4            TCC  | 00000000:00:04.0 Off |                    0 |
| N/A   27C    P8     7W /  75W |      0MiB /  7611MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

Étapes suivantes