GPU ドライバのインストール

1 つ以上の GPU を使用するインスタンスを作成したら、アプリケーションがデバイスにアクセスできるようにするため、システムにデバイス ドライバが必要となります。このガイドでは、公開イメージを使用するインスタンスに NVIDIA の独自ドライバをインストールする方法を紹介します。

仮想ワークステーション用の GRID ドライバをインストールするには、仮想ワークステーション用の GRID ドライバのインストールをご覧ください。

始める前に

CUDA のバージョンごとに、最低限必要な GPU ドライバのバージョンがあります。ご使用の CUDA に必要なドライバのバージョンを確認するには、CUDA ツールキットと互換ドライバのバージョンをご覧ください。

Compute Engine で実行される NVIDIA GPU では、次のドライバ バージョンを使用する必要があります。

  • Linux インスタンス:

    • NVIDIA 410.79 以降のドライバ
  • Windows Server インスタンス:

    • NVIDIA 426.00 以降のドライバ

ほとんどのドライバのインストールでは、NVIDIA CUDA ツールキットをインストールすることにより、これらのドライバを入手できます。

後述の手順に従って、NVIDIA® GPU の CUDA と関連ドライバをインストールします。アプリケーションのニーズを確認して、最も効果的に機能するドライバ バージョンを特定してください。ご使用のソフトウェアに特定のバージョンの CUDA が必要な場合は、必要なバージョンの CUDA をダウンロードするようにコマンドを変更します。

CUDA のサポートや、CUDA インストールを変更する手順については、CUDA ツールキットのドキュメントをご覧ください。

このプロセスを使用すると、ほとんどの公開イメージのインスタンスにドライバを手動でインストールできます。カスタム イメージの場合は、固有環境で機能するようにプロセスの変更が必要になることがあります。

インストールが正常に完了するためには、オペレーティング システムに最新のパッケージ更新が必要です。

CentOS / RHEL

  1. 最新のカーネル パッケージをインストールします。必要に応じて、このコマンドはシステムの再起動も行います。

    sudo yum clean all
    sudo yum install -y kernel | grep -q 'already installed' || sudo reboot
    
  2. 前の手順でシステムが再起動された場合は、インスタンスに再接続します。

  3. カーネル ヘッダーと開発パッケージをインストールします。

    sudo yum install -y kernel-devel-$(uname -r) kernel-headers-$(uname -r)
    
  4. CUDA ツールキットのドライバ リポジトリを選択し、それをインスタンスに追加します。

    • CentOS / RHEL 8

      sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/cuda-repo-rhel8-10.1.243-1.x86_64.rpm
      
    • CentOS / RHEL 7

      sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-repo-rhel7-10.0.130-1.x86_64.rpm
      
    • CentOS / RHEL 6

      sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel6/x86_64/cuda-repo-rhel6-10.0.130-1.x86_64.rpm
      
  5. epel-release リポジトリをインストールします。このリポジトリには DKMS パッケージが含まれています。これは CentOS に NVIDIA ドライバをインストールするために必要です。

    • CentOS 6/7/8 と RHEL 6/7

      sudo yum install epel-release
      
    • RHEL 8 のみ

      sudo yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
      
  6. Yum キャッシュを消去します。

    sudo yum clean all
    
  7. CUDA をインストールします。このパッケージには NVIDIA ドライバが含まれています。

    sudo yum install cuda
    

SLES

  1. ドライバをインストールするインスタンスに接続します。

  2. 最新のカーネル パッケージをインストールします。必要に応じて、このコマンドはシステムの再起動も行います。

    sudo zypper refresh
    sudo zypper up -y kernel-default | grep -q 'already installed' || sudo reboot
    
  3. 前の手順でシステムが再起動された場合は、インスタンスに再接続します。

  4. CUDA ツールキットのドライバ リポジトリを選択し、それをインスタンスに追加します。

    • SLES 15

      sudo rpm --import https://developer.download.nvidia.com/compute/cuda/repos/sles15/x86_64/7fa2af80.pub
      sudo yum install https://developer.download.nvidia.com/compute/cuda/repos/sles15/x86_64/cuda-repo-sles15-10.0.130-1.x86_64.rpm
      
    • SLES 12 Service Pack 4

      sudo rpm --import https://developer.download.nvidia.com/compute/cuda/repos/sles124/x86_64/7fa2af80.pub
      sudo yum install https://developer.download.nvidia.com/compute/cuda/repos/sles124/x86_64/cuda-repo-sles124-10.1.243-1.x86_64.rpm
      
  5. Zypper を更新します。

    sudo zypper refresh
    
  6. NVIDIA ドライバが含まれる CUDA をインストールします。

    sudo zypper install cuda
    

Ubuntu

  1. ドライバをインストールするインスタンスに接続します。

  2. CUDA ツールキットのドライバ リポジトリを選択し、それをインスタンスに追加します。

    • Ubuntu 20.04

      curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
      sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
      sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/7fa2af80.pub
      sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/ /"
      
    • Ubuntu 18.04 LTS

      curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
      sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
      sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
      sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ /"
      
    • Ubuntu 16.04 LTS

      curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-ubuntu1604.pin
      sudo mv cuda-ubuntu1604.pin /etc/apt/preferences.d/cuda-repository-pin-600
      sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub
      sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/ /"
      
  3. パッケージ リストを更新します。

    sudo apt update
    
  4. NVIDIA ドライバが含まれる CUDA をインストールします。

    sudo apt install cuda
    

Windows Server

  1. ドライバをインストールするインスタンスに接続します。

  2. R426 ブランチ: NVIDIA 426.00 以上のドライバを含む .exe インストーラ ファイルをダウンロードして、インスタンスに保存します。ほとんどの Windows Server インスタンスでは、次のオプションのいずれかを使用できます。

    たとえば、Windows Server 2019 では、管理者として PowerShell ターミナルを開き、wget コマンドを使用して、必要なドライバのインストーラをダウンロードできます。

    PS C:\> wget https://developer.download.nvidia.com/compute/cuda/10.1/Prod/network_installers/cuda_10.1.243_win10_network.exe -O cuda_10.1.243_win10_network.exe
  3. .exe インストーラを実行します。たとえば、管理者として PowerShell ターミナルを開き、次のコマンドを実行します。

    PS C:\> .\\cuda_10.1.243_win10_network.exe
    

GPU ドライバのインストールの確認

ドライバのインストール手順が完了したら、ドライバのインストールと初期化が正しく行われたことを確認します。

Linux

Linux インスタンスに接続し、nvidia-smi コマンドを使用して、ドライバが正常に稼働していることを確認します。

nvidia-smi

出力は次のようになります。

Wed Jan  2 19:51:51 2019
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.79       Driver Version: 410.79       CUDA Version: 10.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla P4            Off  | 00000000:00:04.0 Off |                    0 |
| N/A   42C    P8     7W /  75W |     62MiB /  7611MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

Windows Server

Windows Server インスタンスに接続し、nvidia-smi.exe ツールを使用して、ドライバが正常に稼働していることを確認します。

"C:\Program Files\NVIDIA Corporation\NVSMI\nvidia-smi.exe"

出力は次のようになります。

Mon Aug 26 18:09:03 2019
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 426.00      Driver Version: 426.00       CUDA Version: 10.1      |
|-------------------------------+----------------------+----------------------+
| GPU  Name            TCC/WDDM | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla P4            TCC  | 00000000:00:04.0 Off |                    0 |
| N/A   27C    P8     7W /  75W |      0MiB /  7611MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

次のステップ