Depois que você criar uma instância com uma ou mais GPUs, o sistema precisará de drivers para que os aplicativos possam acessar o dispositivo. Neste guia, mostramos as maneiras de instalar drivers proprietários da NVIDIA em instâncias com imagens públicas.
Para instalar drivers GRID para estações de trabalho virtuais, consulte Como instalar de drivers GRID para estações de trabalho virtuais.
Antes de começar
- Para usar os exemplos de linha de comando deste guia, siga estas etapas:
- Instale ou atualize a ferramenta de linha de comando gcloud para a versão mais recente.
- Defina uma região e uma zona padrão.
- Para usar os exemplos da API deste guia, configure o acesso a ela.
Cada versão do CUDA requer uma versão mínima do driver da GPU ou uma versão posterior. Para verificar o driver mínimo necessário para sua versão do CUDA, consulte Kit de ferramentas CUDA e versões compatíveis do driver.
Nas GPUs NVIDIA em execução no Compute Engine, as seguintes versões do driver precisam ser utilizadas:
Instâncias do Linux:
- Driver NVIDIA 410.79 ou superior
Instâncias do Windows Server:
- Driver NVIDIA 426.00 ou superior
Geralmente, para conseguir esses drivers, basta instalar o Kit de ferramentas CUDA do NVIDIA.
Siga as etapas a seguir para instalar o CUDA e os drivers associados às GPUs NVIDIA®. Analise as necessidades do seu aplicativo para determinar a versão do driver que funciona melhor. Se o software que você está usando requer uma versão específica de CUDA, modifique os comandos para fazer o download da versão de CUDA que você precisa.
Para mais informações sobre a compatibilidade com o CUDA e para modificar a instalação do CUDA, consulte a Documentação do kit de ferramentas do CUDA.
Use este processo para instalar manualmente drivers em instâncias com a maioria das imagens públicas. Para imagens personalizadas, pode ser preciso modificar o processo para que funcione em seu ambiente único.
Para garantir uma instalação bem-sucedida, o sistema operacional precisa ter as atualizações mais recentes.
CentOS/RHEL
Instale o pacote mais recente do kernel. Se necessário, esse comando também reinicializa o sistema.
sudo yum clean all sudo yum install -y kernel | grep -q 'already installed' || sudo reboot
Se o sistema foi reinicializado na etapa anterior, reconecte-se à instância.
Instale cabeçalhos de kernel e pacotes de desenvolvimento.
sudo yum install -y kernel-devel-$(uname -r) kernel-headers-$(uname -r)
Selecione um repositório de drivers para o kit de ferramentas do CUDA e adicione-o à instância.
CentOS/RHEL 8
sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/cuda-repo-rhel8-10.1.243-1.x86_64.rpm
CentOS/RHEL 7
sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-repo-rhel7-10.0.130-1.x86_64.rpm
CentOS/RHEL 6
sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel6/x86_64/cuda-repo-rhel6-10.0.130-1.x86_64.rpm
Instale o repositório
epel-release
. Esse repositório inclui os pacotes DKMS, que são necessários para instalar drivers da NVIDIA no CentOS.CentOS 6/7/8 e RHEL 6/7
sudo yum install epel-release
Somente RHEL 8
sudo yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
Limpe o cache do Yum:
sudo yum clean all
Instale o CUDA. Este pacote inclui o driver NVIDIA.
sudo yum install cuda
SLES
Conecte-se à instância em que você quer instalar o driver.
Instale o pacote mais recente do kernel. Se necessário, esse comando também reinicializa o sistema.
sudo zypper refresh sudo zypper up -y kernel-default | grep -q 'already installed' || sudo reboot
Se o sistema foi reinicializado na etapa anterior, reconecte-se à instância.
Selecione um repositório de drivers para o kit de ferramentas do CUDA e adicione-o à instância.
SLES 15
sudo rpm --import https://developer.download.nvidia.com/compute/cuda/repos/sles15/x86_64/7fa2af80.pub sudo zypper install https://developer.download.nvidia.com/compute/cuda/repos/sles15/x86_64/cuda-repo-sles15-10.0.130-1.x86_64.rpm
SLES 12 com Service Pack 4
sudo rpm --import https://developer.download.nvidia.com/compute/cuda/repos/sles124/x86_64/7fa2af80.pub sudo zypper install https://developer.download.nvidia.com/compute/cuda/repos/sles124/x86_64/cuda-repo-sles124-10.1.243-1.x86_64.rpm
Atualize o Zypper.
sudo zypper refresh
Instale o CUDA, que inclui o driver NVIDIA.
sudo zypper install cuda
Ubuntu
Conecte-se à instância em que você quer instalar o driver.
Selecione um repositório de drivers para o kit de ferramentas do CUDA e adicione-o à instância.
Ubuntu 20.04
curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600 sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/7fa2af80.pub sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/ /"
Ubuntu 18.04 LTS
curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600 sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ /"
Ubuntu 16.04 LTS
curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-ubuntu1604.pin sudo mv cuda-ubuntu1604.pin /etc/apt/preferences.d/cuda-repository-pin-600 sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/ /"
Atualize as listas de pacotes.
sudo apt update
Instale o CUDA, que inclui o driver NVIDIA.
sudo apt install cuda
Windows Server
Conecte-se à instância em que você quer instalar o driver.
Faça o download do arquivo de instalação
.exe
na instância que contém o branch R426: driver NVIDIA 426.00 ou versão posterior. Para a maioria das instâncias do Windows Server, é possível usar uma das seguintes opções:- Faça o download do Kit de ferramentas CUDA com o driver NVIDIA incluso.
- Faça apenas o download do driver da NVIDIA.
Por exemplo, no Windows Server 2019, é possível abrir um terminal do PowerShell como administrador e usar o comando
wget
para fazer o download do instalador do driver necessário.PS C:\> wget https://developer.download.nvidia.com/compute/cuda/10.1/Prod/network_installers/cuda_10.1.243_win10_network.exe -O cuda_10.1.243_win10_network.exe
Execute o instalador
.exe
. Por exemplo, abra um terminal do PowerShell como administrador e execute o seguinte comando:PS C:\> .\\cuda_10.1.243_win10_network.exe
Como verificar a instalação do driver da GPU
Depois de concluir as etapas de instalação do driver, verifique se o driver foi instalado e inicializado corretamente.
Linux
Conecte-se à instância do Linux e use o comando nvidia-smi
para verificar se o driver está funcionando corretamente.
nvidia-smi
A saída será assim:
Wed Jan 2 19:51:51 2019 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 410.79 Driver Version: 410.79 CUDA Version: 10.0 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | |===============================+======================+======================| | 0 Tesla P4 Off | 00000000:00:04.0 Off | 0 | | N/A 42C P8 7W / 75W | 62MiB / 7611MiB | 0% Default | +-------------------------------+----------------------+----------------------+
Windows Server
Conecte-se à instância do Windows Server e use a ferramenta nvidia-smi.exe
para verificar se o driver está sendo executado corretamente.
"C:\Program Files\NVIDIA Corporation\NVSMI\nvidia-smi.exe"
A saída será assim:
Mon Aug 26 18:09:03 2019 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 426.00 Driver Version: 426.00 CUDA Version: 10.1 | |-------------------------------+----------------------+----------------------+ | GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | |===============================+======================+======================| | 0 Tesla P4 TCC | 00000000:00:04.0 Off | 0 | | N/A 27C P8 7W / 75W | 0MiB / 7611MiB | 0% Default | +-------------------------------+----------------------+----------------------+
A seguir
- Saiba mais sobre GPUs no Compute Engine.
- Consulte Como monitorar o desempenho da GPU para mais informações sobre esse assunto.
- Para lidar com a manutenção do host da GPU, consulte "Como manipular eventos de manutenção do host da GPU".
- Para otimizar o desempenho da GPU, consulte Como otimizar o desempenho da GPU.