Questa pagina è stata tradotta dall'API Cloud Translation.

Installa i driver della GPU

Linux Windows

Dopo aver creato un'istanza di macchina virtuale (VM) con una o più GPU, il sistema richiede i driver di dispositivo NVIDIA per consentire alle applicazioni di accedere al dispositivo. Assicurati che le istanze di macchine virtuali (VM) dispongano di spazio libero su disco sufficiente. Quando crei la nuova VM, devi scegliere almeno 40 GB per il disco di avvio.

Per installare i driver, hai due opzioni tra cui scegliere:

Se hai bisogno di GPU per grafiche 3D con accelerazione hardware, come il desktop remoto o i giochi, consulta Installa i driver per le workstation virtuali (vWS) NVIDIA RTX.
Per altri workload, segui le istruzioni riportate in questo documento per installare il driver NVIDIA.

Suggerimento avanzato: in alternativa, puoi saltare questa configurazione creando VM che utilizzano immagini con i driver installati. Per ulteriori informazioni, consulta la sezione Scelta di un sistema operativo.

Versioni del driver NVIDIA, del toolkit CUDA e del runtime CUDA

Nel tuo ambiente potrebbero essere necessari diversi componenti con controllo delle versioni di driver e runtime. Sono inclusi i seguenti componenti:

Driver NVIDIA
Toolkit CUDA
Runtime CUDA

Quando installi questi componenti, hai la possibilità di configurare il tuo ambiente in base alle tue esigenze. Ad esempio, se hai una versione precedente di TensorFlow che funziona meglio con una versione precedente del toolkit CUDA, ma la GPU che vuoi utilizzare richiede una versione successiva del driver NVIDIA, puoi installare una versione precedente di un toolkit CUDA insieme a una versione successiva del driver NVIDIA.

Tuttavia, devi assicurarti che le versioni del driver NVIDIA e del toolkit CUDA siano compatibili. Per la compatibilità del toolkit CUDA e del driver NVIDIA, consulta la documentazione di NVIDIA sulla compatibilità CUDA.

Informazioni sui rami dei driver NVIDIA

NVIDIA fornisce i seguenti tre rami di driver:

Long-Term Support Branch (LTSB): questo ramo dà la priorità alla stabilità e riduce al minimo la manutenzione, con un ciclo di vita del supporto esteso di tre anni. L'ultima LTSB testata e verificata da Google è R580, la cui data di fine del supporto è agosto 2028.
Production Branch (PB): questo ramo fornisce miglioramenti delle prestazioni e supporto per l'hardware più recente. Supporta completamente i carichi di lavoro di produzione, ma ha un ciclo di vita di assistenza più breve, fino a un anno. L'ultima PB testata e verificata da Google è R570, che non sarà più supportata a partire da febbraio 2026.
New Feature Branch (NFB): questo ramo è destinato ai primi utenti per testare nuove funzionalità e non è consigliato per gli ambienti di produzione.

Per i carichi di lavoro di produzione, utilizza il ramo di produzione o il ramo di supporto a lungo termine. Per ulteriori dettagli sui rami NVIDIA, consulta la documentazione NVIDIA.

Branch dei driver NVIDIA consigliati

Utilizza la tabella in questa sezione per determinare il ramo del driver NVIDIA più adatto al tuo tipo di macchina GPU.

Nella tabella seguente, EOS indica la fine del supporto. N/A indica che il sistema operativo specificato non può essere eseguito sul tipo di macchina.

Tipo di macchina	Modello di GPU	Rami supportati	Branch consigliato (data di fine del supporto)	Driver minimo per il ramo consigliato
A4X	NVIDIA Blackwell GB200 Superchip	R570 o versioni successive	R580 (agosto 2028)	Linux: `580.82.07` o versioni successive Windows: N/A
A4	NVIDIA Blackwell B200	R570 o versioni successive	R580 (agosto 2028)	Linux: `580.82.07` o versioni successive Windows: N/A
A3 Ultra	NVIDIA H200	R570 o versioni successive	R580 (agosto 2028)	Linux: `580.82.07` o versioni successive Windows: N/A
A3 Mega, High, Edge	NVIDIA H100	R535 o versioni successive	R535 (giugno 2026)	Linux: `535.230.02` o versioni successive Windows: N/A
G2	NVIDIA L4	R535 o versioni successive	R535 (giugno 2026)	Linux: `535.230.02` o versioni successive Windows: `538.67` o versioni successive
A2 Standard, A2 Ultra	NVIDIA A100	R535 o versioni successive	R535 (giugno 2026)	Linux: `535.230.02` o versioni successive Windows: `538.67` o versioni successive
N1	NVIDIA T4	R535 o versioni successive	R535 (giugno 2026)	Linux: `535.230.02` o versioni successive Windows: `538.67` o versioni successive
N1	NVIDIA V100, P100, P4	Da R35 a R580¹	R535 (giugno 2026)	Linux: `535.230.02` o versioni successive Windows: `538.67` o versioni successive

¹NVIDIA ha annunciato che R580 è l'ultimo ramo del driver a supportare l'architettura Pascal (P4 e P100) e Volta (V100).

Installa i driver della GPU sulle VM tramite le guide del toolkit CUDA

Un modo per installare il driver NVIDIA sulla maggior parte delle VM è installare il toolkit CUDA.

Per installare il toolkit CUDA, completa i seguenti passaggi:

Seleziona una versione del toolkit CUDA che supporti la versione del driver di cui hai bisogno.

Tipo di macchina	Modello di GPU	Toolkit CUDA consigliato
A4X	NVIDIA Blackwell GB200 Superchip	CUDA 12.8.1 o versioni successive
A4	NVIDIA Blackwell B200	CUDA 12.8.1 o versioni successive
A3 Ultra	NVIDIA H200	CUDA 12.4 o versioni successive
G2	NVIDIA L4	CUDA 12.2.2 o versioni successive
A3 Mega, High, Edge	NVIDIA H100	CUDA 12.2.2 o versioni successive
A2 Standard, A2 Ultra	NVIDIA A100	CUDA 12.2.2 o versioni successive
N1	NVIDIA T4	CUDA 12.2.2 o versioni successive
N1	NVIDIA V100, P100, P4	CUDA 12.2.2 a CUDA 12 (versione finale)¹

¹CUDA Toolkit 12 è l'ultimo a supportare l'architettura Pascal (P4 e P100) e Volta (V100). NVIDIA ha annunciato che la compilazione offline e il supporto delle librerie per queste architetture vengono rimossi a partire dalla release della versione principale di CUDA Toolkit 13.0. Per maggiori informazioni, consulta le note di rilascio del driver NVIDIA 13.0.

Connettiti alla VM dove vuoi installare il driver.
Nella VM, scarica e installa il toolkit CUDA. Per trovare il pacchetto del toolkit CUDA e le istruzioni di installazione, consulta Archivio del toolkit CUDA nella documentazione di NVIDIA.

Installa i driver della GPU sulle VM tramite lo script di installazione

Puoi utilizzare i seguenti script per automatizzare la procedura di installazione. Per esaminare questi script, consulta il repository GitHub.

Linux

Segui queste istruzioni per installare i driver GPU su una VM in esecuzione.

Sistemi operativi supportati

Lo script di installazione di Linux è stato testato sui seguenti sistemi operativi:

Debian 12
Red Hat Enterprise Linux (RHEL) 8 e 9
Rocky Linux 8 e 9
Ubuntu 22 e 24

Se utilizzi questo script su altri sistemi operativi, l'installazione potrebbe non riuscire. Questo script può installare il driver NVIDIA e il toolkit CUDA.

Per installare i driver della GPU e il Toolkit CUDA, completa i seguenti passaggi:

Se hai la versione 2.38.0 o successive di Ops Agent che raccoglie le metriche della GPU sulla tua VM, devi arrestare l'agente prima di poter installare o eseguire l'upgrade dei driver della GPU utilizzando questo script di installazione.

Per installare Ops Agent, esegui questo comando:
```
sudo systemctl stop google-cloud-ops-agent
```
Assicurati che Python 3 sia installato sul tuo sistema operativo.

Scarica lo script di installazione.

curl -L https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz --output cuda_installer.pyz

Esegui lo script di installazione.
```
sudo python3 cuda_installer.pyz install_driver --installation-mode=INSTALLATION_MODE --installation-branch=BRANCH
```
- INSTALLATION_MODE: il metodo di installazione. Utilizza uno dei seguenti valori:
  - repo: (impostazione predefinita) installa il driver dal repository del pacchetto NVIDIA ufficiale.
  - binary: installa il driver utilizzando il pacchetto di installazione binario.
- BRANCH: il ramo del driver che vuoi installare. Utilizza uno dei seguenti valori:
  - prod: (predefinito) il branch di produzione. Questo ramo è qualificato per l'utilizzo in ambienti di produzione per GPU aziendali e di data center.
  - nfb: il nuovo ramo della funzionalità. Questo ramo include gli ultimi aggiornamenti per i primi utenti. Questo ramo non è consigliato per gli ambienti di produzione.
  - lts: il ramo di assistenza a lungo termine. Questo ramo viene mantenuto per un periodo di tempo più lungo rispetto a un ramo di produzione normale.
L'esecuzione dello script richiede qualche istante. La VM verrà riavviata. Quando la VM si riavvia, esegui di nuovo lo script per continuare l'installazione.
Verifica l'installazione. Consulta Verifica l'installazione del driver della GPU.
Puoi anche utilizzare questo strumento per installare il toolkit CUDA. Per installare il toolkit CUDA, esegui il seguente comando:
```
sudo python3 cuda_installer.pyz install_cuda --installation-mode=INSTALLATION_MODE --installation-branch=BRANCH
```
Assicurati di utilizzare gli stessi valori per INSTALLATION_MODE e BRANCH utilizzati durante l'installazione del driver.

L'esecuzione dello script richiederà un po' di tempo. La VM verrà riavviata. Quando la VM si riavvia, esegui di nuovo lo script per continuare l'installazione.
Verifica l'installazione del toolkit CUDA.
```
python3 cuda_installer.pyz verify_cuda
```
Al termine dell'installazione, devi riavviare la VM.

Linux (script di avvio)

Segui queste istruzioni per installare i driver GPU durante l'avvio di una VM.

Sistemi operativi supportati

Lo script di installazione di Linux è stato testato sui seguenti sistemi operativi:

Debian 12
Red Hat Enterprise Linux (RHEL) 8 e 9
Rocky Linux 8 e 9
Ubuntu 22 e 24

Se utilizzi questo script su altri sistemi operativi, l'installazione potrebbe non riuscire. Questo script può installare il driver NVIDIA e il toolkit CUDA.

Utilizza il seguente script di avvio per automatizzare l'installazione del driver e del toolkit CUDA:

#!/bin/bash
if test -f /opt/google/cuda-installer
then
  exit
fi

mkdir -p /opt/google/cuda-installer
cd /opt/google/cuda-installer/ || exit

if test -f cuda_installation
then
  exit
fi

curl -fSsL -O https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz
python3 cuda_installer.pyz install_cuda

Puoi aggiungere i flag --installation-mode INSTALLATION_MODE e --installation-branch BRANCH al comando di installazione per indicare la modalità di installazione e il ramo del driver che vuoi installare.

INSTALLATION_MODE: il metodo di installazione. Utilizza uno dei seguenti valori:
- repo: (impostazione predefinita) installa il driver dal repository del pacchetto NVIDIA ufficiale.
- binary: installa il driver utilizzando il pacchetto di installazione binario.
BRANCH: il ramo del driver che vuoi installare. Utilizza uno dei seguenti valori:
- prod: (predefinito) il branch di produzione. Questo ramo è qualificato per l'utilizzo in ambienti di produzione per GPU aziendali e di data center.
- nfb: il nuovo ramo della funzionalità. Questo ramo include gli ultimi aggiornamenti per i primi utenti. Questo ramo non è consigliato per gli ambienti di produzione.
- lts: il ramo di assistenza a lungo termine. Questo ramo viene mantenuto per un periodo di tempo più lungo rispetto a un ramo di produzione normale.

Windows

Questo script di installazione può essere utilizzato nelle VM in cui è abilitato l'avvio protetto.

Per le VM Windows che utilizzano una serie di macchine G2, questo script installa solo il driver NVIDIA.
Per gli altri tipi di macchina, lo script installa il driver NVIDIA e il toolkit CUDA.

Apri un terminale PowerShell come amministratore, quindi completa i seguenti passaggi:

Se utilizzi Windows Server 2016, imposta la versione Transport Layer Security (TLS) su 1.2.
```
[Net.ServicePointManager]::SecurityProtocol = 'Tls12'
```

Scarica lo script.

Invoke-WebRequest https://github.com/GoogleCloudPlatform/compute-gpu-installation/raw/main/windows/install_gpu_driver.ps1 -OutFile C:\install_gpu_driver.ps1

Esegui lo script.
```
C:\install_gpu_driver.ps1
```
L'esecuzione dello script richiede qualche istante. Durante la procedura di installazione non vengono visualizzati prompt dei comandi. Alla chiusura dello script, il driver viene installato.

Questo script installa i driver nella seguente posizione predefinita sulla VM: C:\Program Files\NVIDIA Corporation\\.
Verifica l'installazione. Consulta Verifica l'installazione del driver della GPU.

Installa i driver della GPU (VM con avvio protetto)

Queste istruzioni riguardano l'installazione dei driver GPU sulle VM Linux che utilizzano l'avvio protetto.

Supporto GPU

Le procedure descritte in questa sezione supportano tutti i modelli di GPU disponibili su Compute Engine.

Non puoi utilizzare queste procedure per installare i driver sulle istanze di avvio protetto a cui sono collegate versioni di workstation virtuali (vWS) NVIDIA RTX delle nostre GPU.

Se utilizzi una VM Windows o Linux che non utilizza l'avvio protetto, consulta una delle seguenti istruzioni:

L'installazione del driver su una VM con l'avvio protetto è diversa per le VM Linux, poiché queste VM richiedono che tutti i moduli kernel abbiano una firma di certificato attendibile.

Installazione

Puoi utilizzare una delle seguenti opzioni per installare i driver con certificati attendibili:

Crea un certificato attendibile per i tuoi driver. Per questa opzione, scegli una delle seguenti:
- Metodo automatizzato: utilizza uno strumento di creazione di immagini per creare immagini di avvio con certificati attendibili per i driver installati.
- Metodo manuale: genera il tuo certificato e utilizzalo per firmare i moduli del kernel del driver GPU
Utilizza driver pre-firmati con un certificato attendibile esistente. Questo metodo supporta solo Ubuntu.

Firma automatica

Sistemi operativi supportati:

Questo metodo di autofirma automatica è stato testato sui seguenti sistemi operativi:

Debian 12
Red Hat Enterprise Linux (RHEL) 8 e 9
Rocky Linux 8 e 9
Ubuntu 22 e 24

Procedura

Per creare un'immagine del sistema operativo con certificati autofirmati, completa i seguenti passaggi:

1. In the Google Cloud console, activate Cloud Shell.
  
  Activate Cloud Shell
  
  At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
2. Scarica lo strumento cuda_installer. Per scaricare l'ultima versione dello script, esegui questo comando:
```
curl -L https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz --output cuda_installer.pyz
```
3. Crea un'immagine con Secure Boot abilitato eseguendo il seguente comando. La procedura di creazione dell'immagine può richiedere fino a 20 minuti.
```
PROJECT=PROJECT_ID
ZONE=ZONE
BASE_IMAGE=BASE_IMAGE_NAME
SECURE_BOOT_IMAGE=IMAGE_NAME

python3 cuda_installer.pyz build_image \
  --project $PROJECT \
  --vm-zone $ZONE \
  --base-image $BASE_IMAGE $SECURE_BOOT_IMAGE
```
  Sostituisci quanto segue:
  - PROJECT_ID: l'ID del progetto in cui creare l'immagine
  - ZONE: la zona in cui creare una VM temporanea utilizzata. Ad esempio us-west4-a.
  - IMAGE_NAME: il nome dell'immagine che verrà creata.
  - BASE_IMAGE_NAME: seleziona una delle seguenti opzioni:
    - debian-12
    - rhel-8 o rhel-9
    - rocky-8 o rocky-9
    - ubuntu-22 o ubuntu-24
  Puoi anche aggiungere il flag --family NAME per aggiungere la nuova immagine a una famiglia di immagini.
  
  Per visualizzare tutte le opzioni di personalizzazione per l'esecuzione dell'immagine python3 cuda_installer.pyz build_image --help. Puoi anche consultare la documentazione di cuda_installer su GitHub.
4. Verifica l'immagine. Segui questi passaggi per verificare che l'immagine abbia l'avvio protetto abilitato e possa creare istanze GPU con i driver NVIDIA installati.
  1. Crea un'istanza VM di test per verificare che l'immagine sia configurata correttamente e che i driver GPU vengano caricati correttamente. L'esempio seguente crea un tipo di macchina N1 con un singolo acceleratore NVIDIA T4 collegato. Tuttavia, puoi utilizzare qualsiasi tipo di macchina GPU supportato di tua scelta.
```
TEST_INSTANCE_NAME=TEST_INSTANCE_NAME
ZONE=ZONE

gcloud compute instances create $TEST_INSTANCE_NAME \
 --project=$PROJECT \
 --zone=$ZONE \
 --machine-type=n1-standard-4 \
 --accelerator=count=1,type=nvidia-tesla-t4 \
 --create-disk=auto-delete=yes,boot=yes,device-name=$TEST_INSTANCE_NAME,image=projects/$PROJECT/global/images/$SECURE_BOOT_IMAGE,mode=rw,size=100,type=pd-balanced \
 --shielded-secure-boot \
 --shielded-vtpm \
 --shielded-integrity-monitoring \
 --maintenance-policy=TERMINATE
```
    Sostituisci quanto segue:
    - TEST_INSTANCE_NAME: un nome per l'istanza VM di test
    - ZONE: una zona con GPU T4 o la GPU che preferisci. Per saperne di più, consulta Regioni e zone GPU.
  2. Verifica che l'avvio protetto sia abilitato eseguendo il comando mokutil --sb-state sulla VM di test utilizzando gcloud compute ssh.
```
gcloud compute ssh --project=$PROJECT --zone=$ZONE $TEST_INSTANCE_NAME --command "mokutil --sb-state"
```
  3. Verifica che il driver sia installato eseguendo il comando nvidia-smi sulla VM di test utilizzando gcloud compute ssh.
```
gcloud compute ssh --project=$PROJECT --zone=$ZONE $TEST_INSTANCE_NAME --command "nvidia-smi"
```
    Se hai installato il toolkit CUDA, puoi utilizzare lo strumento cuda_installer per verificare l'installazione nel seguente modo:
```
gcloud compute ssh --project=$PROJECT --zone=$ZONE $TEST_INSTANCE_NAME --command "python3 cuda_installer.pyz verify_cuda"
```
5. Eseguire la pulizia. Dopo aver verificato che l'immagine personalizzata funzioni, non è necessario mantenere la VM di verifica. Per eliminare la VM, esegui questo comando:
```
gcloud compute instances delete --zone=$ZONE --project=$PROJECT $TEST_INSTANCE_NAME
```
6. (Facoltativo) Per eliminare l'immagine disco che hai creato, esegui questo comando:
```
gcloud compute images delete --project=$PROJECT $SECURE_BOOT_IMAGE
```

Verifica l'installazione del driver della GPU

Dopo aver completato i passaggi di installazione del driver, verifica che il driver sia stato installato e inizializzato correttamente.

Linux

Connettiti all'istanza Linux e utilizza il comando nvidia-smi per verificare che il driver funzioni correttamente.

sudo nvidia-smi

L'output è simile al seguente:

  +-----------------------------------------------------------------------------------------+
  | NVIDIA-SMI 580.82.07              Driver Version: 580.82.07      CUDA Version: 13.0     |
  +-----------------------------------------+------------------------+----------------------+
  | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
  | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
  |                                         |                        |               MIG M. |
  |=======================================+====================+====================|
  |   0  Tesla T4                       On  |   00000000:00:04.0 Off |                    0 |
  | N/A   53C    P8             17W /   70W |       0MiB /  15360MiB |      0%      Default |
  |                                         |                        |                  N/A |
  +-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
  | Processes:                                                                              |
  |  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
  |        ID   ID                                                               Usage      |
  |=========================================================================================|
  |  No running processes found                                                             |
  +-----------------------------------------------------------------------------------------+

Se questo comando non va a buon fine, verifica se le GPU sono collegate alla VM. Per verificare la presenza di dispositivi PCI NVIDIA, esegui il seguente comando:

sudo lspci | grep -i "nvidia"

Windows Server

Connettiti all'istanza Windows Server e apri un terminale PowerShell, quindi esegui il seguente comando per verificare che il driver funzioni correttamente.

nvidia-smi

L'output è simile al seguente:

+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 538.67                 Driver Version: 538.67       CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                     TCC/WDDM  | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  NVIDIA L4                    WDDM  | 00000000:00:03.0 Off |                    0 |
| N/A   66C    P8              17W /  72W |    128MiB / 23034MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A      4888    C+G   ...CBS_cw5n1h2txyewy\TextInputHost.exe    N/A      |
|    0   N/A  N/A      5180    C+G   ....Search_cw5n1h2txyewy\SearchApp.exe    N/A      |
+---------------------------------------------------------------------------------------+

Passaggi successivi

Per monitorare le prestazioni della GPU, vedi Monitora le prestazioni della GPU.

Per gestire la manutenzione dell'host GPU, consulta Gestisci gli eventi di manutenzione dell'host GPU.
Per migliorare le prestazioni della rete, consulta Utilizza una larghezza di banda di rete superiore.
Per risolvere i problemi relativi alle VM GPU, consulta Risoluzione dei problemi relativi alle VM GPU.

Installa i driver della GPU

Versioni del driver NVIDIA, del toolkit CUDA e del runtime CUDA

Informazioni sui rami dei driver NVIDIA

Branch dei driver NVIDIA consigliati

Installa i driver della GPU sulle VM tramite le guide del toolkit CUDA

Installa i driver della GPU sulle VM tramite lo script di installazione

Linux

Linux (script di avvio)

Windows

Installa i driver della GPU (VM con avvio protetto)

Supporto GPU

Installazione

Firma automatica

Autofirma (manuale)

Pre-signed (solo Ubuntu)

Ubuntu PRO e LTS

Ubuntu PRO FIPS

Ubuntu 18.04

Ubuntu 20.04

Ubuntu 22.04

Verifica l'installazione del driver della GPU

Linux

Windows Server

Passaggi successivi