Esta página se ha traducido con Cloud Translation API.

Instalar controladores de GPU

Linux Windows

Después de crear una instancia de máquina virtual con una o varias GPUs, tu sistema necesita controladores de dispositivo NVIDIA para que tus aplicaciones puedan acceder al dispositivo. Asegúrate de que tus instancias de máquina virtual tengan suficiente espacio libre en disco. Debes elegir al menos 40 GB para el disco de arranque al crear la nueva VM.

Para instalar los controladores, puedes elegir entre dos opciones:

Si necesitas GPUs para gráficos 3D acelerados por hardware, como escritorios remotos o juegos, consulta el artículo Instalar controladores para estaciones de trabajo virtuales (vWS) NVIDIA RTX.
Para otras cargas de trabajo, siga las instrucciones de este documento para instalar el controlador de NVIDIA.

Consejo profesional: También puedes saltarte esta configuración creando VMs que usen imágenes con los controladores instalados. Para obtener más información, consulta Elegir un sistema operativo.

Versiones del controlador de NVIDIA, del kit de herramientas CUDA y del tiempo de ejecución de CUDA

Hay diferentes componentes versionados de controladores y tiempos de ejecución que pueden ser necesarios en tu entorno. Entre ellos, se incluyen los siguientes componentes:

Controlador de NVIDIA
Kit de herramientas de CUDA
Tiempo de ejecución de CUDA

Al instalar estos componentes, puedes configurar tu entorno para que se adapte a tus necesidades. Por ejemplo, si tienes una versión anterior de TensorFlow que funciona mejor con una versión anterior del kit de herramientas de CUDA, pero la GPU que quieres usar requiere una versión posterior del controlador de NVIDIA, puedes instalar una versión anterior del kit de herramientas de CUDA junto con una versión posterior del controlador de NVIDIA.

Sin embargo, debes asegurarte de que las versiones de tu controlador NVIDIA y del kit de herramientas CUDA sean compatibles. Para obtener información sobre la compatibilidad del kit de herramientas de CUDA y los controladores de NVIDIA, consulta la documentación de NVIDIA sobre la compatibilidad con CUDA.

Información sobre las ramas de controladores de NVIDIA

NVIDIA ofrece las tres ramas de controladores siguientes:

Rama de asistencia a largo plazo (LTSB): esta rama prioriza la estabilidad y minimiza el mantenimiento, con un ciclo de vida de asistencia ampliado de tres años. La última versión de LTSB probada y verificada por Google es R580, que dejará de recibir asistencia en agosto del 2028.
Rama de producción (PB): esta rama ofrece mejoras de rendimiento y compatibilidad con el hardware más reciente. Es totalmente compatible con las cargas de trabajo de producción, pero tiene un ciclo de vida de asistencia más corto, de hasta un año. La última versión de PB probada y verificada por Google es R570, que dejará de recibir asistencia en febrero del 2026.
Rama de nuevas funciones (NFB): esta rama es para los usuarios pioneros que quieran probar nuevas funciones y no se recomienda para entornos de producción.

Para las cargas de trabajo de producción, usa la rama de producción o la rama de asistencia a largo plazo. Para obtener más información sobre las ramas de NVIDIA, consulta la documentación de NVIDIA.

Ramas de controladores de NVIDIA recomendadas

Usa la tabla de esta sección para determinar la mejor rama de controladores de NVIDIA para tu tipo de máquina con GPU.

En la siguiente tabla, EOS indica el final de la asistencia. N/A indica que el sistema operativo especificado no se puede ejecutar en el tipo de máquina.

Tipo de máquina	Modelo de GPU	Ramas admitidas	Rama recomendada (fecha de EOS)	Controlador mínimo para la rama recomendada
A4X	Superchip NVIDIA Blackwell GB200	R570 o versiones posteriores	R580 (agosto del 2028)	Linux: `580.82.07` o versiones posteriores Windows: N/A
A4	NVIDIA Blackwell B200	R570 o versiones posteriores	R580 (agosto del 2028)	Linux: `580.82.07` o versiones posteriores Windows: N/A
A3 Ultra	NVIDIA H200	R570 o versiones posteriores	R580 (agosto del 2028)	Linux: `580.82.07` o versiones posteriores Windows: N/A
A3 Mega, High y Edge	NVIDIA H100	R535 o versiones posteriores	R535 (junio del 2026)	Linux: `535.230.02` o versiones posteriores Windows: N/A
G2	NVIDIA L4	R535 o versiones posteriores	R535 (junio del 2026)	Linux: `535.230.02` o versiones posteriores Windows: `538.67` o posterior
A2 Standard y A2 Ultra	NVIDIA A100	R535 o versiones posteriores	R535 (junio del 2026)	Linux: `535.230.02` o versiones posteriores Windows: `538.67` o posterior
N1	NVIDIA T4	R535 o versiones posteriores	R535 (junio del 2026)	Linux: `535.230.02` o versiones posteriores Windows: `538.67` o posterior
N1	NVIDIA V100, P100 y P4	R35 a R580¹	R535 (junio del 2026)	Linux: `535.230.02` o versiones posteriores Windows: `538.67` o posterior

¹NVIDIA ha anunciado que R580 es la última rama de controladores compatible con las arquitecturas Pascal (P4 y P100) y Volta (V100).

Instalar controladores de GPU en máquinas virtuales con las guías de CUDA Toolkit

Una forma de instalar el controlador de NVIDIA en la mayoría de las máquinas virtuales es instalar el CUDA Toolkit.

Para instalar CUDA Toolkit, sigue estos pasos:

Selecciona una versión de CUDA Toolkit que sea compatible con la versión del controlador que necesites.

Tipo de máquina	Modelo de GPU	CUDA Toolkit recomendado
A4X	Superchip NVIDIA Blackwell GB200	CUDA 12.8.1 o posterior
A4	NVIDIA Blackwell B200	CUDA 12.8.1 o posterior
A3 Ultra	NVIDIA H200	CUDA 12.4 o versiones posteriores
G2	NVIDIA L4	CUDA 12.2.2 o versiones posteriores
A3 Mega, High y Edge	NVIDIA H100	CUDA 12.2.2 o versiones posteriores
A2 Standard y A2 Ultra	NVIDIA A100	CUDA 12.2.2 o versiones posteriores
N1	NVIDIA T4	CUDA 12.2.2 o versiones posteriores
N1	NVIDIA V100, P100 y P4	CUDA 12.2.2 a CUDA 12 (versión final)¹

¹CUDA Toolkit 12 es la última versión compatible con la arquitectura Pascal (P4 y P100) y Volta (V100). NVIDIA ha anunciado que la compilación sin conexión y la compatibilidad con bibliotecas para estas arquitecturas se han retirado a partir del lanzamiento de la versión principal 13.0 del kit de herramientas CUDA. Para obtener más información, consulta las notas de la versión 13.0 del controlador de NVIDIA.

Conéctate a la VM en la que quieras instalar el controlador.
En tu VM, descarga e instala el kit de herramientas CUDA. Para encontrar el paquete del kit de herramientas de CUDA y las instrucciones de instalación, consulta el archivo del kit de herramientas de CUDA en la documentación de NVIDIA.

Instalar controladores de GPU en máquinas virtuales mediante una secuencia de comandos de instalación

Puedes usar las siguientes secuencias de comandos para automatizar el proceso de instalación. Para consultar estas secuencias de comandos, ve al repositorio de GitHub.

Linux

Sigue estas instrucciones para instalar los controladores de GPU en una VM en ejecución.

Sistemas operativos compatibles

La secuencia de comandos de instalación de Linux se ha probado en los siguientes sistemas operativos:

Debian 12
Red Hat Enterprise Linux (RHEL) 8 y 9
Rocky Linux 8 y 9
Ubuntu 22 y 24

Si usas esta secuencia de comandos en otros sistemas operativos, es posible que la instalación falle. Esta secuencia de comandos puede instalar el controlador de NVIDIA y el CUDA Toolkit.

Para instalar los controladores de la GPU y CUDA Toolkit, sigue estos pasos:

Si tienes la versión 2.38.0 o posterior del Ops Agent que recoge métricas de GPU en tu VM, debes detener el agente antes de poder instalar o actualizar los controladores de GPU con esta secuencia de comandos de instalación.

Para detener el agente de Ops, ejecuta el siguiente comando:
```
sudo systemctl stop google-cloud-ops-agent
```
Asegúrate de que Python 3 esté instalado en tu sistema operativo.

Descarga la secuencia de comandos de instalación.

curl -L https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz --output cuda_installer.pyz

Ejecuta la secuencia de comandos de instalación.
```
sudo python3 cuda_installer.pyz install_driver --installation-mode=INSTALLATION_MODE --installation-branch=BRANCH
```
- INSTALLATION_MODE: el método de instalación. Utilice uno de los siguientes valores:
  - repo: (opción predeterminada) instala el controlador desde el repositorio oficial de paquetes de NVIDIA.
  - binary: instala el controlador mediante el paquete de instalación binario.
- BRANCH: la rama del controlador que quieras instalar. Utilice uno de los siguientes valores:
  - prod: (predeterminado) la rama de producción. Esta rama es apta para usarse en entornos de producción para GPUs empresariales y de centros de datos.
  - nfb: la nueva rama de funciones. Esta rama incluye las últimas actualizaciones para los primeros usuarios. No se recomienda usar esta rama en entornos de producción.
  - lts: la rama de asistencia a largo plazo. Esta rama se mantiene durante un periodo más largo que una rama de producción normal.
La secuencia de comandos tarda un poco en ejecutarse. Se reiniciará la VM. Cuando se reinicie la máquina virtual, vuelve a ejecutar la secuencia de comandos para continuar con la instalación.
Verifica la instalación. Consulta Verificar la instalación del controlador de GPU.
También puedes usar esta herramienta para instalar el kit de herramientas de CUDA. Para instalar el CUDA Toolkit, ejecuta el siguiente comando:
```
sudo python3 cuda_installer.pyz install_cuda --installation-mode=INSTALLATION_MODE --installation-branch=BRANCH
```
Asegúrate de usar los mismos valores para INSTALLATION_MODE y BRANCH que usaste durante la instalación del controlador.

La secuencia de comandos tardará un poco en ejecutarse. Se reiniciará la VM. Cuando se reinicie la máquina virtual, vuelve a ejecutar la secuencia de comandos para continuar con la instalación.
Verifica la instalación del kit de herramientas de CUDA.
```
python3 cuda_installer.pyz verify_cuda
```
Una vez completada la instalación, debes reiniciar la VM.

Linux (secuencia de comandos de inicio)

Sigue estas instrucciones para instalar los controladores de GPU durante el inicio de una VM.

Sistemas operativos compatibles

La secuencia de comandos de instalación de Linux se ha probado en los siguientes sistemas operativos:

Debian 12
Red Hat Enterprise Linux (RHEL) 8 y 9
Rocky Linux 8 y 9
Ubuntu 22 y 24

Si usas esta secuencia de comandos en otros sistemas operativos, es posible que la instalación falle. Esta secuencia de comandos puede instalar el controlador de NVIDIA y el CUDA Toolkit.

Usa la siguiente secuencia de comandos de inicio para automatizar la instalación del controlador y del CUDA Toolkit:

#!/bin/bash
if test -f /opt/google/cuda-installer
then
  exit
fi

mkdir -p /opt/google/cuda-installer
cd /opt/google/cuda-installer/ || exit

if test -f cuda_installation
then
  exit
fi

curl -fSsL -O https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz
python3 cuda_installer.pyz install_cuda

Puedes añadir las marcas --installation-mode INSTALLATION_MODE y --installation-branch BRANCH al comando de instalación para indicar el modo de instalación y la rama del controlador que quieres instalar.

INSTALLATION_MODE: el método de instalación. Utilice uno de los siguientes valores:
- repo: (opción predeterminada) instala el controlador desde el repositorio oficial de paquetes de NVIDIA.
- binary: instala el controlador mediante el paquete de instalación binario.
BRANCH: la rama del controlador que quieras instalar. Utilice uno de los siguientes valores:
- prod: (predeterminado) la rama de producción. Esta rama es apta para usarse en entornos de producción para GPUs empresariales y de centros de datos.
- nfb: la nueva rama de funciones. Esta rama incluye las últimas actualizaciones para los primeros usuarios. No se recomienda usar esta rama en entornos de producción.
- lts: la rama de asistencia a largo plazo. Esta rama se mantiene durante un periodo más largo que una rama de producción normal.

Windows

Esta secuencia de comandos de instalación se puede usar en VMs que tengan habilitado el arranque seguro.

En las VMs de Windows que usan una serie de máquinas G2, esta secuencia de comandos solo instala el controlador de NVIDIA.
En el caso de otros tipos de máquinas, la secuencia de comandos instala el controlador de NVIDIA y el kit de herramientas CUDA.

Abre un terminal de PowerShell como administrador y sigue estos pasos:

Si usas Windows Server 2016, define la versión 1.2 de Seguridad en la capa de transporte (TLS).
```
[Net.ServicePointManager]::SecurityProtocol = 'Tls12'
```

Descarga la secuencia de comandos.

Invoke-WebRequest https://github.com/GoogleCloudPlatform/compute-gpu-installation/raw/main/windows/install_gpu_driver.ps1 -OutFile C:\install_gpu_driver.ps1

Ejecuta la secuencia de comandos.
```
C:\install_gpu_driver.ps1
```
La secuencia de comandos tarda un poco en ejecutarse. No se proporcionan peticiones de comandos durante el proceso de instalación. Cuando se cierre la secuencia de comandos, se instalará el controlador.

Esta secuencia de comandos instala los controladores en la siguiente ubicación predeterminada de tu máquina virtual: C:\Program Files\NVIDIA Corporation\\.
Verifica la instalación. Consulta Verificar la instalación del controlador de GPU.

Instalar controladores de GPU (VMs con arranque seguro)

Estas instrucciones sirven para instalar controladores de GPU en VMs Linux que usan Arranque seguro.

Compatibilidad con GPU

Los procedimientos de esta sección son compatibles con todos los modelos de GPU disponibles en Compute Engine.

No puedes usar estos procedimientos para instalar controladores en instancias de arranque seguro que tengan conectadas versiones de estaciones de trabajo virtuales (vWS) NVIDIA RTX de nuestras GPUs.

Si usas una VM de Windows o una VM de Linux que no utiliza el arranque seguro, consulta una de las siguientes instrucciones:

La instalación del controlador en una VM con arranque seguro es diferente en las VMs Linux, ya que estas VMs requieren que todos los módulos del kernel tengan una firma de certificado de confianza.

Instalación

Puede usar una de las siguientes opciones para instalar controladores que tengan certificados de confianza:

Crea un certificado de confianza para tus controladores. Para esta opción, elige una de las siguientes:
- Método automatizado: usa una herramienta de creación de imágenes para crear imágenes de arranque que tengan instalados certificados de confianza para tus controladores.
- Método manual: genera tu propio certificado y úsalo para firmar los módulos del kernel del controlador de la GPU
Usa controladores prefirmados con un certificado de confianza. Este método solo es compatible con Ubuntu.

Autofirma (automatizada)

Sistemas operativos compatibles:

Este método de firma automática se ha probado en los siguientes sistemas operativos:

Debian 12
Red Hat Enterprise Linux (RHEL) 8 y 9
Rocky Linux 8 y 9
Ubuntu 22 y 24

Procedimiento

Para crear una imagen del SO que tenga certificados autofirmados, sigue estos pasos:

1. In the Google Cloud console, activate Cloud Shell.
  
  Activate Cloud Shell
  
  At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
2. Descarga la herramienta cuda_installer. Para descargar la última versión de la secuencia de comandos, ejecuta el siguiente comando:
```
curl -L https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz --output cuda_installer.pyz
```
3. Crea una imagen con Arranque seguro habilitado ejecutando el siguiente comando. El proceso de creación de la imagen puede tardar hasta 20 minutos.
```
PROJECT=PROJECT_ID
ZONE=ZONE
BASE_IMAGE=BASE_IMAGE_NAME
SECURE_BOOT_IMAGE=IMAGE_NAME

python3 cuda_installer.pyz build_image \
  --project $PROJECT \
  --vm-zone $ZONE \
  --base-image $BASE_IMAGE $SECURE_BOOT_IMAGE
```
  Haz los cambios siguientes:
  - PROJECT_ID: ID del proyecto en el que se va a crear la imagen.
  - ZONE: zona en la que se creará una VM temporal. Por ejemplo, us-west4-a.
  - IMAGE_NAME: nombre de la imagen que se creará.
  - BASE_IMAGE_NAME: selecciona una de las siguientes opciones:
    - debian-12
    - rhel-8 o rhel-9
    - rocky-8 o rocky-9
    - ubuntu-22 o ubuntu-24
  También puedes añadir la marca --family NAME para añadir la nueva imagen a una familia de imágenes.
  
  Para ver todas las opciones de personalización de la imagen, ejecuta python3 cuda_installer.pyz build_image --help. También puedes consultar la documentación de cuda_installer en GitHub.
4. Verifica la imagen. Sigue estos pasos para verificar que la imagen tiene habilitado el arranque seguro y puede crear instancias de GPU que tengan instalados los controladores de NVIDIA.
  1. Crea una instancia de VM de prueba para verificar que la imagen esté configurada correctamente y que los controladores de GPU se carguen correctamente. En el siguiente ejemplo se crea un tipo de máquina N1 con un solo acelerador NVIDIA T4 conectado. Sin embargo, puedes usar cualquier tipo de máquina con GPU compatible.
```
TEST_INSTANCE_NAME=TEST_INSTANCE_NAME
ZONE=ZONE

gcloud compute instances create $TEST_INSTANCE_NAME \
 --project=$PROJECT \
 --zone=$ZONE \
 --machine-type=n1-standard-4 \
 --accelerator=count=1,type=nvidia-tesla-t4 \
 --create-disk=auto-delete=yes,boot=yes,device-name=$TEST_INSTANCE_NAME,image=projects/$PROJECT/global/images/$SECURE_BOOT_IMAGE,mode=rw,size=100,type=pd-balanced \
 --shielded-secure-boot \
 --shielded-vtpm \
 --shielded-integrity-monitoring \
 --maintenance-policy=TERMINATE
```
    Haz los cambios siguientes:
    - TEST_INSTANCE_NAME: nombre de la instancia de VM de prueba
    - ZONE: una zona que tenga GPUs T4 o la GPU que elijas. Para obtener más información, consulta el artículo sobre regiones y zonas de GPU.
  2. Comprueba que el arranque seguro esté habilitado ejecutando el comando mokutil --sb-state en la VM de prueba con gcloud compute ssh.
```
gcloud compute ssh --project=$PROJECT --zone=$ZONE $TEST_INSTANCE_NAME --command "mokutil --sb-state"
```
  3. Para comprobar que el controlador está instalado, ejecuta el comando nvidia-smi en la VM de prueba mediante gcloud compute ssh.
```
gcloud compute ssh --project=$PROJECT --zone=$ZONE $TEST_INSTANCE_NAME --command "nvidia-smi"
```
    Si has instalado CUDA Toolkit, puedes usar la cuda_installer herramienta para verificar la instalación de la siguiente manera:
```
gcloud compute ssh --project=$PROJECT --zone=$ZONE $TEST_INSTANCE_NAME --command "python3 cuda_installer.pyz verify_cuda"
```
5. Limpiar. Una vez que hayas verificado que la imagen personalizada funciona, no es necesario que conserves la VM de verificación. Para eliminar la VM, ejecuta el siguiente comando:
```
gcloud compute instances delete --zone=$ZONE --project=$PROJECT $TEST_INSTANCE_NAME
```
6. Opcional: Para eliminar la imagen de disco que has creado, ejecuta el siguiente comando:
```
gcloud compute images delete --project=$PROJECT $SECURE_BOOT_IMAGE
```

Verificar la instalación del controlador de GPU

Después de completar los pasos de instalación del controlador, comprueba que se haya instalado e inicializado correctamente.

Linux

Conéctate a la instancia de Linux y usa el comando nvidia-smi para verificar que el controlador se ejecuta correctamente.

sudo nvidia-smi

El resultado debería ser similar al siguiente:

  +-----------------------------------------------------------------------------------------+
  | NVIDIA-SMI 580.82.07              Driver Version: 580.82.07      CUDA Version: 13.0     |
  +-----------------------------------------+------------------------+----------------------+
  | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
  | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
  |                                         |                        |               MIG M. |
  |=======================================+====================+====================|
  |   0  Tesla T4                       On  |   00000000:00:04.0 Off |                    0 |
  | N/A   53C    P8             17W /   70W |       0MiB /  15360MiB |      0%      Default |
  |                                         |                        |                  N/A |
  +-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
  | Processes:                                                                              |
  |  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
  |        ID   ID                                                               Usage      |
  |=========================================================================================|
  |  No running processes found                                                             |
  +-----------------------------------------------------------------------------------------+

Si este comando falla, comprueba si hay GPUs conectadas a la VM. Para comprobar si hay dispositivos PCI de NVIDIA, ejecuta el siguiente comando:

sudo lspci | grep -i "nvidia"

Windows Server

Conéctate a la instancia de Windows Server y abre un terminal de PowerShell. A continuación, ejecuta el siguiente comando para verificar que el controlador se está ejecutando correctamente.

nvidia-smi

El resultado debería ser similar al siguiente:

+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 538.67                 Driver Version: 538.67       CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                     TCC/WDDM  | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  NVIDIA L4                    WDDM  | 00000000:00:03.0 Off |                    0 |
| N/A   66C    P8              17W /  72W |    128MiB / 23034MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A      4888    C+G   ...CBS_cw5n1h2txyewy\TextInputHost.exe    N/A      |
|    0   N/A  N/A      5180    C+G   ....Search_cw5n1h2txyewy\SearchApp.exe    N/A      |
+---------------------------------------------------------------------------------------+

Siguientes pasos

Para monitorizar el rendimiento de la GPU, consulta Monitorizar el rendimiento de la GPU.

Para gestionar el mantenimiento del host de GPU, consulta Gestionar eventos de mantenimiento de host de GPU.
Para mejorar el rendimiento de la red, consulta Usar un ancho de banda de red mayor.
Para solucionar problemas de máquinas virtuales con GPU, consulta el artículo Solucionar problemas de máquinas virtuales con GPU.

Instalar controladores de GPU

Versiones del controlador de NVIDIA, del kit de herramientas CUDA y del tiempo de ejecución de CUDA

Información sobre las ramas de controladores de NVIDIA

Ramas de controladores de NVIDIA recomendadas

Instalar controladores de GPU en máquinas virtuales con las guías de CUDA Toolkit

Instalar controladores de GPU en máquinas virtuales mediante una secuencia de comandos de instalación

Linux

Linux (secuencia de comandos de inicio)

Windows

Instalar controladores de GPU (VMs con arranque seguro)

Compatibilidad con GPU

Instalación

Autofirma (automatizada)

Autofirma (manual)

Firmado previamente (solo Ubuntu)

Ubuntu PRO y LTS

Ubuntu PRO FIPS

Ubuntu 18.04

Ubuntu 20.04

Ubuntu 22.04

Verificar la instalación del controlador de GPU

Linux

Windows Server

Siguientes pasos