Se usó la API de Cloud Translation para traducir esta página.

Descripción general para crear una instancia con GPUs adjuntas

Linux Windows

En este documento, se proporciona una descripción general de los pasos necesarios para crear una instancia de Compute Engine con unidades de procesamiento de gráficos (GPU) conectadas. Puedes usar las GPU para acelerar cargas de trabajo específicas, como el aprendizaje automático y el procesamiento de datos.

También puedes usar algunos tipos de máquinas con GPU en AI Hypercomputer. AI Hypercomputer es un sistema de supercomputación optimizado para admitir tus cargas de trabajo de inteligencia artificial (IA) y aprendizaje automático (AA). Esta opción se recomienda para crear una infraestructura optimizada para el rendimiento y con una asignación densa que tenga integraciones para los programadores de Google Kubernetes Engine (GKE) y Slurm.

Para obtener más información sobre las GPU en Compute Engine, consulta Acerca de las GPU.

Selecciona el modelo de GPU

Para obtener una lista de los modelos de GPU disponibles, consulta Plataformas de GPU. También toma nota del tipo de máquina que es compatible con el modelo de GPU seleccionado.

Para cada modelo, también puede ser útil revisar lo siguiente:

Regiones y zonas compatibles.
Precios de GPU para comprender el costo del uso de cada modelo de GPU en tus instancias. En el caso de las instancias que usan máquinas optimizadas para aceleradores, consulta también los precios de instancias de VM.

Limitaciones

Además de las restricciones para todas las instancias con GPUs, cada serie de máquinas con GPUs conectadas tiene las siguientes limitaciones:

Instancias A4

Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina A4.
No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A4.
Solo puedes usar un tipo de máquina A4 en ciertas regiones y zonas.
No puedes usar discos persistentes (regionales o zonales) en una instancia que use un tipo de máquina A4.
El tipo de máquina A4 solo está disponible en la plataforma de CPU Emerald Rapids.
No puedes cambiar el tipo de máquina de una instancia existente a uno A4. Solo puedes crear instancias nuevas de A4. Después de crear una instancia con un tipo de máquina A4, no podrás cambiar el tipo de máquina.
Los tipos de máquinas A4 no admiten usuarios únicos.
No puedes ejecutar sistemas operativos Windows en un tipo de máquina A4.

Instancias A3 Ultra

Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina A3 ultra.
No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A3 ultra.
Solo puedes usar un tipo de máquina A3 ultra en ciertas regiones y zonas.
No puedes usar Persistent Disk (regional o zonal) en una instancia que use un tipo de máquina A3 Ultra.
El tipo de máquina A3 Ultra solo está disponible en la plataforma de CPU Emerald Rapids.
No puedes cambiar el tipo de máquina de una instancia existente a uno A3 Ultra. Solo puedes crear instancias nuevas de A3 ultra. Después de crear una instancia con un tipo de máquina A3 ultra, no puedes cambiar el tipo de máquina.
Los tipos de máquinas A3 Ultra no admiten usuarios únicos.
No puedes ejecutar sistemas operativos Windows en un tipo de máquina A3 Ultra.

Instancias A3 Mega

Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina A3 Mega.
No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A3 Mega.
Solo puedes usar un tipo de máquina A3 Mega en ciertas regiones y zonas.
No puedes usar Persistent Disk regional en una instancia que usa un tipo de máquina A3 Mega.
El tipo de máquina A3 Mega solo está disponible en la plataforma de CPU Sapphire Rapids.
No puedes cambiar el tipo de máquina de una instancia existente a un tipo de máquina Mega A3. Solo puedes crear instancias nuevas de A3-mega. Después de crear una instancia con un tipo de máquina A3 Mega, no puedes cambiar el tipo de máquina.
Los tipos de máquinas A3 Mega no admiten usuarios únicos.
No puedes ejecutar sistemas operativos Windows en un tipo de máquina A3 Mega.

Instancias A3 High

Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina A3 High.
No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A3 High.
Solo puedes usar un tipo de máquina A3 High en ciertas regiones y zonas.
No puedes usar Persistent Disk regional en una instancia que usa un tipo de máquina A3 High.
El tipo de máquina A3 High solo está disponible en la plataforma de CPU Sapphire Rapids.
No puedes cambiar el tipo de máquina de una instancia existente a uno A3 High. Solo puedes crear instancias nuevas de A3-high. Después de crear una instancia con un tipo de máquina A3 High, no podrás cambiar el tipo de máquina.
Los tipos de máquinas A3 High no admiten usuarios únicos.
No puedes ejecutar sistemas operativos Windows en un tipo de máquina A3 High.
Para los tipos de máquinas a3-highgpu-1g, a3-highgpu-2g y a3-highgpu-4g, debes crear instancias con VMs Spot o una función que use el programador dinámico de cargas de trabajo (DWS), como las solicitudes de cambio de tamaño en un MIG. Para obtener instrucciones detalladas sobre cualquiera de estas opciones, consulta lo siguiente:
- Para crear VMs Spot, establece el modelo de aprovisionamiento en SPOT cuando crees una VM optimizada para aceleradores.
- Para crear una solicitud de cambio de tamaño en un MIG que usa DWS, consulta Crea un MIG con VMs de GPU.

Instancias de A3 Edge

Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina A3 Edge.
No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A3 Edge.
Solo puedes usar un tipo de máquina A3 Edge en ciertas regiones y zonas.
No puedes usar Persistent Disk regional en una instancia que use un tipo de máquina A3 Edge.
El tipo de máquina A3 Edge solo está disponible en la plataforma de CPU Sapphire Rapids.
No puedes cambiar el tipo de máquina de una instancia existente a uno A3 Edge. Solo puedes crear instancias nuevas de A3-edge. Después de crear una instancia con un tipo de máquina A3 Edge, no puedes cambiar el tipo de máquina.
Los tipos de máquinas A3 Edge no admiten usuarios únicos.
No puedes ejecutar sistemas operativos Windows en un tipo de máquina A3 Edge.

Instancias de A2 estándar

Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina estándar A2.
No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A2 estándar.
Solo puedes usar un tipo de máquina A2 estándar en ciertas regiones y zonas.
Los tipos de máquinas A2 estándar solo están disponibles en la plataforma Cascade Lake.
Si tu instancia usa un tipo de máquina estándar A2, solo puedes cambiar de un tipo de máquina estándar A2 a otro. No puedes cambiar a ningún otro tipo de máquina. Para obtener más información, consulta Modifica instancias optimizadas para aceleradores.
No puedes usar el sistema operativo Windows con los tipos de máquinas a2-megagpu-16g A2 estándar. Cuando uses sistemas operativos Windows, elige un tipo de máquina A2 estándar diferente.
No puedes realizar un formateo rápido de las SSD locales conectadas en las instancias de Windows que usan los tipos de máquinas A2 estándar. Para formatear estos SSD locales, debes realizar un formateo completo mediante el uso de la utilidad diskpart y la especificación de format fs=ntfs label=tmpfs.
Los tipos de máquinas A2 estándar no admiten usuarios únicos.

Instancias A2 Ultra

Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina A2 ultra.
No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A2 ultra.
Solo puedes usar un tipo de máquina A2 ultra en ciertas regiones y zonas.
Los tipos de máquinas A2 ultra solo están disponibles en la plataforma Cascade Lake.
Si tu instancia usa un tipo de máquina A2 ultra, no puedes cambiar el tipo de máquina. Si necesitas usar un tipo de máquina A2 ultra diferente o cualquier otro tipo de máquina, debes crear una instancia nueva.
No puedes cambiar ningún otro tipo de máquina a uno A2 ultra. Si necesitas una instancia que use un tipo de máquina A2 ultra, debes crear una instancia nueva.
No puedes realizar un formateo rápido de las SSD locales conectados en las instancias de Windows que usan los tipos de máquinas A2 ultra. Para formatear estos SSD locales, debes realizar un formateo completo mediante el uso de la utilidad diskpart y la especificación de format fs=ntfs label=tmpfs.

Instancias G4

Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina G4.
No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina G4.
Solo puedes usar un tipo de máquina G4 en ciertas regiones y zonas.
No puedes usar Persistent Disk (regional o zonal) en una instancia que use un tipo de máquina G4.
El tipo de máquina G4 solo está disponible en la plataforma AMD EPYC Turin de 5ª generación.
Solo puedes crear instancias a pedido. No se admiten las VMs reservadas, de inicio flexible ni Spot. Para comenzar a usar las instancias G4, comunícate con tu equipo de cuentas de Google.
Solo puedes crear instancias G4 en us-central1-b.
Solo puedes usar los tipos de disco Hyperdisk Balanced y Hyperdisk Extreme en una instancia que use un tipo de máquina G4.
No puedes aplicar descuentos por compromiso de uso a las instancias que usan un tipo de máquina G4.
No puedes crear instancias de VM confidenciales que usen un tipo de máquina G4.
No puedes crear instancias G4 en nodos de usuario único.
No puedes crear instancias G4 que usen la estación de trabajo virtual (vWS) NVIDIA RTX.

Instancias G2

Solo puedes solicitar capacidad con las opciones de consumo compatibles para un tipo de máquina G2.
No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina G2.
Solo puedes usar un tipo de máquina G2 en ciertas regiones y zonas.
Los tipos de máquinas G2 solo están disponibles en la plataforma Cascade Lake.
El disco persistente estándar (pd-standard) no es compatible con las instancias que usan el tipo de máquina G2. Para conocer los tipos de discos compatibles, consulta Tipos de discos compatibles con G2.
No puedes crear GPUs de instancias múltiples en una instancia que usa un tipo de máquina G2.
Si necesitas cambiar el tipo de máquina de una instancia G2, revisa Modifica las instancias optimizadas para aceleradores.
No puedes usar imágenes de Deep Learning VM Image como discos de arranque para las instancias que usan el tipo de máquina G2.
El controlador predeterminado actual para Container-Optimized OS no es compatible con las GPU L4 que se ejecutan en los tipos de máquinas G2. Además, Container-Optimized OS solo admite un conjunto selecto de controladores. Si deseas usar Container-Optimized OS en tipos de máquinas G2, revisa las siguientes notas:
- Usa una versión de Container-Optimized OS que sea compatible con la versión mínima recomendada del controlador NVIDIA 525.60.13 o posterior. Para obtener más información, revisa las notas de la versión de Container-Optimized OS.
- Cuando instalas el controlador, especifica la versión más reciente disponible que funcione para las GPU L4. Por ejemplo, sudo cos-extensions install gpu -- -version=525.60.13
Debes usar Google Cloud CLI o REST para crear instancias de G2 en las siguientes situaciones:
- Deseas especificar valores de memoria personalizados.
- Deseas personalizar la cantidad de núcleos de CPU visibles.

Instancias de N1+GPU

Para obtener información sobre las limitaciones de las instancias N1 con GPU, consulta las características de la serie de máquinas N1 y las GPU para la serie de máquinas N1.

Elige un sistema operativo

Si usas GPUs para el aprendizaje automático, usa uno de los siguientes sistemas operativos:

Imágenes optimizadas para cargas de trabajo de IA. Puedes usar imágenes de Ubuntu y Rocky, que están disponibles en versiones optimizadas para aceleradores con controladores de NVIDIA y el kit de herramientas de CUDA preinstalados. Consulta Imágenes del SO en la documentación de AI Hypercomputer.
Imágenes de VM para el aprendizaje profundo. Cada VM de aprendizaje profundo tiene una herramienta de instalación de controladores de GPU y, además, incluye paquetes como TensorFlow y PyTorch. También puedes usar una VM de aprendizaje profundo para cargas de trabajo generales de GPU. Para obtener más información sobre las imágenes disponibles y los paquetes instalados en ellas, consulta Elige una imagen en la documentación de las VMs de aprendizaje profundo.

Precaución: No puedes usar imágenes de Deep Learning VM Image en discos de arranque para las VMs que usan tipos de máquinas G2. Los tipos de máquinas G2 son series de máquinas optimizadas para aceleradores que tienen GPU NVIDIA L4 conectadas.

También puedes usar una imagen pública o personalizada. Para la mayoría de las imágenes públicas o imágenes personalizadas, debes instalar los controladores de NVIDIA y el kit de herramientas de CUDA. Para identificar qué controladores son adecuados para tu modelo de GPU, consulta Instala controladores de GPU.

Comprueba la cuota de GPU

Para proteger los sistemas y usuarios de Compute Engine, los nuevos proyectos tienen una cuota global de GPU que limita la cantidad total de GPU que puedes crear en cualquier zona compatible. Para revisar la cuota de GPU, consulta Cuota de GPU.

Si necesitas cuota adicional de GPU, solicita un aumento de cuota. Cuando solicitas una cuota de GPU, debes especificar una cuota de los tipos de GPU que quieres crear en cada región y también indicar la cuota global, con la cantidad total de GPU de todos los tipos en todas las zonas.

Si tu proyecto tiene un historial de facturación establecido, recibirás la cuota de forma automática después de enviar la solicitud.

Instancias de GPU y cuotas de asignación interrumpibles

Por lo general, las instancias que usan el modelo de aprovisionamiento estándar no pueden usar cuotas de asignación interrumpibles. Las cuotas interrumpibles son para cargas de trabajo temporales y suelen estar más disponibles. Si tu proyecto no tiene cuota interrumpible y nunca la solicitaste, todas las instancias de tu proyecto consumen cuotas de asignación estándar.

Si solicitas una cuota de asignación interrumpible, las instancias que usan el modelo de aprovisionamiento estándar deben cumplir con todos los siguientes criterios para consumir la cuota de asignación interrumpible:

Las instancias tienen GPU conectadas.
Las instancias están configuradas para borrarse automáticamente después de un tiempo de ejecución predefinido a través del campo maxRunDuration o terminationTime. Para obtener más información, consulta lo siguiente:
- Limita el tiempo de ejecución de una instancia
- Limita el tiempo de ejecución de las instancias en un MIG
La instancia no puede consumir reservas. Para obtener más información, consulta Cómo evitar que las instancias de procesamiento consuman reservas.

Cuando consumes asignación interrumpible para cargas de trabajo de GPU con límite de tiempo, puedes beneficiarte tanto del tiempo de ejecución ininterrumpido como de la alta disponibilidad de la cuota de asignación interrumpible. Para obtener más información, consulta Cuotas interrumpibles.

Crea una instancia que tenga GPUs conectadas

Para crear una instancia que tenga GPU conectadas, completa los siguientes pasos:

Crea la instancia. El método que se usa para crear una instancia depende del modelo de GPU seleccionado.
- Para crear una instancia que tenga GPU NVIDIA B200 o H200 conectadas, consulta Crea una instancia A3 Ultra o A4.
- Para crear una instancia que tenga conectada una GPU NVIDIA H100, A100 o L4, consulta Crea una instancia A3, A2 o G2.
- Para obtener información sobre cómo comenzar a usar instancias G4 con GPUs NVIDIA RTX PRO 6000 adjuntas, comunícate con tu equipo de cuentas de Google.
- Para crear una instancia que tenga conectada una GPU NVIDIA T4, P4, P100 o V100, consulta Crea una instancia N1 que tenga las GPU conectadas.
Para que la instancia use la GPU, debes instalar el controlador de GPU en tu instancia. Si habilitaste una estación de trabajo virtual de NVIDIA RTX (antes conocida como NVIDIA GRID), instala un controlador para la estación de trabajo virtual.

Próximos pasos

Más información sobre las plataformas de GPU.
Obtén más información sobre las características y limitaciones del uso de las GPU.

Obtén información para ver el uso real y previsto de tus GPU.