Información general sobre la creación de una instancia con GPUs conectadas


En este documento se ofrece una descripción general de los pasos necesarios para crear una instancia de Compute Engine con unidades de procesamiento gráfico (GPUs) conectadas. Puedes usar GPUs para acelerar determinadas cargas de trabajo, como las de aprendizaje automático y procesamiento de datos.

También puedes usar algunos tipos de máquinas con GPU en AI Hypercomputer. AI Hypercomputer es un sistema de supercomputación optimizado para admitir tus cargas de trabajo de inteligencia artificial (IA) y aprendizaje automático (ML). Esta opción se recomienda para crear una infraestructura densamente asignada y optimizada para el rendimiento que tenga integraciones para Google Kubernetes Engine (GKE) y los programadores de Slurm.

Para obtener más información sobre las GPUs en Compute Engine, consulta el artículo Acerca de las GPUs.

Selecciona el modelo de GPU

Para ver una lista de los modelos de GPU disponibles, consulta Plataformas de GPU. También debes anotar el tipo de máquina compatible con el modelo de GPU seleccionado.

En el caso de cada modelo, también puede ser útil consultar lo siguiente:

Limitaciones

Además de las restricciones de todas las instancias con GPUs, cada serie de máquinas con GPUs conectadas tiene las siguientes limitaciones:

Instancias A4X

Instancias de A4

Instancias de A3 Ultra

Instancias A3 Mega

Instancias A3 High

Instancias A3 Edge

Instancias estándar A2

  • Solo puedes solicitar capacidad mediante las opciones de consumo admitidas para el tipo de máquina A2 estándar.
  • No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible por las instancias que usen un tipo de máquina A2 estándar.
  • Solo puedes usar un tipo de máquina estándar A2 en determinadas regiones y zonas.
  • El tipo de máquina estándar A2 solo está disponible en la plataforma Cascade Lake.
  • Si tu instancia usa un tipo de máquina A2 estándar, solo puedes cambiar de un tipo de máquina A2 estándar a otro. No puedes cambiar a ningún otro tipo de máquina. Para obtener más información, consulta Modificar instancias optimizadas para aceleradores.
  • No puedes usar el sistema operativo Windows con los a2-megagpu-16gtipos de máquinas estándar A2. Si usas sistemas operativos Windows, elige otro tipo de máquina A2 Standard.
  • No puedes hacer un formato rápido de los SSD locales conectados en instancias de Windows que usen tipos de máquinas estándar A2. Para formatear estas unidades SSD locales, debes realizar un formateo completo con la utilidad diskpart y especificar format fs=ntfs label=tmpfs.
  • Los tipos de máquinas estándar A2 no admiten el alquiler exclusivo.

Instancias A2 Ultra

  • Solo puedes solicitar capacidad con las opciones de consumo admitidas para el tipo de máquina A2 Ultra.
  • No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible para las instancias que usen un tipo de máquina A2 Ultra.
  • Solo puedes usar un tipo de máquina A2 Ultra en determinadas regiones y zonas.
  • El tipo de máquina A2 Ultra solo está disponible en la plataforma Cascade Lake.
  • Si tu instancia usa un tipo de máquina A2 Ultra, no puedes cambiarlo. Si necesitas usar otro tipo de máquina A2 Ultra o cualquier otro tipo de máquina, debes crear una instancia.
  • No puedes cambiar ningún otro tipo de máquina a un tipo de máquina A2 Ultra. Si necesitas una instancia que use un tipo de máquina A2 Ultra, debes crear una instancia nueva.
  • No puedes hacer un formato rápido de los SSD locales conectados en instancias de Windows que usen tipos de máquinas A2 Ultra. Para formatear estas unidades SSD locales, debes realizar un formateo completo con la utilidad diskpart y especificar format fs=ntfs label=tmpfs.

Instancias de G4

  • Solo puedes solicitar capacidad mediante las opciones de consumo admitidas para un tipo de máquina G4.
  • No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible por las instancias que usen un tipo de máquina G4.
  • Solo puedes usar un tipo de máquina G4 en determinadas regiones y zonas.
  • No puedes usar Persistent Disk (regional o zonal) en una instancia que use un tipo de máquina G4.
  • El tipo de máquina G4 solo está disponible en la plataforma AMD EPYC Turin de quinta generación.
  • Solo puedes crear instancias bajo demanda. No se admiten reservas, inicio flexible ni máquinas virtuales de Spot. Para empezar a usar las instancias G4, ponte en contacto con tu equipo de cuentas de Google.
  • Solo puedes crear instancias de G4 en us-central1-b.
  • Solo puedes usar los tipos de disco Hyperdisk Balanced y Hyperdisk Extreme en una instancia que use un tipo de máquina G4.
  • No puedes aplicar descuentos por uso confirmado a instancias que usen un tipo de máquina G4.
  • No puedes crear instancias de VM confidenciales que usen un tipo de máquina G4.
  • No puedes crear instancias G4 en nodos de único cliente.
  • No puedes crear instancias G4 que usen la estación de trabajo virtual (vWS) NVIDIA RTX.

Instancias G2

Instancias N1+GPU

Para obtener información sobre las limitaciones de las instancias N1 con GPUs, consulta las funciones de la serie de máquinas N1 y las GPUs de la serie de máquinas N1.

Elige un sistema operativo

Si utilizas GPUs para el aprendizaje automático, usa uno de los siguientes sistemas operativos:

  • Imágenes optimizadas para cargas de trabajo de IA. Puedes usar imágenes de Ubuntu y Rocky, que están disponibles en versiones optimizadas para aceleradores con controladores de NVIDIA y CUDA Toolkit preinstalados. Consulta Imágenes de SO en la documentación de AI Hypercomputer.

  • Imágenes de máquinas virtuales de aprendizaje profundo Cada máquina virtual de aprendizaje profundo tiene una herramienta de instalación de controladores de GPU e incluye paquetes como TensorFlow y PyTorch. También puedes usar una máquina virtual de aprendizaje profundo para cargas de trabajo generales de GPU. Para obtener más información sobre las imágenes disponibles y los paquetes instalados en ellas, consulta Elegir una imagen en la documentación de las máquinas virtuales de aprendizaje profundo.

También puedes usar una imagen pública o personalizada. En la mayoría de las imágenes públicas o imágenes personalizadas, debes instalar los controladores de NVIDIA y CUDA Toolkit. Para saber qué controladores son adecuados para tu modelo de GPU, consulta el artículo sobre cómo instalar controladores de GPU.

Comprobar la cuota de GPUs

Para proteger los sistemas y los usuarios de Compute Engine, los proyectos nuevos tienen una cuota de GPU global, que limita el número total de GPUs que puedes crear en cualquier zona admitida. Para consultar la cuota de GPUs, consulta Cuota de GPUs.

Si necesitas más cuota de GPU, solicita un aumento de la cuota. Cuando solicites una cuota de GPUs, tienes que pedir una cuota para los tipos de GPU que vayas a crear en cada región y, además, una cuota global para el total de GPUs (de todos los tipos y en todas las zonas).

Si tu proyecto tiene un historial de facturación, recibirá la cuota automáticamente después de enviar la solicitud.

Cuotas de instancias con GPU y de asignación interrumpible

Las instancias que usan el modelo de aprovisionamiento estándar normalmente no pueden usar cuotas de asignación de instancias no garantizadas. Las cuotas de recursos interrumpibles son para cargas de trabajo temporales y suelen estar más disponibles. Si tu proyecto no tiene cuota interrumpible y nunca la has solicitado, todas las instancias de tu proyecto consumen cuotas de asignación estándar.

Si solicitas una cuota de asignación de recursos preemptiva, las instancias que usen el modelo de aprovisionamiento estándar deben cumplir todos los criterios siguientes para consumir la cuota de asignación de recursos preemptiva:

Cuando consumes asignación interrumpible para cargas de trabajo de GPU con límite de tiempo, puedes beneficiarte tanto del tiempo de ejecución ininterrumpido como de la alta disponibilidad de la cuota de asignación interrumpible. Para obtener más información, consulta las cuotas de instancias preemptivas.

Crear una instancia con GPUs conectadas

Para crear una instancia con GPUs conectadas, sigue estos pasos:

  1. Crea la instancia. El método utilizado para crear una instancia depende del modelo de GPU seleccionado.

  2. Para que la instancia use la GPU, debes instalar el controlador de la GPU en la instancia. Si has habilitado una estación de trabajo virtual NVIDIA RTX (antes NVIDIA GRID), instala un controlador para la estación de trabajo virtual.

Siguientes pasos