Descripción general para crear una instancia con GPUs adjuntas


Compute Engine proporciona unidades de procesamiento de gráficos (GPU) que puedes agregar a tus máquinas virtuales (VM). Puedes usar estas GPU para acelerar cargas de trabajo específicas en las VM, como el aprendizaje automático y el procesamiento de datos.

También puedes usar algunos tipos de máquinas con GPU en AI Hypercomputer. AI Hypercomputer es un sistema de supercomputación optimizado para admitir tus cargas de trabajo de inteligencia artificial (IA) y aprendizaje automático (AA). Esta opción se recomienda para crear una infraestructura optimizada para el rendimiento y con una asignación densa que tenga integraciones para los programadores de Google Kubernetes Engine (GKE) y Slurm.

En este documento, se proporciona una descripción general de los pasos necesarios para crear una VM con GPU conectadas.

Para obtener más información sobre las GPU en Compute Engine, consulta Acerca de las GPU.

Selecciona el modelo de GPU

Para obtener una lista de los modelos de GPU disponibles, consulta Plataformas de GPU. También toma nota del tipo de máquina que es compatible con el modelo de GPU seleccionado.

Para cada modelo, también puede ser útil revisar lo siguiente:

Limitaciones

Además de las restricciones para todas las VMs con GPUs, cada serie de máquinas con GPUs conectadas tiene las siguientes limitaciones:

VMs A4

  • Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina A4.
  • No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A4.
  • Solo puedes usar un tipo de máquina A4 en ciertas regiones y zonas.
  • No puedes usar discos persistentes (regionales o zonales) en una instancia que use un tipo de máquina A4.
  • El tipo de máquina A4 solo está disponible en la plataforma de CPU Emerald Rapids.
  • No puedes cambiar el tipo de máquina de una instancia existente a uno A4. Solo puedes crear instancias nuevas de A4. Después de crear una instancia con un tipo de máquina A4, no podrás cambiar el tipo de máquina.
  • Los tipos de máquinas A4 no admiten usuarios únicos.
  • No puedes ejecutar sistemas operativos Windows en un tipo de máquina A4.

VMs A3 Ultra

  • Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina A3 ultra.
  • No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A3 ultra.
  • Solo puedes usar un tipo de máquina A3 ultra en ciertas regiones y zonas.
  • No puedes usar Persistent Disk (regional o zonal) en una instancia que use un tipo de máquina A3 Ultra.
  • El tipo de máquina A3 Ultra solo está disponible en la plataforma de CPU Emerald Rapids.
  • No puedes cambiar el tipo de máquina de una instancia existente a uno A3 Ultra. Solo puedes crear instancias nuevas de A3 ultra. Después de crear una instancia con un tipo de máquina A3 ultra, no puedes cambiar el tipo de máquina.
  • Los tipos de máquinas A3 Ultra no admiten usuarios únicos.
  • No puedes ejecutar sistemas operativos Windows en un tipo de máquina A3 Ultra.

VMs A3 Mega

  • Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina A3 Mega.
  • No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A3 Mega.
  • Solo puedes usar un tipo de máquina A3 Mega en ciertas regiones y zonas.
  • No puedes usar Persistent Disk regional en una instancia que usa un tipo de máquina A3 Mega.
  • El tipo de máquina A3 Mega solo está disponible en la plataforma de CPU Sapphire Rapids.
  • No puedes cambiar el tipo de máquina de una instancia existente a un tipo de máquina Mega A3. Solo puedes crear instancias nuevas de A3-mega. Después de crear una instancia con un tipo de máquina A3 Mega, no puedes cambiar el tipo de máquina.
  • Los tipos de máquinas A3 Mega no admiten usuarios únicos.
  • No puedes ejecutar sistemas operativos Windows en un tipo de máquina A3 Mega.

VMs A3 High

  • Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina A3 High.
  • No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A3 High.
  • Solo puedes usar un tipo de máquina A3 High en ciertas regiones y zonas.
  • No puedes usar Persistent Disk regional en una instancia que usa un tipo de máquina A3 High.
  • El tipo de máquina A3 High solo está disponible en la plataforma de CPU Sapphire Rapids.
  • No puedes cambiar el tipo de máquina de una instancia existente a uno A3 High. Solo puedes crear instancias nuevas de alta resolución A3. Después de crear una instancia con un tipo de máquina A3 High, no podrás cambiar el tipo de máquina.
  • Los tipos de máquinas A3 High no admiten usuarios únicos.
  • No puedes ejecutar sistemas operativos Windows en un tipo de máquina A3 High.
  • Para los tipos de máquinas a3-highgpu-1g, a3-highgpu-2g y a3-highgpu-4g, debes crear instancias con VMs Spot o una función que use el programador dinámico de cargas de trabajo (DWS), como las solicitudes de cambio de tamaño en un MIG. Para obtener instrucciones detalladas sobre cualquiera de estas opciones, consulta lo siguiente:

VMs A3 Edge

  • Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina A3 Edge.
  • No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A3 Edge.
  • Solo puedes usar un tipo de máquina A3 Edge en ciertas regiones y zonas.
  • No puedes usar Persistent Disk regional en una instancia que use un tipo de máquina A3 Edge.
  • El tipo de máquina A3 Edge solo está disponible en la plataforma de CPU Sapphire Rapids.
  • No puedes cambiar el tipo de máquina de una instancia existente a uno A3 Edge. Solo puedes crear instancias nuevas de A3-edge. Después de crear una instancia con un tipo de máquina A3 Edge, no puedes cambiar el tipo de máquina.
  • Los tipos de máquinas A3 Edge no admiten usuarios únicos.
  • No puedes ejecutar sistemas operativos Windows en un tipo de máquina A3 Edge.

VMs estándar A2

  • Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina estándar A2.
  • No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A2 estándar.
  • Solo puedes usar un tipo de máquina A2 estándar en ciertas regiones y zonas.
  • Los tipos de máquinas A2 estándar solo están disponibles en la plataforma Cascade Lake.
  • Si tu instancia usa un tipo de máquina estándar A2, solo puedes cambiar de un tipo de máquina estándar A2 a otro. No puedes cambiar a ningún otro tipo de máquina. Para obtener más información, consulta Modifica instancias optimizadas para aceleradores.
  • No puedes usar el sistema operativo Windows con los tipos de máquinas a2-megagpu-16g A2 estándar. Cuando uses sistemas operativos Windows, elige un tipo de máquina A2 estándar diferente.
  • No puedes realizar un formateo rápido de las SSD locales conectadas en las instancias de Windows que usan los tipos de máquinas A2 estándar. Para formatear estos SSD locales, debes realizar un formateo completo mediante el uso de la utilidad diskpart y la especificación de format fs=ntfs label=tmpfs.
  • Los tipos de máquinas A2 estándar no admiten usuarios únicos.

VMs A2 ultra

  • Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina A2 ultra.
  • No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A2 ultra.
  • Solo puedes usar un tipo de máquina A2 ultra en ciertas regiones y zonas.
  • Los tipos de máquinas A2 ultra solo están disponibles en la plataforma Cascade Lake.
  • Si tu instancia usa un tipo de máquina A2 ultra, no puedes cambiar el tipo de máquina. Si necesitas usar un tipo de máquina A2 ultra diferente o cualquier otro tipo de máquina, debes crear una instancia nueva.
  • No puedes cambiar ningún otro tipo de máquina a uno A2 ultra. Si necesitas una instancia que use un tipo de máquina A2 ultra, debes crear una instancia nueva.
  • No puedes realizar un formateo rápido de las SSD locales conectados en las instancias de Windows que usan los tipos de máquinas A2 ultra. Para formatear estos SSD locales, debes realizar un formateo completo mediante el uso de la utilidad diskpart y la especificación de format fs=ntfs label=tmpfs.

VMs G2

  • Solo puedes solicitar capacidad con las opciones de consumo compatibles para un tipo de máquina G2.
  • No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina G2.
  • Solo puedes usar un tipo de máquina G2 en ciertas regiones y zonas.
  • Los tipos de máquinas G2 solo están disponibles en la plataforma Cascade Lake.
  • El disco persistente estándar (pd-standard) no es compatible con las instancias que usan el tipo de máquina G2. Para conocer los tipos de discos compatibles, consulta Tipos de discos compatibles con G2.
  • No puedes crear GPUs de instancias múltiples en una instancia que usa un tipo de máquina G2.
  • Si necesitas cambiar el tipo de máquina de una instancia G2, revisa Modifica las instancias optimizadas para aceleradores.
  • No puedes usar imágenes de Deep Learning VM Image como discos de arranque para las instancias que usan el tipo de máquina G2.
  • El controlador predeterminado actual para Container-Optimized OS no es compatible con las GPU L4 que se ejecutan en los tipos de máquinas G2. Además, Container-Optimized OS solo admite un conjunto selecto de controladores. Si deseas usar Container-Optimized OS en tipos de máquinas G2, revisa las siguientes notas:
    • Usa una versión de Container-Optimized OS que sea compatible con la versión mínima recomendada del controlador NVIDIA 525.60.13 o posterior. Para obtener más información, revisa las notas de la versión de Container-Optimized OS.
    • Cuando instalas el controlador, especifica la versión más reciente disponible que funcione para las GPU L4. Por ejemplo, sudo cos-extensions install gpu -- -version=525.60.13
  • Debes usar Google Cloud CLI o REST para crear instancias de G2 en las siguientes situaciones:
    • Deseas especificar valores de memoria personalizados.
    • Deseas personalizar la cantidad de núcleos de CPU visibles.

VMs N1+GPU

Para obtener información sobre las limitaciones de las instancias N1 con GPU, consulta las características de la serie de máquinas N1 y las GPU para la serie de máquinas N1.

Elige un sistema operativo

Si usas GPUs para el aprendizaje automático, usa uno de los siguientes sistemas operativos:

  • Imágenes optimizadas para cargas de trabajo de IA. Puedes usar imágenes de Ubuntu y Rocky, que están disponibles en versiones optimizadas para aceleradores con controladores y el kit de herramientas de CUDA preinstalados. Consulta Imágenes del SO en la documentación de AI Hypercomputer.
  • Imágenes de VM para el aprendizaje profundo. Cada VM de aprendizaje profundo tiene una herramienta de instalación de controladores de GPU y, además, incluye paquetes como TensorFlow y PyTorch. También puedes usar una VM de aprendizaje profundo para cargas de trabajo generales de GPU. Para obtener más información sobre las imágenes disponibles y los paquetes instalados en ellas, consulta Elige una imagen.

También puedes usar cualquier imagen pública o imagen personalizada. Ten en cuenta que algunas imágenes pueden requerir un controlador único o tener un proceso de instalación que no se incluye en el alcance de la documentación de Compute Engine. Para identificar qué controladores son apropiados para tu imagen de SO, consulta cómo instalar controladores de GPU.

Comprueba la cuota de GPU

Para proteger los sistemas y usuarios de Compute Engine, los nuevos proyectos tienen una cuota global de GPU que limita la cantidad total de GPU que puedes crear en cualquier zona compatible. Para revisar la cuota de GPU, consulta Cuota de GPU.

Si necesitas cuota adicional de GPU, solicita un aumento de cuota. Cuando solicitas una cuota de GPU, debes especificar una cuota de los tipos de GPU que quieres crear en cada región y también indicar la cuota global, con la cantidad total de GPU de todos los tipos en todas las zonas.

Si tu proyecto tiene un historial de facturación establecido, recibirás la cuota de forma automática después de enviar la solicitud.

VMs de GPU y cuotas de asignación interrumpibles

Por lo general, las instancias que usan el modelo de aprovisionamiento estándar no pueden usar cuotas de asignación interrumpibles. Las cuotas interrumpibles son para cargas de trabajo temporales y suelen estar más disponibles. Si tu proyecto no tiene cuota interrumpible y nunca la solicitaste, todas las instancias de tu proyecto consumen cuotas de asignación estándar.

Si solicitas una cuota de asignación interrumpible, las instancias que usan el modelo de aprovisionamiento estándar deben cumplir con todos los siguientes criterios para consumir la cuota de asignación interrumpible:

Cuando consumes asignación interrumpible para cargas de trabajo de GPU con límite de tiempo, puedes beneficiarte tanto del tiempo de ejecución ininterrumpido como de la alta disponibilidad de la cuota de asignación interrumpible. Para obtener más información, consulta Cuotas interrumpibles.

Crea una VM que tenga GPUs conectadas

Para crear una VM que tenga GPU conectadas, completa los siguientes pasos:

  1. Crea la VM. El método que se usa para crear una VM depende del modelo de GPU.

  2. Para que la VM use la GPU, debes instalar el controlador de GPU en tu VM. Si habilitaste una estación de trabajo virtual de NVIDIA RTX (antes conocida como NVIDIA GRID), instala un controlador para la estación de trabajo virtual.

Próximos pasos