En este documento se ofrece una descripción general de los pasos necesarios para crear una instancia de Compute Engine con unidades de procesamiento gráfico (GPUs) conectadas. Puedes usar GPUs para acelerar determinadas cargas de trabajo, como las de aprendizaje automático y procesamiento de datos.
También puedes usar algunos tipos de máquinas con GPU en AI Hypercomputer. AI Hypercomputer es un sistema de supercomputación optimizado para admitir tus cargas de trabajo de inteligencia artificial (IA) y aprendizaje automático (ML). Esta opción se recomienda para crear una infraestructura densamente asignada y optimizada para el rendimiento que tenga integraciones para Google Kubernetes Engine (GKE) y los programadores de Slurm.
Para obtener más información sobre las GPUs en Compute Engine, consulta el artículo Acerca de las GPUs.
Selecciona el modelo de GPU
Para ver una lista de los modelos de GPU disponibles, consulta Plataformas de GPU. También debes anotar el tipo de máquina compatible con el modelo de GPU seleccionado.
En el caso de cada modelo, también puede ser útil consultar lo siguiente:
- Regiones y zonas admitidas
- Consulta los precios de las GPU para saber cuánto cuesta usar cada modelo de GPU en tus instancias. En el caso de las instancias que usan máquinas optimizadas para aceleradores, consulta también los precios de las instancias de máquinas virtuales.
Limitaciones
Además de las restricciones de todas las instancias con GPUs, cada serie de máquinas con GPUs conectadas tiene las siguientes limitaciones:
Instancias A4X
- Solo puedes solicitar capacidad mediante las opciones de consumo admitidas para un tipo de máquina A4X.
- No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible para las instancias que usen un tipo de máquina A4X.
- Solo puedes usar un tipo de máquina A4X en determinadas regiones y zonas.
- No puedes usar Persistent Disk (regional o de zona) en una instancia que use un tipo de máquina A4X.
- El tipo de máquina A4X solo está disponible en la plataforma NVIDIA Grace.
- No puedes cambiar el tipo de máquina de una instancia a un tipo de máquina A4X. Solo puedes crear instancias de A4X. Después de crear una instancia con un tipo de máquina A4X, no puedes cambiar el tipo de máquina.
- No puedes ejecutar sistemas operativos Windows en un tipo de máquina A4X.
- Las instancias A4X no admiten lo siguiente:
Instancias de A4
- Solo puedes solicitar capacidad mediante las opciones de consumo admitidas para un tipo de máquina A4.
- No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible para las instancias que usen un tipo de máquina A4.
- Solo puedes usar un tipo de máquina A4 en determinadas regiones y zonas.
- No puedes usar Persistent Disk (regional o zonal) en una instancia que use un tipo de máquina A4.
- El tipo de máquina A4 solo está disponible en la plataforma de CPU Emerald Rapids.
- No puedes cambiar el tipo de máquina de una instancia a un tipo de máquina A4. Solo puedes crear instancias A4 nuevas. Después de crear una instancia con un tipo de máquina A4, no puedes cambiar el tipo de máquina.
- Los tipos de máquinas A4 no admiten el único propietario.
- No puedes ejecutar sistemas operativos Windows en un tipo de máquina A4.
Instancias de A3 Ultra
- Solo puedes solicitar capacidad mediante las opciones de consumo admitidas para el tipo de máquina A3 Ultra.
- No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible para las instancias que usen un tipo de máquina A3 Ultra.
- Solo puedes usar un tipo de máquina A3 Ultra en determinadas regiones y zonas.
- No puedes usar Persistent Disk (regional o de zona) en una instancia que use un tipo de máquina A3 Ultra.
- El tipo de máquina A3 Ultra solo está disponible en la plataforma de CPU Emerald Rapids.
- No puedes cambiar el tipo de máquina de una instancia a A3 Ultra. Solo puedes crear instancias A3 Ultra. Después de crear una instancia con un tipo de máquina A3 Ultra, no puedes cambiar el tipo de máquina.
- Los tipos de máquinas A3 Ultra no admiten tenencia exclusiva.
- No puedes ejecutar sistemas operativos Windows en un tipo de máquina A3 Ultra.
Instancias A3 Mega
- Solo puedes solicitar capacidad mediante las opciones de consumo admitidas para el tipo de máquina A3 Mega.
- No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible por las instancias que usen un tipo de máquina A3 mega.
- Solo puedes usar un tipo de máquina A3 Mega en determinadas regiones y zonas.
- No puedes usar discos persistentes regionales en una instancia que use un tipo de máquina A3 Mega.
- El tipo de máquina A3 Mega solo está disponible en la plataforma de CPU Sapphire Rapids.
- No puedes cambiar el tipo de máquina de una instancia a A3 mega. Solo puedes crear instancias A3-mega nuevas. Después de crear una instancia con el tipo de máquina A3 Mega, no puedes cambiar el tipo de máquina.
- Los tipos de máquinas A3 Mega no admiten tenancy exclusiva.
- No puedes ejecutar sistemas operativos Windows en un tipo de máquina A3 Mega.
Instancias A3 High
- Solo puedes solicitar capacidad con las opciones de consumo admitidas para el tipo de máquina A3 High.
- No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible para las instancias que usen un tipo de máquina A3 High.
- Solo puedes usar un tipo de máquina A3 High en determinadas regiones y zonas.
- No puedes usar discos persistentes regionales en una instancia que use un tipo de máquina A3 High.
- El tipo de máquina A3 High solo está disponible en la plataforma de CPU Sapphire Rapids.
- No puedes cambiar el tipo de máquina de una instancia por un tipo de máquina A3 High. Solo puedes crear instancias A3 de alto rendimiento. Después de crear una instancia con un tipo de máquina A3 High, no puedes cambiar el tipo de máquina.
- Los tipos de máquinas A3 High no admiten el tenancy exclusivo.
- No puedes ejecutar sistemas operativos Windows en un tipo de máquina A3 High.
- En el caso de los tipos de máquina
a3-highgpu-1g
,a3-highgpu-2g
ya3-highgpu-4g
, debes crear instancias con VMs de acceso puntual o con una función que utilice el programador de cargas de trabajo dinámico (DWS), como las solicitudes de cambio de tamaño en un MIG. Para obtener instrucciones detalladas sobre cualquiera de estas opciones, consulta lo siguiente:- Para crear VMs de Spot, define el modelo de aprovisionamiento como
SPOT
cuando crees una VM optimizada para aceleradores. - Para crear una solicitud de cambio de tamaño en un MIG que use DWS, consulta Crear un MIG con VMs con GPU.
- Para crear VMs de Spot, define el modelo de aprovisionamiento como
- Solo puedes usar una VM confidencial con un tipo de máquina
a3-highgpu-1g
en regiones y zonas limitadas, y se aplican todas las limitaciones de las VMs confidenciales que se ejecutan en el tipo de máquina A3 High.
Instancias A3 Edge
- Solo puedes solicitar capacidad mediante las opciones de consumo admitidas para el tipo de máquina A3 Edge.
- No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible para las instancias que usen un tipo de máquina A3 Edge.
- Solo puedes usar un tipo de máquina A3 Edge en determinadas regiones y zonas.
- No puedes usar discos persistentes regionales en una instancia que use un tipo de máquina A3 Edge.
- El tipo de máquina A3 Edge solo está disponible en la plataforma de CPU Sapphire Rapids.
- No puedes cambiar el tipo de máquina de una instancia a un tipo de máquina A3 Edge. Solo puedes crear instancias A3-edge. Después de crear una instancia con un tipo de máquina A3 Edge, no puedes cambiar el tipo de máquina.
- Los tipos de máquinas A3 Edge no admiten tenancy exclusiva.
- No puedes ejecutar sistemas operativos Windows en un tipo de máquina A3 Edge.
Instancias estándar A2
- Solo puedes solicitar capacidad mediante las opciones de consumo admitidas para el tipo de máquina A2 estándar.
- No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible por las instancias que usen un tipo de máquina A2 estándar.
- Solo puedes usar un tipo de máquina estándar A2 en determinadas regiones y zonas.
- El tipo de máquina estándar A2 solo está disponible en la plataforma Cascade Lake.
- Si tu instancia usa un tipo de máquina A2 estándar, solo puedes cambiar de un tipo de máquina A2 estándar a otro. No puedes cambiar a ningún otro tipo de máquina. Para obtener más información, consulta Modificar instancias optimizadas para aceleradores.
- No puedes usar el sistema operativo Windows con los
a2-megagpu-16g
tipos de máquinas estándar A2. Si usas sistemas operativos Windows, elige otro tipo de máquina A2 Standard. - No puedes hacer un formato rápido de los SSD locales conectados en instancias de Windows que usen tipos de máquinas estándar A2.
Para formatear estas unidades SSD locales, debes realizar un formateo completo con la utilidad diskpart y especificar
format fs=ntfs label=tmpfs
. - Los tipos de máquinas estándar A2 no admiten el alquiler exclusivo.
Instancias A2 Ultra
- Solo puedes solicitar capacidad con las opciones de consumo admitidas para el tipo de máquina A2 Ultra.
- No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible para las instancias que usen un tipo de máquina A2 Ultra.
- Solo puedes usar un tipo de máquina A2 Ultra en determinadas regiones y zonas.
- El tipo de máquina A2 Ultra solo está disponible en la plataforma Cascade Lake.
- Si tu instancia usa un tipo de máquina A2 Ultra, no puedes cambiarlo. Si necesitas usar otro tipo de máquina A2 Ultra o cualquier otro tipo de máquina, debes crear una instancia.
- No puedes cambiar ningún otro tipo de máquina a un tipo de máquina A2 Ultra. Si necesitas una instancia que use un tipo de máquina A2 Ultra, debes crear una instancia nueva.
- No puedes hacer un formato rápido de los SSD locales conectados en instancias de Windows que usen tipos de máquinas A2 Ultra. Para formatear estas unidades SSD locales, debes realizar un formateo completo con la utilidad diskpart y especificar
format fs=ntfs label=tmpfs
.
Instancias de G4
- Solo puedes solicitar capacidad mediante las opciones de consumo admitidas para un tipo de máquina G4.
- No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible por las instancias que usen un tipo de máquina G4.
- Solo puedes usar un tipo de máquina G4 en determinadas regiones y zonas.
- No puedes usar Persistent Disk (regional o zonal) en una instancia que use un tipo de máquina G4.
- El tipo de máquina G4 solo está disponible en la plataforma AMD EPYC Turin de quinta generación.
- Solo puedes crear instancias bajo demanda. No se admiten reservas, inicio flexible ni máquinas virtuales de Spot. Para empezar a usar las instancias G4, ponte en contacto con tu equipo de cuentas de Google.
- Solo puedes crear instancias de G4 en
us-central1-b
. - Solo puedes usar los tipos de disco Hyperdisk Balanced y Hyperdisk Extreme en una instancia que use un tipo de máquina G4.
- No puedes aplicar descuentos por uso confirmado a instancias que usen un tipo de máquina G4.
- No puedes crear instancias de VM confidenciales que usen un tipo de máquina G4.
- No puedes crear instancias G4 en nodos de único cliente.
- No puedes crear instancias G4 que usen la estación de trabajo virtual (vWS) NVIDIA RTX.
Instancias G2
- Solo puedes solicitar capacidad mediante las opciones de consumo admitidas para un tipo de máquina G2.
- No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible para las instancias que usen un tipo de máquina G2.
- Solo puedes usar un tipo de máquina G2 en determinadas regiones y zonas.
- El tipo de máquina G2 solo está disponible en la plataforma Cascade Lake.
- Standard Persistent Disk (
pd-standard
) no se admite en instancias que usan el tipo de máquina G2. Para ver los tipos de disco compatibles, consulta Tipos de disco compatibles con G2. - No puedes crear GPUs de varias instancias en una instancia que use un tipo de máquina G2.
- Si necesitas cambiar el tipo de máquina de una instancia G2, consulta Modificar instancias optimizadas para aceleradores.
- No puedes usar imágenes de máquina virtual de aprendizaje profundo como discos de arranque de instancias que usen el tipo de máquina G2.
- El controlador predeterminado actual de Container-Optimized OS no admite GPUs L4 que se ejecuten en tipos de máquinas G2. Además, Container-Optimized OS solo admite un conjunto de controladores.
Si quieres usar Container-Optimized OS en tipos de máquinas G2, consulta las siguientes notas:
- Usa una versión de Container-Optimized OS que admita la versión mínima recomendada del controlador de NVIDIA
525.60.13
o una posterior. Para obtener más información, consulta las notas de la versión de Container-Optimized OS. - Cuando instales el controlador,
especifica la versión más reciente disponible que funcione con las GPUs L4.
Por ejemplo,
sudo cos-extensions install gpu -- -version=525.60.13
.
- Usa una versión de Container-Optimized OS que admita la versión mínima recomendada del controlador de NVIDIA
- Debes usar Google Cloud CLI o REST para crear instancias G2 en los siguientes casos:
- Quiere especificar valores de memoria personalizados.
- Quieres personalizar el número de núcleos de CPU visibles.
Instancias N1+GPU
Para obtener información sobre las limitaciones de las instancias N1 con GPUs, consulta las funciones de la serie de máquinas N1 y las GPUs de la serie de máquinas N1.
Elige un sistema operativo
Si utilizas GPUs para el aprendizaje automático, usa uno de los siguientes sistemas operativos:
Imágenes optimizadas para cargas de trabajo de IA. Puedes usar imágenes de Ubuntu y Rocky, que están disponibles en versiones optimizadas para aceleradores con controladores de NVIDIA y CUDA Toolkit preinstalados. Consulta Imágenes de SO en la documentación de AI Hypercomputer.
Imágenes de máquinas virtuales de aprendizaje profundo Cada máquina virtual de aprendizaje profundo tiene una herramienta de instalación de controladores de GPU e incluye paquetes como TensorFlow y PyTorch. También puedes usar una máquina virtual de aprendizaje profundo para cargas de trabajo generales de GPU. Para obtener más información sobre las imágenes disponibles y los paquetes instalados en ellas, consulta Elegir una imagen en la documentación de las máquinas virtuales de aprendizaje profundo.
También puedes usar una imagen pública o personalizada. En la mayoría de las imágenes públicas o imágenes personalizadas, debes instalar los controladores de NVIDIA y CUDA Toolkit. Para saber qué controladores son adecuados para tu modelo de GPU, consulta el artículo sobre cómo instalar controladores de GPU.
Comprobar la cuota de GPUs
Para proteger los sistemas y los usuarios de Compute Engine, los proyectos nuevos tienen una cuota de GPU global, que limita el número total de GPUs que puedes crear en cualquier zona admitida. Para consultar la cuota de GPUs, consulta Cuota de GPUs.
Si necesitas más cuota de GPU, solicita un aumento de la cuota. Cuando solicites una cuota de GPUs, tienes que pedir una cuota para los tipos de GPU que vayas a crear en cada región y, además, una cuota global para el total de GPUs (de todos los tipos y en todas las zonas).
Si tu proyecto tiene un historial de facturación, recibirá la cuota automáticamente después de enviar la solicitud.
Cuotas de instancias con GPU y de asignación interrumpible
Las instancias que usan el modelo de aprovisionamiento estándar normalmente no pueden usar cuotas de asignación de instancias no garantizadas. Las cuotas de recursos interrumpibles son para cargas de trabajo temporales y suelen estar más disponibles. Si tu proyecto no tiene cuota interrumpible y nunca la has solicitado, todas las instancias de tu proyecto consumen cuotas de asignación estándar.
Si solicitas una cuota de asignación de recursos preemptiva, las instancias que usen el modelo de aprovisionamiento estándar deben cumplir todos los criterios siguientes para consumir la cuota de asignación de recursos preemptiva:
- Las instancias tienen GPUs conectadas.
- Las instancias se configuran para que se eliminen automáticamente después de un tiempo de ejecución predefinido a través del campo
maxRunDuration
oterminationTime
. Para obtener más información, consulta lo siguiente: - La instancia no tiene permiso para consumir reservas. Para obtener más información, consulta el artículo Impedir que las instancias de proceso consuman reservas.
Cuando consumes asignación interrumpible para cargas de trabajo de GPU con límite de tiempo, puedes beneficiarte tanto del tiempo de ejecución ininterrumpido como de la alta disponibilidad de la cuota de asignación interrumpible. Para obtener más información, consulta las cuotas de instancias preemptivas.
Crear una instancia con GPUs conectadas
Para crear una instancia con GPUs conectadas, sigue estos pasos:
Crea la instancia. El método utilizado para crear una instancia depende del modelo de GPU seleccionado.
- Para crear una instancia que tenga Superchips NVIDIA GB200 Grace Blackwell conectados, consulta la descripción general de las opciones de implementación en la documentación de AI Hypercomputer.
- Para crear una instancia que tenga GPUs NVIDIA B200 o H200 conectadas, consulta Crear una instancia A3 Ultra o A4.
- Para crear una instancia que tenga GPUs NVIDIA H100, A100 o L4 conectadas, consulta el artículo Crear una instancia A3, A2 o G2.
- Para obtener información sobre cómo empezar a usar instancias G4 que tengan GPUs NVIDIA RTX PRO 6000 conectadas, ponte en contacto con tu equipo de cuentas de Google.
- Para crear una instancia que tenga GPUs NVIDIA T4, P4, P100 o V100 vinculadas, consulta el artículo Crear una instancia N1 que tenga GPUs vinculadas.
Para que la instancia use la GPU, debes instalar el controlador de la GPU en la instancia. Si has habilitado una estación de trabajo virtual NVIDIA RTX (antes NVIDIA GRID), instala un controlador para la estación de trabajo virtual.
Siguientes pasos
Consulta más información sobre las plataformas de GPU.
Consulta más información sobre las funciones y limitaciones de las GPUs.
- Consulta cómo ver el uso real y previsto de tus GPUs.