En este documento, se describe cómo crear instancias con GPUs conectadas desde las series de máquinas A3 Ultra o A4. Para obtener más información sobre cómo crear instancias con GPU conectadas, consulta Descripción general de la creación de una instancia con GPU conectadas.
Las series de máquinas A4 y A3 Ultra están diseñadas para permitirte ejecutar clústeres de IA/AA a gran escala con funciones como la colocación de cargas de trabajo segmentadas, controles avanzados de mantenimiento de clústeres y programación compatible con la topología. Para obtener más información, consulta la descripción general de la administración de clústeres.
Antes de comenzar
- Para revisar las limitaciones y los pasos de requisitos previos adicionales para crear instancias con GPU conectadas, como seleccionar una imagen de SO o verificar la cuota de GPU, consulta la Descripción general de la creación de una instancia con GPU conectadas.
-
Si aún no lo hiciste, configura la autenticación.
La autenticación verifica tu identidad para acceder a los servicios y las APIs de Google Cloud . Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI ejecutando el siguiente comando:
gcloud init
Si usas un proveedor de identidad externo (IdP), primero debes acceder a gcloud CLI con tu identidad federada.
- Set a default region and zone.
REST
Para usar las muestras de la API de REST en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a gcloud CLI.
Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI ejecutando el siguiente comando:
gcloud init
Si usas un proveedor de identidad externo (IdP), primero debes acceder a gcloud CLI con tu identidad federada.
Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Google Cloud .
Roles requeridos
Para obtener los permisos que necesitas para crear instancias, pídele a tu administrador que te otorgue el rol de IAM Administrador de instancias de Compute (v1) (
roles/compute.instanceAdmin.v1
) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.Este rol predefinido contiene los permisos necesarios para crear instancias. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:
Permisos necesarios
Se requieren los siguientes permisos para crear instancias:
-
compute.instances.create
en el proyecto -
Si deseas usar una imagen personalizada para crear la VM, sigue estos pasos:
compute.images.useReadOnly
en la imagen -
Para usar una instantánea a fin de crear la VM, haz lo siguiente:
compute.snapshots.useReadOnly
en la instantánea -
Si quieres usar una plantilla de instancias para crear la VM, sigue estos pasos:
compute.instanceTemplates.useReadOnly
en la plantilla de instancias -
A fin de especificar una subred para tu VM:
compute.subnetworks.use
en el proyecto o en la subred elegida -
Si deseas especificar una dirección IP estática para la VM:
compute.addresses.use
en el proyecto -
Para asignar una dirección IP externa a la VM cuando se usa una red de VPC,
compute.subnetworks.useExternalIp
en el proyecto o en la subred elegida. -
Para asignar una red heredada a la VM, ejecuta
compute.networks.use
en el proyecto. -
Para asignar una dirección IP externa a la VM cuando se usa una red heredada, ejecuta
compute.networks.useExternalIp
en el proyecto -
Para configurar los metadatos de la instancia de VM para la VM,
compute.instances.setMetadata
en el proyecto. -
Para configurar etiquetas en la VM, haz lo siguiente:
compute.instances.setTags
en la VM -
Para configurar etiquetas en la VM, haz lo siguiente:
compute.instances.setLabels
en la VM -
A fin de configurar una cuenta de servicio para que la VM use:
compute.instances.setServiceAccount
en la VM -
Crear un disco nuevo para la VM:
compute.disks.create
en el proyecto -
Para conectar un disco existente en modo de solo lectura o de lectura y escritura, usa
compute.disks.use
en el disco. -
Para conectar un disco existente en modo de solo lectura, haz lo siguiente:
compute.disks.useReadOnly
en el disco
También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.
Cómo determinar la creación de instancias A3 Ultra o A4
Para determinar las opciones que deseas usar para crear instancias de A3 Ultra o A4, completa los siguientes pasos:
Elige una opción de consumo: Para obtener información sobre cómo elegir una opción de consumo para una instancia A3 Ultra o A4, consulta Elige una opción de consumo en la documentación de AI Hypercomputer.
Obtén capacidad: Para obtener información sobre cómo obtener capacidad para instancias A3 Ultra o A4 para la opción de consumo que elegiste, consulta Descripción general de la capacidad en la documentación de AI Hypercomputer.
Selecciona instrucciones de creación: Para obtener información sobre todas las opciones que puedes usar para crear instancias A3 Ultra o A4, como grupos de instancias administrados (MIG) o clústeres, consulta Descripción general de la creación de VMs y clústeres en la documentación de AI Hypercomputer.
Si quieres usar las funciones de administración de clústeres de A3 Ultra o A4, o si no quieres crear instancias independientes, selecciona una opción de creación en la documentación de AI Hypercomputer.
Crea una instancia de A3 Ultra o A4
Para crear una instancia A3 Ultra o A4, completa los siguientes pasos:
Crea redes de VPC
Para configurar la red para el tipo de máquina A4 o A3 Ultra, crea tres redes de VPC para las siguientes interfaces de red:
- 2 redes de VPC normales para las interfaces de red (NIC) gVNIC Se usan para la comunicación de host a host.
- Se requiere 1 red de VPC con el perfil de red RoCE para las NIC CX-7. La red de VPC de RoCE debe tener 8 subredes, una para cada NIC CX-7. Estas NIC usan RDMA a través de Ethernet convergida (RoCE), lo que proporciona la comunicación de gran ancho de banda y baja latencia que es esencial para la comunicación de GPU a GPU.
Para obtener más información sobre la disposición de las NIC, consulta Revisa el ancho de banda de la red y la disposición de las NIC.
Crea las redes de forma manual siguiendo las guías de instrucciones o automáticamente con la secuencia de comandos proporcionada.
Guías de instrucciones
Para crear las redes, puedes usar las siguientes instrucciones:
- Para crear las redes de VPC normales para las gVNICs, consulta Crea y administra redes de nube privada virtual.
- Para crear la red de VPC de RoCE, consulta Crea una red de nube privada virtual para las NIC de RDMA.
Para estas redes de VPC, te recomendamos que establezcas la unidad de transmisión máxima (MTU) en un valor mayor. Para el tipo de máquina A4 o A3 Ultra, la MTU recomendada es de
8896
bytes. Para revisar la configuración de MTU recomendada para otros tipos de máquinas con GPU, consulta Configuración de MTU para tipos de máquinas con GPU.Secuencia de comandos
Para crear las redes, sigue estos pasos.
Para estas redes de VPC, te recomendamos que establezcas la unidad de transmisión máxima (MTU) en un valor mayor. Para el tipo de máquina A4 o A3 Ultra, la MTU recomendada es de
8896
bytes. Para revisar la configuración de MTU recomendada para otros tipos de máquinas con GPU, consulta Configuración de MTU para tipos de máquinas con GPU.Usa la siguiente secuencia de comandos para crear redes de VPC para las NIC de gVNIC y CX-7.
#!/bin/bash # Create regular VPC networks and subnets for the gVNICs for N in $(seq 0 1); do gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \ --subnet-mode=custom \ --mtu=8896 gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --region=REGION \ --range=10.$N.0.0/16 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --action=ALLOW \ --rules=tcp:0-65535,udp:0-65535,icmp \ --source-ranges=10.0.0.0/8 done # Create SSH firewall rules gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=tcp:22 \ --source-ranges=IP_RANGE # Assumes that an external IP is only created for vNIC 0 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=icmp \ --source-ranges=IP_RANGE # List and make sure network profiles exist in the machine type's zone gcloud compute network-profiles list --filter "location.name=ZONE" # Create network for CX-7 gcloud compute networks create RDMA_NAME_PREFIX-mrdma \ --network-profile=ZONE-vpc-roce \ --subnet-mode custom \ --mtu=8896 # Create subnets for N in $(seq 0 7); do gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \ --network=RDMA_NAME_PREFIX-mrdma \ --region=REGION \ --range=10.$((N+2)).0.0/16 # offset to avoid overlap with gVNICs done
Reemplaza lo siguiente:
GVNIC_NAME_PREFIX
: Es el prefijo del nombre personalizado que se usará para las subredes y las redes de VPC normales de las gVNICs.RDMA_NAME_PREFIX
: Es el prefijo del nombre personalizado que se usará para la red de VPC y las subredes de RoCE para las NIC CX-7.ZONE
: Especifica una zona en la que esté disponible el tipo de máquina que deseas usar, comous-central1-a
. Para obtener información sobre las regiones, consulta Disponibilidad de GPU por regiones y zonas.REGION
: Es la región en la que deseas crear las subredes. Esta región debe corresponder a la zona especificada. Por ejemplo, si tu zona esus-central1-a
, tu región esus-central1
.IP_RANGE
: Es el rango de IP que se usará para las reglas de firewall de SSH.
- Opcional: Para verificar que los recursos de la red de VPC se hayan creado correctamente, revisa la configuración de la red en la consola de Google Cloud :
- En la consola de Google Cloud , ve a la página Redes de VPC.
- Busca en la lista las redes que creaste en el paso anterior.
- Para ver las subredes, las reglas de firewall y otros parámetros de configuración de la red, haz clic en el nombre de la red.
Crea la instancia
Para crear una instancia, usa una de las siguientes opciones.
Console
En la consola de Google Cloud , ve a la página Crear una instancia.
Aparecerá la pantalla Crear una instancia y mostrará el panel Configuración de la máquina.
En el panel Configuración de la máquina, completa los siguientes pasos:
Especifica un nombre para tu instancia. Consulta la convención de asignación de nombres de recursos.
Selecciona la región y la zona en las que reservaste capacidad.
Haz clic en la pestaña GPUs y, luego, completa los siguientes pasos:
En la lista Tipo de GPU, selecciona el tipo de GPU.
En el caso de las instancias A4, selecciona NVIDIA B200.
En el caso de las instancias A3 Ultra, selecciona NVIDIA H200 141 GB.
En la lista Cantidad de GPU, selecciona 8.
En el menú de navegación, haz clic en SO y almacenamiento. En el panel SO y almacenamiento que aparece, completa los siguientes pasos:
Haz clic en Cambiar. Aparecerá el panel Configuración del disco de arranque.
En la pestaña Imágenes públicas, selecciona una imagen recomendada. Para obtener una lista de las imágenes recomendadas, consulta Sistemas operativos.
Para confirmar las opciones del disco de arranque, haz clic en Seleccionar.
Para crear una instancia con varias NIC, completa los siguientes pasos. De lo contrario, para crear una instancia con una sola NIC, omite estos pasos.
En el menú de navegación, haz clic en Herramientas de redes. En el panel Networking que aparece, completa los siguientes pasos:
En la sección Interfaces de red, completa los siguientes pasos:
Borra la interfaz de red predeterminada. Para borrar la interfaz, haz clic en
Borrar.Haz clic en Agregar una interfaz de red. Usa esta opción para agregar interfaces de red que se adjunten a las redes de VPC que creaste en la sección anterior. Cuando agregues las interfaces de red, recuerda lo siguiente:
Para una interfaz de red que se usa para la comunicación de host a host, selecciona una red de VPC y una subred normales en las listas Red y Subred, y configura la lista Tarjeta de interfaz de red en gVNIC.
Para una interfaz de red que se usa para la comunicación de GPU a GPU, selecciona la red de VPC y la subred de RoCE en las listas Red y Subred, y configura la lista Tarjeta de interfaz de red en MRDMA para estas interfaces de red.
En el menú de navegación, haz clic en Opciones avanzadas. Luego, completa los siguientes pasos para el modelo de aprovisionamiento que deseas usar.
Inicio flexible
- En la sección Modelo de aprovisionamiento, en la lista Modelo de aprovisionamiento de VM, selecciona Flex-start.
En Ingresa la cantidad de horas, ingresa la cantidad máxima de tiempo que deseas que se ejecute la VM. El valor debe estar entre 46 segundos (
0.01
) y siete días (168
o 168 horas).Selecciona Establece un tiempo de espera para la creación de la VM.
Según los requisitos zonales de tu carga de trabajo, te recomendamos que especifiques una de las siguientes duraciones para aumentar las probabilidades de que se complete correctamente tu solicitud de creación de VM:
- Cargas de trabajo con requisitos zonales estrictos: Si tu carga de trabajo requiere que crees la VM en una zona específica, especifica una duración entre 90 segundos y 2 horas. Las duraciones más largas te brindan más oportunidades de obtener recursos.
- Cargas de trabajo sin requisitos zonales estrictos: Si la VM puede ejecutarse en cualquier zona de la región, especifica una duración de 0 segundos o desmarca la casilla de verificación Establecer un tiempo de espera para la creación de la VM. Esta acción especifica que Compute Engine solo asigna recursos si están disponibles de inmediato. Si la solicitud de creación de la VM falla porque los recursos no están disponibles, vuelve a intentarlo en otra zona.
Con reserva
Haz clic en Elegir una reserva. Esta acción abre un panel con una lista de las reservas disponibles en la zona seleccionada. En la lista de reservas, completa los siguientes pasos:
- Selecciona la reserva que deseas usar para la VM. También puedes seleccionar un bloque específico dentro de la reserva.
- Haz clic en Elegir.
Spot
- En la sección Modelo de aprovisionamiento, selecciona Spot en la lista Modelo de aprovisionamiento de VM.
Opcional: Para seleccionar la acción de finalización que se produce cuando Compute Engine interrumpe la VM, completa los siguientes pasos:
- Expande la sección Configuración avanzada del modelo de aprovisionamiento de VMs.
- En la lista Finalización de VM, selecciona una de las siguientes opciones:
- Para detener la VM durante la interrupción, selecciona Detener (predeterminado).
- Para borrar la VM durante la interrupción, selecciona Borrar.
Para crear y, luego, iniciar la instancia, haz clic en Crear.
gcloud
Para crear la VM, usa el comando
gcloud compute instances create
.Los parámetros que debes especificar dependen de la opción de consumo que uses para esta implementación. Selecciona la pestaña que corresponda al modelo de aprovisionamiento de tu opción de consumo.
Inicio flexible
gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --reservation-affinity=none \ --provisioning-model=FLEX_START \ --request-valid-for-duration=REQUEST_VALID_FOR_DURATION \ --max-run-duration=MAX_RUN_DURATION \ --instance-termination-action=DELETE \ --maintenance-policy=TERMINATE
Reemplaza lo siguiente:
VM_NAME
: el nombre de la VM.MACHINE_TYPE
: Es el tipo de máquina que se usará para la VM. Para obtener más información, consulta Tipos de máquinas con GPU.IMAGE_FAMILY
: Es la familia de imágenes de la imagen de SO que deseas usar. Para obtener una lista de los sistemas operativos compatibles, consulta Detalles de los sistemas operativos.IMAGE_PROJECT
: Es el ID del proyecto de la imagen de SO.ZONE
: Es la zona en la que está disponible el tipo de máquina que deseas usar. Para obtener información sobre las regiones, consulta Disponibilidad de GPU por regiones y zonas.DISK_SIZE
: Es el tamaño del disco de arranque en GB.GVNIC_NAME_PREFIX
: Es el prefijo de nombre que especificaste cuando creaste las subredes y las redes de VPC estándar que usan gVNICs.RDMA_NAME_PREFIX
: Es el prefijo del nombre que especificaste cuando creaste las redes de VPC y las subredes que usan NIC de RDMA.REQUEST_VALID_FOR_DURATION
: Es la duración durante la que es válida la solicitud para crear la VM. Debes darle formato al valor como la cantidad de días, horas, minutos o segundos, seguidos ded
,h
,m
ys
, respectivamente. Por ejemplo, especifica30m
para 30 minutos o1d2h3m4s
para un día, dos horas, tres minutos y cuatro segundos. Si no especificas una duración, la duración predeterminada es de 90 segundos.Según los requisitos zonales de tu carga de trabajo, te recomendamos que especifiques una de las siguientes duraciones para aumentar las probabilidades de que se complete correctamente tu solicitud de creación de VM:
- Cargas de trabajo con requisitos zonales estrictos: Si tu carga de trabajo requiere que crees la VM en una zona específica, especifica una duración de entre 90 segundos y dos horas. Las duraciones más largas te brindan más oportunidades de obtener recursos.
- Cargas de trabajo sin requisitos zonales estrictos: Si la VM puede ejecutarse en cualquier zona de la región, especifica una duración de cero segundos (
0
). Esta acción especifica que Compute Engine solo asigna recursos si están disponibles de inmediato. Si la solicitud de creación de la VM falla porque no hay recursos disponibles, vuelve a intentarla en otra zona.
MAX_RUN_DURATION
: Es la duración de la que deseas que se ejecuten las VMs solicitadas. Debes darle formato al valor como la cantidad de días, horas, minutos o segundos, seguidos ded
,h
,m
ys
, respectivamente. Por ejemplo, especifica30m
para 30 minutos o1d2h3m4s
para un día, dos horas, tres minutos y cuatro segundos. El valor debe ser de entre 10 minutos y siete días.
Con reserva
gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --reservation-affinity=specific \ --reservation=RESERVATION \ --provisioning-model=RESERVATION_BOUND \ --instance-termination-action=TERMINATION_ACTION \ --maintenance-policy=TERMINATE
Reemplaza lo siguiente:
VM_NAME
: el nombre de la VM.MACHINE_TYPE
: Es el tipo de máquina que se usará para la VM. Para obtener más información, consulta Tipos de máquinas con GPU.IMAGE_FAMILY
: Es la familia de imágenes de la imagen de SO que deseas usar. Para obtener una lista de los sistemas operativos compatibles, consulta Detalles de los sistemas operativos.IMAGE_PROJECT
: Es el ID del proyecto de la imagen de SO.ZONE
: Es la zona en la que está disponible el tipo de máquina que deseas usar. Para obtener información sobre las regiones, consulta Disponibilidad de GPU por regiones y zonas.DISK_SIZE
: Es el tamaño del disco de arranque en GB.GVNIC_NAME_PREFIX
: Es el prefijo de nombre que especificaste cuando creaste las subredes y las redes de VPC estándar que usan gVNICs.RDMA_NAME_PREFIX
: Es el prefijo del nombre que especificaste cuando creaste las redes de VPC y las subredes que usan NIC de RDMA.-
RESERVATION
: Es el nombre de la reserva o un bloque específico dentro de una reserva. Para obtener el nombre de la reserva o los bloques disponibles, consulta Cómo ver la capacidad reservada. Según tus requisitos de ubicación de la instancia, elige una de las siguientes opciones:Para crear la instancia en cualquier bloque, haz lo siguiente:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Además, para crear varias instancias en el mismo bloque, aplica la misma política de posición de compactación que especifica una colocación de bloque (
maxDistance=2
) cuando crees cada instancia. Luego, Compute Engine aplica la política a la reserva y crea instancias en el mismo bloque.Para crear la instancia en un bloque específico, haz lo siguiente:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
TERMINATION_ACTION
: Indica si Compute Engine detiene (STOP
) o borra (DELETE
) la VM al final del período de reserva.
Spot
gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --provisioning-model=SPOT \ --instance-termination-action=TERMINATION_ACTION
Reemplaza lo siguiente:
VM_NAME
: el nombre de la VM.MACHINE_TYPE
: Es el tipo de máquina que se usará para la VM. Para obtener más información, consulta Tipos de máquinas con GPU.IMAGE_FAMILY
: Es la familia de imágenes de la imagen de SO que deseas usar. Para obtener una lista de los sistemas operativos compatibles, consulta Detalles de los sistemas operativos.IMAGE_PROJECT
: Es el ID del proyecto de la imagen de SO.ZONE
: Es la zona en la que está disponible el tipo de máquina que deseas usar. Para obtener información sobre las regiones, consulta Disponibilidad de GPU por regiones y zonas.DISK_SIZE
: Es el tamaño del disco de arranque en GB.GVNIC_NAME_PREFIX
: Es el prefijo de nombre que especificaste cuando creaste las subredes y las redes de VPC estándar que usan gVNICs.RDMA_NAME_PREFIX
: Es el prefijo del nombre que especificaste cuando creaste las redes de VPC y las subredes que usan NIC de RDMA.TERMINATION_ACTION
: Es la acción que se debe realizar cuando Compute Engine interrumpe la instancia, ya seaSTOP
(predeterminada) oDELETE
.
REST
Para crear la VM, realiza una solicitud
POST
al métodoinstances.insert
.Los parámetros que debes especificar dependen de la opción de consumo que uses para esta implementación. Selecciona la pestaña que corresponda al modelo de aprovisionamiento de tu opción de consumo.
Inicio flexible
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name": "VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb": "DISK_SIZE", "diskType": "hyperdisk-balanced", "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode": "READ_WRITE", "type": "PERSISTENT" } ], "serviceAccounts": [ { "email": "default", "scopes": [ "https://www.googleapis.com/auth/cloud-platform" ] } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "reservationAffinity":{ "consumeReservationType": "NO_RESERVATION", }, "scheduling":{ "provisioningModel": "FLEX_START", "requestValidForDuration": { "seconds": REQUEST_VALID_FOR_DURATION }, "maxRunDuration": { "seconds": MAX_RUN_DURATION }, "instanceTerminationAction": "DELETE", "onHostMaintenance": "TERMINATE", } }
Reemplaza lo siguiente:
PROJECT_ID
: Es el ID del proyecto en el que deseas crear la VM.ZONE
: Es la zona en la que está disponible el tipo de máquina que deseas usar. Para obtener información sobre las regiones, consulta Disponibilidad de GPU por regiones y zonas.MACHINE_TYPE
: Es el tipo de máquina que se usará para la VM. Para obtener más información, consulta Tipos de máquinas con GPU.VM_NAME
: el nombre de la VM.DISK_SIZE
: Es el tamaño del disco de arranque en GB.IMAGE_PROJECT
: Es el ID del proyecto de la imagen de SO.IMAGE_FAMILY
: Es la familia de imágenes de la imagen de SO que deseas usar. Para obtener una lista de los sistemas operativos compatibles, consulta Detalles de los sistemas operativos.NETWORK_PROJECT_ID
: Es el ID del proyecto de la red.GVNIC_NAME_PREFIX
: Es el prefijo de nombre que especificaste cuando creaste las subredes y las redes de VPC estándar que usan gVNICs.REGION
: Es la región de la subred.RDMA_NAME_PREFIX
: Es el prefijo del nombre que especificaste cuando creaste las redes de VPC y las subredes que usan NIC de RDMA.REQUEST_VALID_FOR_DURATION
: Es la duración durante la que es válida la solicitud para crear la VM. Debes darle formato al valor como la cantidad de días, horas, minutos o segundos, seguidos ded
,h
,m
ys
, respectivamente. Por ejemplo, especifica30m
para 30 minutos o1d2h3m4s
para un día, dos horas, tres minutos y cuatro segundos. Si no especificas una duración, la duración predeterminada es de 90 segundos.Según los requisitos zonales de tu carga de trabajo, te recomendamos que especifiques una de las siguientes duraciones para aumentar las probabilidades de que se complete correctamente tu solicitud de creación de VM:
- Cargas de trabajo con requisitos zonales estrictos: Si tu carga de trabajo requiere que crees la VM en una zona específica, especifica una duración de entre 90 segundos y dos horas. Las duraciones más largas te brindan más oportunidades de obtener recursos.
- Cargas de trabajo sin requisitos zonales estrictos: Si la VM puede ejecutarse en cualquier zona de la región, especifica una duración de cero segundos (
0
). Esta acción especifica que Compute Engine solo asigna recursos si están disponibles de inmediato. Si la solicitud de creación de la VM falla porque no hay recursos disponibles, vuelve a intentarla en otra zona.
MAX_RUN_DURATION
: Es la duración de la que deseas que se ejecuten las VMs solicitadas. Debes darle formato al valor como la cantidad de segundos. Por ejemplo, especifica86400
para un día. El valor debe ser de entre 10 minutos y siete días.
Con reserva
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name": "VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb": "DISK_SIZE", "diskType": "hyperdisk-balanced", "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode": "READ_WRITE", "type": "PERSISTENT" } ], "serviceAccounts": [ { "email": "default", "scopes": [ "https://www.googleapis.com/auth/cloud-platform" ] } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "reservationAffinity":{ "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION" ] }, "scheduling":{ "provisioningModel": "RESERVATION_BOUND", "instanceTerminationAction": "TERMINATION_ACTION", "onHostMaintenance": "TERMINATE", "automaticRestart": true } }
Reemplaza lo siguiente:
PROJECT_ID
: Es el ID del proyecto en el que deseas crear la VM.ZONE
: Es la zona en la que está disponible el tipo de máquina que deseas usar. Para obtener información sobre las regiones, consulta Disponibilidad de GPU por regiones y zonas.MACHINE_TYPE
: Es el tipo de máquina que se usará para la VM. Para obtener más información, consulta Tipos de máquinas con GPU.VM_NAME
: el nombre de la VM.DISK_SIZE
: Es el tamaño del disco de arranque en GB.IMAGE_PROJECT
: Es el ID del proyecto de la imagen de SO.IMAGE_FAMILY
: Es la familia de imágenes de la imagen de SO que deseas usar. Para obtener una lista de los sistemas operativos compatibles, consulta Detalles de los sistemas operativos.NETWORK_PROJECT_ID
: Es el ID del proyecto de la red.GVNIC_NAME_PREFIX
: Es el prefijo de nombre que especificaste cuando creaste las subredes y las redes de VPC estándar que usan gVNICs.REGION
: Es la región de la subred.RDMA_NAME_PREFIX
: Es el prefijo del nombre que especificaste cuando creaste las redes de VPC y las subredes que usan NIC de RDMA.-
RESERVATION
: Es el nombre de la reserva o un bloque específico dentro de una reserva. Para obtener el nombre de la reserva o los bloques disponibles, consulta Cómo ver la capacidad reservada. Según tus requisitos de ubicación de la instancia, elige una de las siguientes opciones:Para crear la instancia en cualquier bloque, haz lo siguiente:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Además, para crear varias instancias en el mismo bloque, aplica la misma política de posición de compactación que especifica una colocación de bloque (
maxDistance=2
) cuando crees cada instancia. Luego, Compute Engine aplica la política a la reserva y crea instancias en el mismo bloque.Para crear la instancia en un bloque específico, haz lo siguiente:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
TERMINATION_ACTION
: Indica si Compute Engine detiene (STOP
) o borra (DELETE
) la VM al final del período de reserva.
Spot
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name": "VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb": "DISK_SIZE", "diskType": "hyperdisk-balanced", "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode": "READ_WRITE", "type": "PERSISTENT" } ], "serviceAccounts": [ { "email": "default", "scopes": [ "https://www.googleapis.com/auth/cloud-platform" ] } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "scheduling": { "provisioningModel": "SPOT", "instanceTerminationAction": "TERMINATION_ACTION" } }
Reemplaza lo siguiente:
PROJECT_ID
: Es el ID del proyecto en el que deseas crear la VM.ZONE
: Es la zona en la que está disponible el tipo de máquina que deseas usar. Para obtener información sobre las regiones, consulta Disponibilidad de GPU por regiones y zonas.MACHINE_TYPE
: Es el tipo de máquina que se usará para la VM. Para obtener más información, consulta Tipos de máquinas con GPU.VM_NAME
: el nombre de la VM.DISK_SIZE
: Es el tamaño del disco de arranque en GB.IMAGE_PROJECT
: Es el ID del proyecto de la imagen de SO.IMAGE_FAMILY
: Es la familia de imágenes de la imagen de SO que deseas usar. Para obtener una lista de los sistemas operativos compatibles, consulta Detalles de los sistemas operativos.NETWORK_PROJECT_ID
: Es el ID del proyecto de la red.GVNIC_NAME_PREFIX
: Es el prefijo de nombre que especificaste cuando creaste las subredes y las redes de VPC estándar que usan gVNICs.REGION
: Es la región de la subred.RDMA_NAME_PREFIX
: Es el prefijo del nombre que especificaste cuando creaste las redes de VPC y las subredes que usan NIC de RDMA.TERMINATION_ACTION
: Es la acción que se debe realizar cuando Compute Engine interrumpe la instancia, ya seaSTOP
(predeterminada) oDELETE
.
Prepara la instancia para usarla
Para preparar una instancia que tenga GPU conectadas para su uso, completa los siguientes pasos:
Para habilitar una instancia de A4 o A3 Ultra para que use sus GPU conectadas, la instancia debe tener instalados los controladores de GPU. A menos que la imagen de la instancia ya incluya los controladores de GPU necesarios, instala los controladores de GPU.
Si creaste una VM Spot en la sección anterior, completa los siguientes pasos:
Para preparar tu VM Spot para una posible interrupción, consulta Administra la interrupción de VMs Spot.
Opcional: Obtén información sobre las prácticas recomendadas para las VMs Spot.
¿Qué sigue?
Para supervisar el rendimiento de la GPU, consulta Supervisa el rendimiento de las GPU.
Para solucionar problemas de instancias con GPU, consulta Soluciona problemas de VMs con GPU.
Más información sobre las plataformas de GPU.
Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-09-30 (UTC)
-