Crea una instancia A3 Ultra o A4


En este documento, se describe cómo crear instancias con GPUs conectadas desde las series de máquinas A3 Ultra o A4. Para obtener más información sobre cómo crear instancias con GPU conectadas, consulta Descripción general de la creación de una instancia con GPU conectadas.

Antes de comenzar

  • Para revisar las limitaciones y los pasos de requisitos previos adicionales para crear una instancia con GPU conectadas, como seleccionar una imagen de SO o verificar la cuota de GPU, consulta la Descripción general de la creación de una instancia con GPU conectadas.
  • Si aún no lo hiciste, configura la autenticación. La autenticación es el proceso mediante el cual se verifica tu identidad para acceder a los servicios y las APIs de Google Cloud . Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI ejecutando el siguiente comando:

      gcloud init

      Si usas un proveedor de identidad externo (IdP), primero debes acceder a gcloud CLI con tu identidad federada.

    2. Set a default region and zone.

    REST

    Para usar las muestras de la API de REST en esta página en un entorno de desarrollo local, debes usar las credenciales que proporcionas a gcloud CLI.

      Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI ejecutando el siguiente comando:

      gcloud init

      Si usas un proveedor de identidad externo (IdP), primero debes acceder a gcloud CLI con tu identidad federada.

    Si deseas obtener más información, consulta Autentica para usar REST en la Google Cloud documentación de autenticación.

Roles obligatorios

Para obtener los permisos que necesitas para crear instancias, pídele a tu administrador que te otorgue el rol de IAM Administrador de instancias de Compute (v1) (roles/compute.instanceAdmin.v1) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene los permisos necesarios para crear instancias. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:

Permisos necesarios

Se requieren los siguientes permisos para crear instancias:

  • compute.instances.create en el proyecto
  • Si deseas usar una imagen personalizada para crear la VM, sigue estos pasos: compute.images.useReadOnly en la imagen
  • Para usar una instantánea a fin de crear la VM, haz lo siguiente: compute.snapshots.useReadOnly en la instantánea
  • Si quieres usar una plantilla de instancias para crear la VM, sigue estos pasos: compute.instanceTemplates.useReadOnly en la plantilla de instancias
  • Para asignar una red heredada a la VM, ejecuta compute.networks.use en el proyecto.
  • Si deseas especificar una dirección IP estática para la VM: compute.addresses.use en el proyecto
  • Para asignar una dirección IP externa a la VM cuando se usa una red heredada, ejecuta compute.networks.useExternalIp en el proyecto
  • A fin de especificar una subred para tu VM: compute.subnetworks.use en el proyecto o en la subred elegida
  • Para asignar una dirección IP externa a la VM cuando se usa una red de VPC, compute.subnetworks.useExternalIp en el proyecto o en la subred elegida.
  • Para configurar los metadatos de la instancia de VM para la VM, compute.instances.setMetadata en el proyecto.
  • Para configurar etiquetas en la VM, haz lo siguiente: compute.instances.setTags en la VM
  • Para configurar etiquetas en la VM, haz lo siguiente: compute.instances.setLabels en la VM
  • A fin de configurar una cuenta de servicio para que la VM use: compute.instances.setServiceAccount en la VM
  • Crear un disco nuevo para la VM: compute.disks.create en el proyecto
  • Para conectar un disco existente en modo de solo lectura o de lectura y escritura, usa compute.disks.use en el disco.
  • Para conectar un disco existente en modo de solo lectura, haz lo siguiente: compute.disks.useReadOnly en el disco

También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.

Determina cómo crear instancias A3 Ultra o A4

Las instancias A3 Ultra o A4 están disponibles a través de las siguientes opciones de creación, cada una con diferentes procedimientos de creación, disponibilidad de recursos y precios. Identifica la opción que quieres usar según tu carga de trabajo.

  • Si necesitas ejecutar cargas de trabajo de IA y AA de larga duración, como la inferencia y el entrenamiento de modelos grandes, que requieren la latencia más baja, crea VMs o clústeres que usen las funciones y los servicios disponibles en Cluster Director. Con Cluster Director, puedes reservar máquinas asignadas de forma densa que proporcionan programación compatible con la topología, así como supervisión y mantenimiento mejorados. Para obtener más información sobre Cluster Director, consulta Cluster Director en la documentación de AI Hypercomputer.

    Para obtener instrucciones para crear instancias A3 Ultra o A4, consulta Descripción general de la creación de VMs y clústeres en la documentación de AI Hypercomputer.

  • Si necesitas cargas de trabajo de IA y AA de menor duración, elige una de las siguientes opciones:

    • Si tus cargas de trabajo deben ejecutarse durante un máximo de 90 días con una latencia de red mínima, reserva máquinas asignadas de forma densa para una fecha futura con las solicitudes de reserva futuras en modo de calendario. Al comienzo del período de reserva, puedes crear instancias A3 Ultra o A4 con la capacidad reservada. Al final del período de reserva, Compute Engine borra la reserva y las VMs que la consumen.

      Si deseas obtener instrucciones para crear instancias A3 Ultra o A4 que usen una reserva, consulta Crea una instancia A3 Ultra o A4 en este documento.

    • Si tus cargas de trabajo pueden comenzar en cualquier momento y necesitan una cantidad exacta de VMs para comenzar, usa solicitudes de cambio de tamaño en un grupo de instancias administrado (MIG). Con las solicitudes de cambio de tamaño del MIG, le pides a Compute Engine que agregue VMs de una sola vez a tu MIG siempre que haya recursos disponibles. Estas VMs pueden ejecutarse hasta por siete días. Debido a que los recursos se entregan desde un grupo seguro, tienes más probabilidades de obtener GPUs que si hicieras una solicitud a pedido.

      Para obtener más información sobre las solicitudes de cambio de tamaño en un MIG, consulta Acerca de las solicitudes de cambio de tamaño en un MIG.

    • Si tus cargas de trabajo toleran las interrupciones de disponibilidad, puedes obtener descuentos significativos con las VMs Spot. Puedes crear y borrar VMs Spot según sea necesario. Sin embargo, las VMs Spot son recursos finitos y Compute Engine podría interrumpir (detener o borrar automáticamente) las VMs Spot en cualquier momento para recuperar capacidad. Para obtener más información sobre las VMs Spot, consulta VMs Spot.

      Si quieres obtener instrucciones para crear instancias A3 Ultra o A4 con VMs Spot, consulta Crea una instancia A3 Ultra o A4 en este documento.

Crea una instancia de A3 Ultra o A4

Para crear una instancia A3 Ultra o A4 con una reserva o VMs Spot, completa los siguientes pasos:

  1. Crea redes de VPC

  2. Crea la instancia

  3. Prepara la instancia para su uso

Crea redes de VPC

Para el tipo de máquina Ultra A4 o A3, debes crear tres redes de VPC para las siguientes interfaces de red:

  • 2 redes de VPC para las interfaces de red (NIC) gVNIC Se usan para la comunicación de host a host.
  • Se requiere 1 red de VPC con el perfil de red RDMA para las NIC CX7. Esta red debe tener 8 subredes, una para cada NIC CX7, y se usa para la comunicación entre GPUs.

Para obtener más información sobre la disposición de las NIC, consulta Revisa el ancho de banda de la red y la disposición de las NIC.

Configura las redes de forma manual siguiendo las guías de instrucciones o automáticamente con la secuencia de comandos proporcionada.

Guías de instrucciones

Para crear las redes, puedes usar las siguientes instrucciones:

Para estas redes de VPC, te recomendamos que establezcas la unidad de transmisión máxima (MTU) en un valor mayor. Para el tipo de máquina A4 o A3 Ultra, la MTU recomendada es de 8896 bytes. Para revisar la configuración de MTU recomendada para otros tipos de máquinas con GPU, consulta Configuración de MTU para tipos de máquinas con GPU.

Secuencia de comandos

Para crear las redes, puedes usar la siguiente secuencia de comandos.

Para estas redes de VPC, te recomendamos que establezcas la unidad de transmisión máxima (MTU) en un valor mayor. Para el tipo de máquina A4 o A3 Ultra, la MTU recomendada es de 8896 bytes. Para revisar la configuración de MTU recomendada para otros tipos de máquinas con GPU, consulta Configuración de MTU para tipos de máquinas con GPU.

  #!/bin/bash

  # Create standard VPCs (network and subnets) for the gVNICs
  for N in $(seq 0 1); do
    gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \
      --subnet-mode=custom \
      --mtu=8896

    gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \
      --network=GVNIC_NAME_PREFIX-net-$N \
      --region=REGION \
      --range=10.$N.0.0/16

    gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \
      --network=GVNIC_NAME_PREFIX-net-$N \
      --action=ALLOW \
      --rules=tcp:0-65535,udp:0-65535,icmp \
      --source-ranges=10.0.0.0/8
  done

  # Create SSH firewall rules
  gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \
    --network=GVNIC_NAME_PREFIX-net-0 \
    --action=ALLOW \
    --rules=tcp:22 \
    --source-ranges=IP_RANGE

  # Assumes that an external IP is only created for vNIC 0
  gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \
    --network=GVNIC_NAME_PREFIX-net-0 \
    --action=ALLOW \
    --rules=icmp \
    --source-ranges=IP_RANGE

  # List and make sure network profiles exist
  gcloud compute network-profiles list

  # Create network for CX-7
  gcloud compute networks create RDMA_NAME_PREFIX-mrdma \
    --network-profile=ZONE-vpc-roce \
    --subnet-mode custom \
    --mtu=8896

  # Create subnets.
  for N in $(seq 0 7); do
    gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \
      --network=RDMA_NAME_PREFIX-mrdma \
      --region=REGION \
      --range=10.$((N+2)).0.0/16 # offset to avoid overlap with gVNICs
  done
  

Reemplaza lo siguiente:

  • GVNIC_NAME_PREFIX: Es el prefijo del nombre personalizado que se usará para las subredes y las redes de VPC estándar de las gVNICs.
  • RDMA_NAME_PREFIX: Es el prefijo del nombre personalizado que se usará para la red de VPC y las subredes con el perfil de red RDMA para las NIC CX7.
  • ZONE: Especifica una zona en la que esté disponible el tipo de máquina que deseas usar. Para obtener información sobre las regiones, consulta Disponibilidad de GPU por regiones y zonas.
  • REGION: Es la región en la que deseas crear las subredes. Esta región debe corresponder a la zona especificada. Por ejemplo, si tu zona es europe-west1-b, tu región es europe-west1.
  • IP_RANGE: Es el rango de IP que se usará para las reglas de firewall de SSH.

Crea la instancia

Para crear una instancia A3 Ultra o A4, selecciona uno de los siguientes métodos:

Crea una instancia que use una reserva

Para crear una instancia que use una reserva, usa una de las siguientes opciones:

Console

  1. En la consola de Google Cloud , ve a la página Crear una instancia.

    Ir a Crear una instancia

    Aparecerá la pantalla Crear una instancia y mostrará el panel Configuración de la máquina.

  2. En el panel Configuración de la máquina, completa los siguientes pasos:

    1. Especifica un nombre para tu instancia. Consulta la convención de asignación de nombres de recursos.

    2. Selecciona la región y la zona en las que reservaste capacidad.

    3. Haz clic en la pestaña GPUs y, luego, completa los siguientes pasos:

      1. En la lista Tipo de GPU, selecciona el tipo de GPU.

        • En el caso de las instancias A4, selecciona NVIDIA B200.

        • En el caso de las instancias A3 Ultra, selecciona NVIDIA H200 141 GB.

      2. En la lista Cantidad de GPU, selecciona 8.

  3. En el menú de navegación, haz clic en SO y almacenamiento. En el panel SO y almacenamiento que aparece, completa los siguientes pasos:

    1. Haz clic en Cambiar. Aparecerá el panel Configuración del disco de arranque.

    2. En la pestaña Imágenes públicas, selecciona una imagen recomendada. Para obtener una lista de las imágenes recomendadas, consulta Sistemas operativos.

    3. Para confirmar las opciones del disco de arranque, haz clic en Seleccionar.

  4. Para crear una instancia con varias NIC, completa los siguientes pasos. De lo contrario, para crear una instancia con una sola NIC, omite estos pasos.

    • En el menú de navegación, haz clic en Herramientas de redes. En el panel Networking que aparece, completa los siguientes pasos:

      1. En la sección Interfaces de red, completa los siguientes pasos:

      2. Borra la interfaz de red predeterminada. Para borrar la interfaz, haz clic en Borrar.

      3. Haz clic en Agregar una interfaz de red. Usa esta opción para agregar las redes de gVNIC y RDMA que creaste en la sección anterior. Cuando agregues las redes, recuerda lo siguiente:

        • Especifica tus redes host en las listas Red y Subred, y configura la lista Tarjeta de interfaz de red en gVNIC.

        • Especifica tus redes de GPU en las listas Red y Subred, y configura la lista Tarjeta de interfaz de red en MRDMA para estas redes.

  5. En el menú de navegación, haz clic en Opciones avanzadas. En el panel Avanzado que aparece, completa los siguientes pasos:

    1. En la sección Reservas, selecciona Elegir una reserva y, luego, haz clic en Elegir reserva. Esta acción abre un panel con una lista de las reservas disponibles en la zona seleccionada. En la lista de reservas, completa los siguientes pasos:

      1. Selecciona la reserva que deseas usar para la VM. También puedes seleccionar un bloque específico dentro de la reserva.

      2. Haz clic en Elegir.

    2. En la sección Modelo de aprovisionamiento, expande la sección Configuración avanzada del modelo de aprovisionamiento de VMs.

    3. En la lista Finalización de VM, selecciona Detener (predeterminado) o Borrar.

  6. Para crear y, luego, iniciar la instancia, haz clic en Crear.

gcloud

Para crear la VM, usa el comando gcloud compute instances create.

gcloud compute instances create VM_NAME  \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
    --reservation-affinity=specific \
    --reservation=RESERVATION \
    --provisioning-model=RESERVATION_BOUND \
    --instance-termination-action=TERMINATION_ACTION \
    --maintenance-policy=TERMINATE

Reemplaza lo siguiente:

  • VM_NAME: el nombre de la VM.
  • MACHINE_TYPE: Es el tipo de máquina que se usará para la VM. Especifica un tipo de máquina A4 o A3 Ultra. Para obtener más información, consulta Tipos de máquinas con GPU.
  • IMAGE_FAMILY: Es la familia de imágenes de la imagen de SO que deseas usar. Para obtener una lista de los sistemas operativos compatibles, consulta Detalles de los sistemas operativos.
  • IMAGE_PROJECT: Es el ID del proyecto de la imagen de SO.
  • ZONE: Es la zona en la que está disponible el tipo de máquina que deseas usar. Para obtener información sobre las regiones, consulta Regiones y zonas de GPU.
  • DISK_SIZE: Es el tamaño del disco de arranque en GB.
  • GVNIC_NAME_PREFIX: Es el prefijo del nombre que especificaste cuando creaste las subredes y las redes de VPC estándar que usan gVNICs.
  • RDMA_NAME_PREFIX: Es el prefijo de nombre que especificaste cuando creaste las redes de VPC y las subredes que usan NIC de RDMA.
  • RESERVATION: Es el nombre de la reserva o un bloque específico dentro de una reserva. Para obtener el nombre de la reserva o los bloques disponibles, consulta Cómo ver la capacidad reservada. Según tus requisitos de ubicación de la instancia, elige una de las siguientes opciones:
    • Para crear la instancia en cualquier bloque, sigue estos pasos:

      projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME

      Además, para crear varias instancias en el mismo bloque, aplica la misma política de posición de compactación que especifica una colocación de bloque (maxDistance=2) cuando crees cada instancia. Luego, Compute Engine aplica la política a la reserva y crea instancias en el mismo bloque.

    • Para crear la instancia en un bloque específico, sigue estos pasos:

      projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
  • TERMINATION_ACTION: Indica si Compute Engine detiene (STOP) o borra (DELETE) la VM al final del período de reserva.

REST

Para crear la VM, realiza una solicitud POST al método instances.insert.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType":"projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "name":"VM_NAME",
  "disks":[
    {
      "boot":true,
      "initializeParams":{
        "diskSizeGb":"DISK_SIZE",
        "diskType":"hyperdisk-balanced",
        "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "mode":"READ_WRITE",
      "type":"PERSISTENT"
    }
  ],
  "networkInterfaces": [
    {
      "accessConfigs": [
        {
          "name": "external-nat",
          "type": "ONE_TO_ONE_NAT"
        }
      ],
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
    }
  ],
  "reservationAffinity":{
    "consumeReservationType":"SPECIFIC_RESERVATION",
    "key":"compute.googleapis.com/reservation-name",
    "values":[
      "RESERVATION"
    ]
  },
"scheduling":{
    "provisioningModel":"RESERVATION_BOUND",
    "instanceTerminationAction":"TERMINATION_ACTION",
    "onHostMaintenance": "TERMINATE",
    "automaticRestart":true
  }
}

Reemplaza lo siguiente:

  • PROJECT_ID: Es el ID del proyecto en el que deseas crear la VM.
  • ZONE: Es la zona en la que está disponible el tipo de máquina que deseas usar. Para obtener información sobre las regiones, consulta Regiones y zonas de GPU.
  • MACHINE_TYPE: Es el tipo de máquina que se usará para la VM. Especifica un tipo de máquina A4 o A3 Ultra. Para obtener más información, consulta Tipos de máquinas con GPU.
  • VM_NAME: el nombre de la VM.
  • DISK_SIZE: Es el tamaño del disco de arranque en GB.
  • IMAGE_PROJECT: Es el ID del proyecto de la imagen de SO.
  • IMAGE_FAMILY: Es la familia de imágenes de la imagen de SO que deseas usar. Para obtener una lista de los sistemas operativos compatibles, consulta Detalles de los sistemas operativos.
  • NETWORK_PROJECT_ID: Es el ID del proyecto de la red.
  • GVNIC_NAME_PREFIX: Es el prefijo del nombre que especificaste cuando creaste las subredes y las redes de VPC estándar que usan gVNICs.
  • REGION: Es la región de la subred.
  • RDMA_NAME_PREFIX: Es el prefijo de nombre que especificaste cuando creaste las redes de VPC y las subredes que usan NIC de RDMA.
  • RESERVATION: Es el nombre de la reserva o un bloque específico dentro de una reserva. Para obtener el nombre de la reserva o los bloques disponibles, consulta Cómo ver la capacidad reservada. Según tus requisitos de ubicación de la instancia, elige una de las siguientes opciones:
    • Para crear la instancia en cualquier bloque, sigue estos pasos:

      projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME

      Además, para crear varias instancias en el mismo bloque, aplica la misma política de posición de compactación que especifica una colocación de bloque (maxDistance=2) cuando crees cada instancia. Luego, Compute Engine aplica la política a la reserva y crea instancias en el mismo bloque.

    • Para crear la instancia en un bloque específico, sigue estos pasos:

      projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
  • TERMINATION_ACTION: Indica si Compute Engine detiene (STOP) o borra (DELETE) la VM al final del período de reserva.

Crea una VM Spot

Para crear la VM Spot, usa una de las siguientes opciones:

Console

  1. En la consola de Google Cloud , ve a la página Crear una instancia.

    Ir a Crear una instancia

    Aparecerá la pantalla Crear una instancia y mostrará el panel Configuración de la máquina.

  2. En el panel Configuración de la máquina, completa los siguientes pasos:

    1. Especifica un nombre para tu instancia. Consulta la convención de asignación de nombres de recursos.

    2. Selecciona la región y la zona en las que deseas crear una VM. Para verificar en qué regiones y zonas están disponibles las GPUs, consulta Regiones y zonas de GPU.

    3. Haz clic en la pestaña GPUs y, luego, completa los siguientes pasos:

      1. En la lista Tipo de GPU, selecciona el tipo de GPU.

        • En el caso de las instancias A4, selecciona NVIDIA B200.

        • En el caso de las instancias A3 Ultra, selecciona NVIDIA H200 141 GB.

      2. En la lista Cantidad de GPU, selecciona 8.

  3. En el menú de navegación, haz clic en SO y almacenamiento. En el panel SO y almacenamiento que aparece, completa los siguientes pasos:

    1. Haz clic en Cambiar. Aparecerá el panel Configuración del disco de arranque.

    2. En la pestaña Imágenes públicas, selecciona una imagen recomendada. Para obtener una lista de las imágenes recomendadas, consulta Sistemas operativos.

    3. Para confirmar las opciones del disco de arranque, haz clic en Seleccionar.

  4. Para crear una instancia con varias NIC, completa los siguientes pasos. De lo contrario, para crear una instancia con una sola NIC, omite estos pasos.

    • En el menú de navegación, haz clic en Herramientas de redes. En el panel Networking que aparece, completa los siguientes pasos:

      1. En la sección Interfaces de red, completa los siguientes pasos:

      2. Borra la interfaz de red predeterminada. Para borrar la interfaz, haz clic en Borrar.

      3. Haz clic en Agregar una interfaz de red. Usa esta opción para agregar las redes de gVNIC y RDMA que creaste en la sección anterior. Cuando agregues las redes, debes hacer lo siguiente:

        • Especifica tus redes host en las listas Red y Subred, y configura la lista Tarjeta de interfaz de red en gVNIC.

        • Especifica tus redes de GPU en las listas Red y Subred, y configura la lista Tarjeta de interfaz de red en MRDMA para estas redes.

  5. En el menú de navegación, haz clic en Opciones avanzadas. En el panel Avanzado que aparece, completa los siguientes pasos:

    1. En la sección Modelo de aprovisionamiento, selecciona Spot en la lista Modelo de aprovisionamiento de VM.

    2. Opcional: Para especificar la acción que se debe realizar cuando Compute Engine interrumpe la instancia, completa los siguientes pasos:

      1. Expande la sección Configuración avanzada del modelo de aprovisionamiento de VMs.

      2. En la lista Finalización de VM, selecciona Detener o Borrar.

  6. Para crear y, luego, iniciar la instancia, haz clic en Crear.

gcloud

Para crear la VM, usa el comando gcloud compute instances create.

gcloud compute instances create VM_NAME  \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
    --provisioning-model=SPOT \
    --instance-termination-action=TERMINATION_ACTION

Reemplaza lo siguiente:

  • VM_NAME: el nombre de la VM.
  • MACHINE_TYPE: Es el tipo de máquina que se usará para la VM. Especifica un tipo de máquina A4 o A3 Ultra. Para obtener más información, consulta Tipos de máquinas con GPU.
  • IMAGE_FAMILY: Es la familia de imágenes de la imagen de SO que deseas usar. Para obtener una lista de los sistemas operativos compatibles, consulta Detalles de los sistemas operativos.
  • IMAGE_PROJECT: Es el ID del proyecto de la imagen de SO.
  • ZONE: Es la zona en la que está disponible el tipo de máquina que deseas usar. Para obtener información sobre las regiones, consulta Regiones y zonas de GPU.
  • DISK_SIZE: Es el tamaño del disco de arranque en GB.
  • GVNIC_NAME_PREFIX: Es el prefijo del nombre que especificaste cuando creaste las subredes y las redes de VPC estándar que usan gVNICs.
  • RDMA_NAME_PREFIX: Es el prefijo de nombre que especificaste cuando creaste las redes de VPC y las subredes que usan NIC de RDMA.
  • TERMINATION_ACTION: Es la acción que se debe realizar cuando Compute Engine interrumpe la instancia, ya sea STOP (predeterminada) o DELETE.

REST

Para crear la VM, realiza una solicitud POST al método instances.insert.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType":"projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "name":"VM_NAME",
  "disks":[
    {
      "boot":true,
      "initializeParams":{
        "diskSizeGb":"DISK_SIZE",
        "diskType":"hyperdisk-balanced",
        "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "mode":"READ_WRITE",
      "type":"PERSISTENT"
    }
  ],
  "networkInterfaces": [
    {
      "accessConfigs": [
        {
          "name": "external-nat",
          "type": "ONE_TO_ONE_NAT"
        }
      ],
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
    }
  ],
  "scheduling":
  {
    "provisioningModel": "SPOT",
    "instanceTerminationAction": "TERMINATION_ACTION"
  }
}

Reemplaza lo siguiente:

  • PROJECT_ID: Es el ID del proyecto en el que deseas crear la VM.
  • ZONE: Es la zona en la que está disponible el tipo de máquina que deseas usar. Para obtener información sobre las regiones, consulta Regiones y zonas de GPU.
  • MACHINE_TYPE: Es el tipo de máquina que se usará para la VM. Especifica un tipo de máquina A4 o A3 Ultra. Para obtener más información, consulta Tipos de máquinas con GPU.
  • VM_NAME: el nombre de la VM.
  • DISK_SIZE: Es el tamaño del disco de arranque en GB.
  • IMAGE_PROJECT: Es el ID del proyecto de la imagen de SO.
  • IMAGE_FAMILY: Es la familia de imágenes de la imagen de SO que deseas usar. Para obtener una lista de los sistemas operativos compatibles, consulta Detalles de los sistemas operativos.
  • NETWORK_PROJECT_ID: Es el ID del proyecto de la red.
  • GVNIC_NAME_PREFIX: Es el prefijo del nombre que especificaste cuando creaste las subredes y las redes de VPC estándar que usan gVNICs.
  • REGION: Es la región de la subred.
  • RDMA_NAME_PREFIX: Es el prefijo de nombre que especificaste cuando creaste las redes de VPC y las subredes que usan NIC de RDMA.
  • TERMINATION_ACTION: Es la acción que se debe realizar cuando Compute Engine interrumpe la instancia, ya sea STOP (predeterminada) o DELETE.

Prepara la instancia para usarla

Para preparar una instancia que tenga GPU conectadas para su uso, completa los siguientes pasos:

  1. Para habilitar una instancia A4 o A3 Ultra para que use sus GPU conectadas, la instancia debe tener instalados los controladores de GPU. A menos que la imagen de la instancia ya incluya los controladores de GPU necesarios, instala los controladores de GPU.

  2. Si creaste una VM Spot en la sección anterior, completa los siguientes pasos:

¿Qué sigue?