Crea grupos de VM de GPU con plantillas de instancias.


Puedes usar plantillas de instancias para crear grupos de instancias administrados con GPU agregadas a cada instancia. Los grupos de instancias administrados usan la plantilla para crear múltiples instancias idénticas. Puedes escalar la cantidad de instancias del grupo para que coincidan con tu carga de trabajo.

Debido a que las instancias creadas deben tener instalado el kit de herramientas CUDA y el controlador de NVIDIA, el proceso para crear una plantilla de instancias de GPU es el siguiente:

  1. Crea una instancia que tenga GPU adjuntas.
  2. Instala un controlador de GPU en la instancia.
  3. Crea una imagen desde el disco conectado a la instancia de VM que tiene instaladas las GPU y los controladores.
  4. Usa la imagen para crear una plantilla de instancias.
  5. Usa la plantilla para crear un grupo de instancias.

Antes de empezar

  • Configura la autenticación si aún no lo hiciste. La autenticación es el proceso mediante el cual se verifica tu identidad para acceder a los servicios y las API de Google Cloud. Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine de la siguiente manera.

    Selecciona la pestaña para saber cómo planeas usar las muestras en esta página:

    Consola

    Cuando usas la consola de Google Cloud para acceder a los servicios y las APIs de Google Cloud, no necesitas configurar la autenticación.

    gcloud

    1. Instala Google Cloud CLI y, luego, inicializa la ejecución del siguiente comando:

      gcloud init
    2. Configura una región y una zona predeterminadas.

    Terraform

    Para usar las muestras de Terraform de esta página desde un entorno de desarrollo local, instala e inicializa la CLI de gcloud y, luego, configura las credenciales predeterminadas de la aplicación con tus credenciales de usuario.

    1. Instala Google Cloud CLI.
    2. Para inicializar la CLI de gcloud, ejecuta el siguiente comando:

      gcloud init
    3. Crea credenciales de autenticación locales para tu Cuenta de Google:

      gcloud auth application-default login

    Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

Cómo crear una plantilla de instancias

Puedes crear una plantilla de instancias global o regional. Si deseas crear una plantilla de instancias regional, asegúrate de elegir una región en la que al menos una zona admita el modelo de GPU que deseas.

Si deseas ver los pasos para crear una plantilla de instancias, consulta Crea plantillas de instancias.

Console

Para crear la plantilla de instancias con Console, asegúrate de hacer las siguientes personalizaciones:

  • Especifica el tipo de máquina.
  • Especifica el nombre de la imagen y la familia de tu imagen personalizada que tiene las GPU y los controladores adjuntos.

Para obtener más información sobre el uso de imágenes personalizadas, consulta Usa imágenes personalizadas o públicas en tus plantillas de instancias.

gcloud

Para crear la plantilla de instancias con el comando gcloud compute instance-templates create, incluye las marcas --accelerators y --maintenance-policy TERMINATE. Si deseas crear una plantilla de instancias regional, debes usar la marca --instance-template-region para especificar la región de la plantilla.

En el siguiente ejemplo, se crea una plantilla de instancias global con 2 CPU virtuales, un disco de arranque de 250 GB basado en tu imagen (con controladores instalados) y una GPU T4 de NVIDIA. Reemplaza my-image y my-project por la imagen y el nombre de proyecto de la imagen que tiene las GPU y los controladores adjuntos.

gcloud compute instance-templates create gpu-template \
    --machine-type n1-standard-2 \
    --boot-disk-size 250GB \
    --accelerator type=nvidia-tesla-t4,count=1 \
    --image-family my-image \
    --image-project my-project \
    --maintenance-policy TERMINATE \
    --restart-on-failure

Terraform

En el siguiente ejemplo, se crea una plantilla de instancias global con 2 CPU virtuales, un disco de arranque de 250 GB basado en tu imagen (con controladores instalados) y una GPU T4 de NVIDIA. Para obtener más información sobre el recurso usado en la muestra, consulta recurso google_compute_instance_template.

Para crear una plantilla de instancias regional, usa el recurso google_compute_region_instance_template.

resource "google_compute_instance_template" "default" {
  name         = "gpu-template"
  machine_type = "n1-standard-2"

  disk {
    source_image = "debian-cloud/debian-11"
  }

  network_interface {
    network = "default"
  }

  guest_accelerator {
    type  = "nvidia-tesla-t4"
    count = 1
  }

  scheduling {
    on_host_maintenance = "TERMINATE"
  }
}

Si deseas obtener más información para aplicar o quitar una configuración de Terraform, consulta los comandos básicos de Terraform.

Crea un grupo de instancias

Después de crear la plantilla, úsala para crear un grupo de instancias. Cada vez que agregas una instancia al grupo, se inicia con la configuración de la plantilla de instancias.

Si creas un grupo de instancias administrado regional, asegúrate de seleccionar zonas que admitan el modelo de GPU específico que deseas. Para obtener una lista de los modelos de GPU y las zonas disponibles, consulta GPU en Compute Engine. En el siguiente ejemplo, se crea un grupo de instancias administrado regional en dos zonas que admiten el modelo nvidia-tesla-t4.

gcloud compute instance-groups managed create example-rmig \
    --template gpu-template --base-instance-name example-instances \
    --size 30 --zones us-east1-c,us-east1-d

Próximos pasos