Esta página se ha traducido con Cloud Translation API.

Solicitar TPUs con reserva futura en modo calendario

Autopilot Standard

En esta guía se explica cómo optimizar el aprovisionamiento de unidades de procesamiento de tensor (TPUs) mediante la reserva futura en modo calendario. La reserva futura en el modo Calendario es un asesor y recomendador de calendario integrado que puede ayudarte a localizar capacidad de TPU y planificar con antelación. Puedes solicitar capacidad para una hora de inicio y una duración específicas, entre 1 y 90 días, y el recomendador te sugerirá fechas.

Esta guía está dirigida a ingenieros de aprendizaje automático, administradores y operadores de plataformas, y especialistas en datos e IA que estén interesados en usar las funciones de orquestación de contenedores de Kubernetes para ejecutar cargas de trabajo por lotes. Para obtener más información sobre los roles habituales y las tareas de ejemplo a las que hacemos referencia en el contenido, consulta Roles y tareas habituales de los usuarios de GKE. Google Cloud

Para obtener más información, consulta Acerca de la reserva futura en el modo Calendario.

Casos prácticos

La reserva futura en modo de calendario es la opción más adecuada para cargas de trabajo con solicitudes programadas, a corto plazo y de alta demanda, como modelos de entrenamiento o de inferencia por lotes que requieren una alta disponibilidad a la hora de inicio solicitada.

Si tu carga de trabajo requiere recursos aprovisionados dinámicamente según sea necesario, durante un máximo de 7 días sin reservas a largo plazo ni una gestión compleja de cuotas, te recomendamos que utilices la opción de consumo inicio flexible. Para obtener más información, consulta Acerca del aprovisionamiento de GPU y TPU con flex-start.

Antes de empezar

Antes de empezar, asegúrate de que has realizado las siguientes tareas:

Habilita la API de Google Kubernetes Engine.

Habilitar la API de Google Kubernetes Engine

Si quieres usar Google Cloud CLI para esta tarea, instálala y, a continuación, inicialízala. Si ya has instalado la CLI de gcloud, obtén la versión más reciente ejecutando el comando gcloud components update. Es posible que las versiones anteriores de la interfaz de línea de comandos de gcloud no admitan la ejecución de los comandos de este documento.
Nota: Si ya tienes instalada la CLI gcloud, asegúrate de definir la compute/region propiedad. Si usas principalmente clústeres zonales, define compute/zone en su lugar. Si defines una ubicación predeterminada, puedes evitar errores en gcloud CLI como el siguiente: One of [--zone, --region] must be supplied: Please specify location. Es posible que tengas que especificar la ubicación en determinados comandos si la ubicación de tu clúster es diferente de la predeterminada que hayas definido.

Asegúrate de que tienes una de las siguientes opciones:
- Un clúster estándar que ejecute la versión 1.28.3-gke.1098000 o una posterior.
- un clúster de Autopilot que ejecute la versión 1.30.3-gke.1451000 o una posterior.

Solicitar una reserva futura en el modo de calendario para las TPUs

El proceso para solicitar TPUs con reserva futura en modo de calendario implica los siguientes pasos:

Asegúrate de que tienes suficiente cuota para los recursos que no forman parte de una reserva cuando se crean las VMs, como los discos o las direcciones IP. Las futuras solicitudes de reserva en modo calendario no requieren cuota de Compute Engine.
Sigue los pasos que se indican en Crear una solicitud en el modo Calendario. Estos pasos incluyen lo siguiente:
1. Consulta la disponibilidad futura de las TPU.
2. Crea y envía una solicitud de reserva futura en el modo Calendario para las TPUs.
3. Espera a que Google Cloud apruebe tu solicitud.
Crea un grupo de nodos de TPU que use tu reserva.

Crear un grupo de nodos

Esta sección solo se aplica a los clústeres estándar.

Puedes usar tu reserva al crear grupos de nodos de slices de TPU de un solo host o de varios hosts. Por ejemplo, puedes crear un grupo de nodos de segmento de TPU de un solo host con la CLI de Google Cloud.

gcloud container node-pools create NODE_POOL_NAME \
    --location=LOCATION \
    --cluster=CLUSTER_NAME \
    --node-locations=NODE_ZONES \
    --machine-type=MACHINE_TYPE \
    --reservation-affinity=specific \ This is required
    --reservation=RESERVATION

Haz los cambios siguientes:

NODE_POOL_NAME: el nombre del nuevo grupo de nodos.
LOCATION: el nombre de la zona en función de la versión de TPU que quieras usar. Para identificar una ubicación disponible, consulta Disponibilidad de las TPUs en GKE.
CLUSTER_NAME: el nombre del clúster.
NODE_ZONES: lista separada por comas de una o varias zonas en las que GKE crea el grupo de nodos.
MACHINE_TYPE: el tipo de máquina que se va a usar en los nodos. Para obtener más información sobre los tipos de máquinas compatibles con TPU, consulta la tabla de la sección Elegir la versión de TPU.
RESERVATION: el nombre de la reserva de calendario que se va a usar.

Para ver una lista completa de todas las marcas que puedes especificar, consulta la referencia de gcloud container clusters create.

Una vez que hayas creado un grupo de nodos con la reserva de calendario, podrás desplegar tu carga de trabajo como en cualquier otro grupo de nodos de TPU. Por ejemplo, puedes crear un trabajo que especifique el grupo de nodos de TPU que consume las TPUs reservadas.

Siguientes pasos

Prueba ejemplos de despliegue de GKE para modelos de IA generativa que usen los recursos de TPU que hayas reservado:
Consulta ejemplos experimentales para aprovechar GKE y acelerar tus iniciativas de IA y aprendizaje automático en GKE AI Labs.