Cómo solicitar una reserva a corto plazo con el modo de calendario

Para reservar TPUs para una hora de inicio y una duración específicas, de entre 1 y 90 días, pide una reserva futura en el modo de calendario. Este modo, que se basa en el programador dinámico de cargas de trabajo, te permite verificar la disponibilidad de las TPU con hasta 120 días de anticipación y solicitar capacidad según tu programación. Puedes solicitar una reserva futura en modo de calendario con la API de Compute Engine o la consola de Google Cloud . Si se aprueba, Compute Engine crea automáticamente una reserva para la fecha y la hora que elegiste. Luego, puedes consumir la reserva aprovisionando TPU con la API de Create Node o la API de recursos en cola. Compute Engine borra automáticamente la reserva y las TPU que la consumen al final del período de reserva.

Solicitar una reserva futura en el modo de calendario es una buena opción para las cargas de trabajo de entrenamiento y experimentación que requieren horas de inicio precisas y tienen una duración definida.

Para obtener más información, consulta Acerca de las solicitudes de reserva futuras en el modo de calendario.

Consulta la disponibilidad futura de las TPU

Puedes ver la disponibilidad de las TPU con 1 a 120 días de anticipación. Para obtener más información, consulta Cómo ver la disponibilidad futura de los recursos.

Crea una solicitud de reserva futura en el modo de calendario

Puedes solicitar una reserva futura en modo de calendario con la API de Compute Engine o la consola de Google Cloud . Para obtener más información, consulta Cómo crear una solicitud de reserva futura en el modo de calendario.

Limitaciones

Solicitar una reserva futura en el modo de calendario para las TPU tiene las siguientes limitaciones:

  • No puedes modificar, cancelar ni borrar una solicitud de reserva futura.
  • Debes especificar una duración de la reserva con un mínimo de 1 día y un máximo de 90 días.
  • Solo puedes reservar las siguientes versiones de TPU en las zonas especificadas:
    • TPU v6e: asia-northeast1-b, us-east5-a
    • TPU v5p: us-east5-a
    • TPU v5e: us-west4-b (BATCH), us-central1-a (SERVING)

Para conocer la cantidad permitida de chips de TPU por solicitud, consulta Limitaciones en la documentación de Compute Engine.

¿Qué sigue?