TPU interrumpibles

Las TPU interrumpibles cuestan mucho menos que las no interrumpibles. El servicio de Cloud TPU puede interrumpir (cerrar) estas TPU en cualquier momento si requiere recursos TPU adicionales.

Crea una VM de TPU interrumpible

gcloud

$ gcloud compute tpus tpu-vm create demo-tpu \
  --zone=europe-west4-a \
  --accelerator-type=v3-8 \
  --version=tpu-vm-tf-2.17.0-pjrt \
  --preemptible
  

Donde:

  • demo-tpu es un nombre para la TPU.
  • accelerator-type es el tipo de TPU. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
  • version es la imagen de la VM de Cloud TPU que se instalará.
  • preemptible permite que Cloud TPU interrumpa la TPU.

Precios y cuotas para las TPU interrumpibles

Los precios para las TPU interrumpibles son considerablemente menores que los de las TPU normales. Para obtener más detalles, consulta la guía de precios. Las TPU no se cobran si se interrumpen durante el primer minuto posterior a su creación.

Por lo general, la cuota para las TPU interrumpibles es más alta y está separada de la cuota para las TPU normales. Consulta la página de cuotas.

Detectar si se ha interrumpido una TPU

Usa el siguiente comando de gcloud para verificar si el servicio de Cloud TPU interrumpió tu TPU:

Indica las TPU disponibles:

gcloud compute tpus tpu-vm list
  --zone=us-central1-b
  

En el resultado del comando, se muestran los detalles de las TPU creadas en tu proyecto. Si se interrumpió una TPU, el estado cambia de READY a PREEMPTED.

Por ejemplo:

NAME       ZONE           ACCELERATOR_TYPE  NETWORK_ENDPOINT   NETWORK  RANGE          STATUS
demo-tpu   us-central1-b  v2-8              10.240.1.2:8470    default  10.240.1.0/29  PREEMPTED

Cómo diseñar la aplicación de aprendizaje automático para que se ejecute en TPU interrumpibles

A fin de asegurarse de que la aplicación sea resistente a los reinicios de la VM y la TPU, guarda los puntos de control del modelo de forma regular y configura la aplicación para que restablezca el punto de control más reciente durante el reinicio.