Preguntas frecuentes - Cloud TPU

Este documento contiene una lista de preguntas frecuentes sobre Cloud TPU. Se divide en secciones:

  1. Preguntas frecuentes independientes del marco de trabajo: preguntas sobre el uso de Cloud TPU, independientemente del marco de trabajo de AA que uses.
  2. Preguntas frecuentes de JAX: Preguntas sobre el uso de Cloud TPU con JAX
  3. Preguntas frecuentes sobre PyTorch: Preguntas sobre el uso de Cloud TPU con PyTorch

Si buscas información sobre el uso de Cloud TPU con TensorFlow, consulta Ejecuta modelos de TensorFlow en Cloud TPU.

Preguntas frecuentes independientes del marco de trabajo

¿Cómo puedo verificar qué proceso usa la TPU en una VM de Cloud TPU?

Ejecuta sudo lsof -w /dev/accel* en la VM de Cloud TPU para imprimir el ID del proceso y otra información sobre el proceso mediante la TPU.

¿Cómo agrego un volumen de disco persistente a una VM de Cloud TPU?

Para obtener más información, consulta Agrega un disco persistente a una VM de TPU.

¿Qué opciones de almacenamiento se admiten o recomiendan para el entrenamiento con VM de TPU?

Para obtener más información, consulta Opciones de almacenamiento de Cloud TPU.

Preguntas frecuentes sobre JAX

¿Cómo sé si mi programa está usando la TPU?

Hay varias formas de verificar si JAX usa la TPU:

  1. Usa la función jax.devices(). Por ejemplo:

    assert jax.devices()[0].platform == 'tpu'
    
  2. Genera un perfil para tu programa y verifica que el perfil contenga operaciones de TPU. Para obtener más información, consulta Cómo generar perfiles de programas JAX

Para obtener más información, consulta Preguntas frecuentes de JAX.

Preguntas frecuentes sobre Pytorch

¿Cómo sé si mi programa está usando la TPU?

Puedes ejecutar los siguientes comandos de Python:

>>> import torch_xla.core.xla_model as xm
>>> xm.get_xla_supported_devices(devkind="TPU")

Verifica si puedes ver algún dispositivo de TPU.