Perguntas frequentes: Cloud TPU

Este documento contém uma lista de perguntas frequentes sobre os Cloud TPUs. Ela é dividida em seções:

  1. Perguntas frequentes independentes de framework: dúvidas sobre o uso de Cloud TPUs, independentemente do framework de ML usado.
  2. Perguntas frequentes sobre o JAX: perguntas sobre o uso de Cloud TPUs com o JAX.
  3. Perguntas frequentes sobre o PyTorch: dúvidas sobre o uso de Cloud TPUs com o PyTorch.

Perguntas frequentes independentes de framework

Como verificar qual processo está usando a TPU em uma VM do Cloud TPU?

Execute sudo lsof -w /dev/accel* na VM do Cloud TPU para imprimir o ID do processo e outras informações sobre o processo usando a TPU.

Como adicionar um volume de disco permanente a uma VM do Cloud TPU?

Para mais informações, consulte Adicionar um disco permanente a uma VM da TPU.

Quais opções de armazenamento são compatíveis/recomendadas para treinamento com VMs de TPU?

Para mais informações, consulte as opções de armazenamento do Cloud TPU.

Perguntas frequentes sobre o JAX

Como posso saber se a TPU está sendo usada pelo meu programa?

Existem algumas maneiras de verificar se o JAX está usando a TPU:

  1. Use a função jax.devices(). Exemplo:

    assert jax.devices()[0].platform == 'tpu'
    
  2. Crie um perfil do programa e verifique se ele contém operações de TPU. Para mais informações, consulte Como criar perfis de programas JAX.

Para saber mais, consulte as Perguntas frequentes do JAX

Perguntas frequentes sobre o Pytorch

Como posso saber se a TPU está sendo usada pelo meu programa?

É possível executar os seguintes comandos Python:

>>> import torch_xla.core.xla_model as xm
>>> xm.get_xla_supported_devices(devkind="TPU")

Verifique também se algum dispositivo TPU aparece.