常见问题解答 - Cloud TPU
本文档包含有关 Cloud TPU 的常见问题解答列表。该报告分为以下部分:
- 与框架无关的常见问题解答 - 无论您使用的是哪种机器学习框架,都可以参阅与使用 Cloud TPU 相关的问题解答。
- JAX 常见问题解答 - 关于将 Cloud TPU 与 JAX 搭配使用的问题。
- PyTorch 常见问题解答 - 关于将 Cloud TPU 与 PyTorch 搭配使用的问题。
与框架无关的常见问题解答
如何检查 Cloud TPU 虚拟机上哪个进程正在使用 TPU?
在 Cloud TPU 虚拟机上运行 sudo lsof -w /dev/accel*
,以输出使用 TPU 的进程的进程 ID 和其他信息。
如何向 Cloud TPU 虚拟机添加永久性磁盘卷?
如需了解详情,请参阅将永久性磁盘添加到 TPU 虚拟机
使用 TPU VM 进行训练时支持/推荐使用哪些存储方案?
如需了解详情,请参阅 Cloud TPU 存储选项。
JAX 常见问题解答
如何判断我的程序是否在使用 TPU?
您可以通过以下几种方法仔细检查 JAX 是否在使用 TPU:
使用
jax.devices()
函数。例如:assert jax.devices()[0].platform == 'tpu'
分析程序并验证配置文件是否包含 TPU 操作。如需了解详情,请参阅剖析 JAX 程序
如需了解详情,请参阅 JAX 常见问题解答
Pytorch 常见问题解答
如何判断我的程序是否在使用 TPU?
您可以运行以下 Python 命令:
>>> import torch_xla.core.xla_model as xm
>>> xm.get_xla_supported_devices(devkind="TPU")
然后,检查您是否可以看到任何 TPU 设备。