TPU 区域和可用区

概览

TPU 类型之间的主要区别在于价格、性能、内存容量和可用区级可用性。

Google Cloud 使用可细分为可用区的区域来定义物理计算资源的地理位置。例如，us-central1 区域表示靠近美国地理中心的区域。创建 TPU 节点时，您可以指定要在其中创建该节点的地区。如需详细了解区域和可用区级资源，请参阅 Compute Engine 全球、区域和可用区级资源文档。

您可以在下表中显示的可用区中创建 TPU 配置。

美国

TPU 类型 (v2)	TPU v2 核心数	可用地区
v2-8	8	`us-central1-b` `us-central1-c` `us-central1-f`
v2-32	32	`us-central1-a`
v2-128	128	`us-central1-a`
v2-256	256	`us-central1-a`
v2-512	512	`us-central1-a`
TPU 类型 (v3)	TPU v3 核心数	可用地区
v3-8	8	`us-central1-a` `us-central1-b` `us-central1-f`
TPU 类型 (v4)	TPU v4 芯片	可用地区
所有 v4 配置	因切片大小而异	`us-central2-b`
TPU 类型 (v5e)	TPU v5e 芯片	可用地区
v5litepod-1	1	`us-west4-a` `us-east5-b`
v5litepod-4	4	`us-west4-a` `us-east5-b`
v5litepod-8	8	`us-west4-a` `us-east5-b`
v5litepod-16	16	`us-west4-a` `us-east5-b`
v5litepod-32	32	`us-west4-a` `us-east5-b`
V5litepod-64	64	`us-west4-a` `us-east5-b`
V5litepod-128	128	`us-west4-a` `us-east5-b`
V5litepod-256	256	`us-west4-a` `us-east5-b`
TPU 类型 (v5p)	TPU v5p 芯片	可用地区
所有 v5p 配置	因切片大小而异	`us-east5-a` `us-east5-c` `us-east1-d`

欧洲

TPU 类型 (v2)	TPU v2 核心数	可用地区
v2-8	8	`europe-west4-a`
v2-32	32	`europe-west4-a`
v2-128	128	`europe-west4-a`
v2-256	256	`europe-west4-a`
v2-512	512	`europe-west4-a`
TPU 类型 (v3)	TPU v3 核心数	可用地区
v3-8	8	`europe-west4-a`
v3-32	32	`europe-west4-a`
v3-64	64	`europe-west4-a`
v3-128	128	`europe-west4-a`
v3-256	256	`europe-west4-a`
v3-512	512	`europe-west4-a`
v3-1024	1024	`europe-west4-a`
v3-2048	2048	`europe-west4-a`
TPU 类型 (v5e)	TPU v5e 芯片	可用地区
v5lite-1	1	`europe-west4-b`
V5lite-4	4	`europe-west4-b`
V5lite-8	8	`europe-west4-b`

亚太地区

TPU 类型 (v2)	TPU v2 核心数	可用地区
v2-8	8	`asia-east1-c`

芯片或核心数量较多的 TPU 类型的供应量有限。芯片或核心数量较少的 TPU 类型可用的可能性更大。

计算性价比

为了确定要使用哪种类型的 TPU，您可以使用 Cloud TPU 教程进行实验，以训练与您的应用类似的模型。

运行本教程的步数为在 v2-8 或 v3-8 TPU 类型上运行完整训练时所需步骤数的 5-10%。结果会告诉您在每种 TPU 类型上运行该模型的相应步数所需的时间。

由于 TPU 类型的性能是线性扩缩的，如果您知道在 v2-8 或 v3-8 TPU 类型上运行任务需要多长时间，就可以估算在具有更多芯片或核心的更大 TPU 类型上运行模型可以减少多少任务时间。

例如，如果 v2-8 TPU 类型需要 60 分钟完成 10,000 步，则 v2-32 节点应该需要大约 15 分钟来执行同一任务。

在了解模型在几种不同 TPU 类型的大致训练时间后，您可以根据训练时间来权衡虚拟机/TPU 的费用，从而确定最佳性价比。

要确定 Cloud TPU 和相关 Compute Engine 虚拟机的不同 TPU 类型之间的费用差异，请参阅 TPU 价格页面。

指定 TPU 类型

无论使用哪种框架，您都可以在启动 TPU 时使用 accelerator-type 参数指定 v2 或 v3 TPU 类型。对于 TPU v4 或更高版本，您可以使用 AcceleratorType 或 AcceleratorConfig 指定类型和大小。如需了解详情，请参阅 TPU 版本。TPU 类型命令取决于您使用的是 TPU 虚拟机还是 TPU 节点。管理 TPU 中显示了示例命令。

后续步骤

如需查看每个区域的 TPU 价格，请参阅价格页面。
如需详细了解 TPU 架构，请参阅系统架构页面。
请参阅何时使用 TPU，了解适用于 Cloud TPU 的模型类型。