TPU 区域和可用区

概览

TPU 类型之间的主要区别在于价格、性能、内存容量和地区可用性。

Google Cloud 使用划分为多个地区的区域来定义物理计算资源的地理位置。例如,us-central1 区域表示靠近美国地理中心的一个区域。创建 TPU VM 时,您需要指定要在哪个地区创建。如需详细了解区域和地区资源,请参阅 Compute Engine 全球、区域和地区资源文档。

您可以在下表中所示的区域创建 TPU 配置。

美国

TPU 类型 (v2) TPU v2 核心数 适用地区
v2-8 8 us-central1-b
us-central1-c
us-central1-f
v2-32 32 us-central1-a
v2-128 128 us-central1-a
v2-256 256 us-central1-a
v2-512 512 us-central1-a
TPU 类型 (v3) TPU v3 核心数 适用地区
v3-8 8 us-central1-a
us-central1-b
us-central1-f
TPU 类型 (v4) TPU v4 芯片 适用地区
所有 v4 配置 因 slice 大小而异 us-central2-b
TPU 类型 (v5e) TPU v5e 芯片 适用地区
所有 v5litepod 配置 因 slice 大小而异 us-central1-a
us-east5-a
us-east5-b
us-east5-c
us-south1-a
us-west1-c
us-west4-a
us-west4-b
TPU 类型 (v5p) TPU v5p 芯片 适用地区
所有 v5p 配置 因 slice 大小而异 us-east5-a

欧洲

TPU 类型 (v2) TPU v2 核心数 适用地区
v2-8 8 europe-west4-a
v2-32 32 europe-west4-a
v2-128 128 europe-west4-a
v2-256 256 europe-west4-a
v2-512 512 europe-west4-a
TPU 类型 (v3) TPU v3 核心数 适用地区
v3-8 8 europe-west4-a
v3-32 32 europe-west4-a
v3-64 64 europe-west4-a
v3-128 128 europe-west4-a
v3-256 256 europe-west4-a
v3-512 512 europe-west4-a
v3-1024 1024 europe-west4-a
v3-2048 2048 europe-west4-a
TPU 类型 (v5e) TPU v5e 芯片 适用地区
v5lite-1 1 europe-west4-b
v5lite-4 4 europe-west4-b
v5lite-8 8 europe-west4-b
所有 v5litepod 配置 因 slice 大小而异 europe-west1-b
europe-west4-a
europe-west4-b
TPU 类型 (v5p) TPU v5p 芯片 适用地区
所有 v5p 配置 因 slice 大小而异 europe-west4-b

亚太地区

TPU 类型 (v2) TPU v2 核心数 适用地区
v2-8 8 asia-east1-c
TPU 类型 (v5e) TPU v5e 芯片 适用地区
所有 v5litepod 配置 因 slice 大小而异 asia-southeast1-b

芯片或核心数较多的 TPU 类型的供应量有限。芯片数或核心数较少的 TPU 类型供应更充足。

计算性价比

为了确定要使用哪种类型的 TPU,您可以使用 Cloud TPU 教程进行实验,训练与您的应用类似的模型。

在运行教程时,请将步骤数设为在 v2-8v3-8 TPU 类型上运行完整训练时所需步骤数的 5-10%。参照结果,您就知道该模型在每种 TPU 类型上运行相应步数所需的时间了。

由于各种 TPU 的性能呈线性比例关系,您知道在 v2-8v3-8 TPU 上运行任务需要多长时间后,就可以藉此估算在具有更多芯片或核心的大型 TPU 上运行模型可以将任务时间缩短多少。

例如,如果 v2-8 TPU 完成 1 万步需要 60 分钟时间,则 v2-32 节点应该只需大约 15 分钟即可完成这一任务。

当您了解模型在几种不同 TPU 上的大致训练时长后,您就可以对照训练时长来权衡虚拟机/TPU 的费用,从而确定性价比最佳的配置。

要确定 Cloud TPU 和相关 Compute Engine 虚拟机的不同 TPU 类型之间的费用差异,请参阅 TPU 价格页面

指定 TPU 类型

无论您使用哪种框架,都必须在启动 TPU 时通过 accelerator-type 参数指定 v2v3 TPU 类型。对于 TPU v4 或更高版本,您可以使用 AcceleratorTypeAcceleratorConfig 指定类型和大小。如需了解详情,请参阅 TPU 版本管理 TPU 中列出了示例命令。

后续步骤

  • 如需查看每个区域的 TPU 价格,请参阅价格页面。
  • 如需详细了解 TPU 架构,请参阅系统架构页面。
  • 如需了解哪些模型类型适合使用 Cloud TPU,请参阅何时使用 TPU