TPU 区域和可用区
概览
TPU 类型之间的主要区别在于价格、性能、内存容量和可用区级可用性。
Google Cloud 使用区域(可细分为可用区)来定义物理计算资源的地理位置。例如,us-central1
区域表示靠近美国地理中心的区域。创建 TPU 虚拟机时,您可以指定要在哪个可用区创建该虚拟机。如需详细了解区域和地区资源,请参阅 Compute Engine 全球、区域和地区资源文档。
您可以在下表中显示的可用区中创建 TPU 配置。
美国
TPU 类型 (v2) | TPU v2 核心数 | 可用地区 |
---|---|---|
v2-8 | 8 |
us-central1-b us-central1-c us-central1-f
|
v2-32 | 32 |
us-central1-a
|
v2-128 | 128 |
us-central1-a
|
v2-256 | 256 |
us-central1-a
|
v2-512 | 512 |
us-central1-a
|
TPU 类型 (v3) | TPU v3 核心数 | 可用地区 |
v3-8 | 8 |
us-central1-a us-central1-b us-central1-f
|
TPU 类型 (v4) | TPU v4 芯片 | 可用地区 |
所有 v4 配置 | 因切片大小而异 |
us-central2-b |
TPU 类型 (v5e) | TPU v5e 芯片 | 可用地区 |
所有 v5litepod 配置 | 因切片大小而异 |
us-central1-a us-east5-a us-east5-b us-east5-c us-south1-a us-west1-c us-west4-a us-west4-b |
TPU 类型 (v5p) | TPU v5p 芯片 | 可用地区 |
所有 v5p 配置 | 因切片大小而异 |
us-east5-a us-east5-c us-east1-d |
欧洲
TPU 类型 (v2) | TPU v2 核心数 | 可用地区 |
---|---|---|
v2-8 | 8 |
europe-west4-a
|
v2-32 | 32 |
europe-west4-a
|
v2-128 | 128 |
europe-west4-a
|
v2-256 | 256 |
europe-west4-a
|
v2-512 | 512 |
europe-west4-a
|
TPU 类型 (v3) | TPU v3 核心数 | 可用地区 |
v3-8 | 8 |
europe-west4-a
|
v3-32 | 32 |
europe-west4-a
|
v3-64 | 64 |
europe-west4-a
|
v3-128 | 128 |
europe-west4-a
|
v3-256 | 256 |
europe-west4-a
|
v3-512 | 512 |
europe-west4-a
|
v3-1024 | 1024 |
europe-west4-a
|
v3-2048 | 2048 |
europe-west4-a
|
TPU 类型 (v5e) | TPU v5e 芯片 | 可用地区 |
v5lite-1 | 1 |
europe-west4-b |
v5lite-4 | 4 |
europe-west4-b |
v5lite-8 | 8 |
europe-west4-b |
所有 v5litepod 配置 | 因切片大小而异 |
europe-west1-b europe-west4-a europe-west4-b |
亚太地区
TPU 类型 (v2) | TPU v2 核心数 | 可用地区 |
---|---|---|
v2-8 | 8 |
asia-east1-c
|
TPU 类型 (v5e) | TPU v5e 芯片 | 可用地区 |
所有 v5litepod 配置 | 因切片大小而异 |
asia-southeast1-b
|
芯片或核心数量较多的 TPU 类型的供应量有限。芯片或核心数量较少的 TPU 类型更有可能可用。
计算性价比
为了决定要使用的 TPU 类型,您可以使用 Cloud TPU 教程进行实验,训练与您的应用类似的模型。
在运行教程时,请将步骤数设为在 v2-8
或 v3-8
TPU 类型上运行完整训练时所需步骤数的 5-10%。通过该结果,您可以了解该模型在每种 TPU 类型上运行相应步数的情况。
由于 TPU 类型的性能线性扩展,如果您知道在 v2-8
或 v3-8
TPU 类型上运行任务所需的时间,就可以估算在具有更多芯片或核心的大型 TPU 类型上运行模型可以缩短任务时间。
例如,如果 v2-8
TPU 完成 1 万步需要 60 分钟,则 v2-32
节点应该大约需要 15 分钟来执行这一任务。
如果您知道模型在几种不同 TPU 上的大致训练时间,则可以根据训练时间来权衡虚拟机/TPU 的费用,从而确定性价比最佳的折中方案。
要确定 Cloud TPU 和相关 Compute Engine 虚拟机的不同 TPU 类型之间的费用差异,请参阅 TPU 价格页面。
指定 TPU 类型
无论您使用哪种框架,都需要在启动 TPU 时使用 accelerator-type
参数指定 v2
或 v3
TPU 类型。对于 TPU v4 或更高版本,您可以使用 AcceleratorType
或 AcceleratorConfig
指定类型和大小。如需了解详情,请参阅 TPU 版本。管理 TPU 中显示示例命令。