TPU v2
Este documento descreve a arquitetura e as configurações suportadas da Cloud TPU v2.
Arquitetura do sistema
Os detalhes da arquitetura e as características de desempenho da TPU v2 estão disponíveis no artigo A Domain Specific Supercomputer for Training Deep Neural Networks.
Configurações
Uma fatia de TPU v2 é composta por 512 chips interligados com ligações de alta velocidade reconfiguráveis. Para criar uma fatia de TPU v2, use a flag --accelerator-type
no comando de criação de TPU (gcloud compute tpus tpu-vm
). Especifique o tipo de acelerador especificando a versão da TPU e o número de núcleos da TPU. Por exemplo, para uma única TPU v2, use --accelerator-type=v2-8
. Para uma fatia v2 com 128 TensorCores, use --accelerator-type=v2-128
.
O comando seguinte mostra como criar uma fatia de TPU v2 com 128 TensorCores:
$ gcloud compute tpus tpu-vm create tpu-name \ --zone=us-central1-a \ --accelerator-type=v2-128 \ --version=tpu-ubuntu2204-base
Para mais informações sobre a gestão de TPUs, consulte o artigo Faça a gestão de TPUs. Para mais informações sobre a arquitetura do sistema de TPU do Cloud TPU, consulte o artigo Arquitetura do sistema.
A tabela seguinte indica os tipos de TPU v2 suportados:
Versão da TPU | O apoio técnico termina |
---|---|
v2-8 | (Data de fim ainda não definida) |
v2-32 | (Data de fim ainda não definida) |
v2-128 | (Data de fim ainda não definida) |
v2-256 | (Data de fim ainda não definida) |
v2-512 | (Data de fim ainda não definida) |