TPU v2

Este documento descreve a arquitetura e as configurações suportadas da Cloud TPU v2.

Arquitetura do sistema

Os detalhes da arquitetura e as características de desempenho da TPU v2 estão disponíveis no artigo A Domain Specific Supercomputer for Training Deep Neural Networks.

Configurações

Uma fatia de TPU v2 é composta por 512 chips interligados com ligações de alta velocidade reconfiguráveis. Para criar uma fatia de TPU v2, use a flag --accelerator-type no comando de criação de TPU (gcloud compute tpus tpu-vm). Especifique o tipo de acelerador especificando a versão da TPU e o número de núcleos da TPU. Por exemplo, para uma única TPU v2, use --accelerator-type=v2-8. Para uma fatia v2 com 128 TensorCores, use --accelerator-type=v2-128.

O comando seguinte mostra como criar uma fatia de TPU v2 com 128 TensorCores:

  $ gcloud compute tpus tpu-vm create tpu-name \
    --zone=us-central1-a \
    --accelerator-type=v2-128 \
    --version=tpu-ubuntu2204-base

Para mais informações sobre a gestão de TPUs, consulte o artigo Faça a gestão de TPUs. Para mais informações sobre a arquitetura do sistema de TPU do Cloud TPU, consulte o artigo Arquitetura do sistema.

A tabela seguinte indica os tipos de TPU v2 suportados:

Versão da TPU O apoio técnico termina
v2-8 (Data de fim ainda não definida)
v2-32 (Data de fim ainda não definida)
v2-128 (Data de fim ainda não definida)
v2-256 (Data de fim ainda não definida)
v2-512 (Data de fim ainda não definida)