TPU v2

Neste documento, descrevemos a arquitetura e as configurações compatíveis do Cloud TPU v2.

arquitetura do sistema.

Os detalhes arquitetônicos e as características de desempenho da TPU v2 estão disponíveis em Um supercomputador específico ao domínio para treinar redes neurais profundas (em inglês).

Configurações

Um Pod TPU v2 é composto por 512 chips interconectados com links reconfiguráveis de alta velocidade. Para criar uma fração do Pod de TPU v2, use a sinalização --accelerator-type no comando de criação da TPU (gcloud compute tpus tpu-vm). Para definir o tipo de acelerador, defina a versão da TPU e o número de núcleos da TPU. Por exemplo, para uma única TPU v2, use --accelerator-type=v2-8. Para uma fração de pod v2 com 128 TensorCores, use --accelerator-type=v2-128.

O comando a seguir mostra como criar uma fração do Pod de TPU v2 com 128 TensorCores:

  $ gcloud compute tpus tpu-vm create tpu-name \
    --zone=zone \
    --accelerator-type=v2-128 \
    --version=tpu-vm-tf-2.16.1-pjrt

Para mais informações sobre como gerenciar TPUs, consulte Gerenciar TPUs. Para mais informações sobre a arquitetura do sistema Cloud TPU, consulte Arquitetura do sistema.

A tabela a seguir lista os tipos de TPU v2 compatíveis:

Versão da TPU Fim da compatibilidade
v2-8 (data final ainda não definida)
v2-32 (data final ainda não definida)
v2-128 (data final ainda não definida)
v2-256 (data final ainda não definida)
v2-512 (data final ainda não definida)