TPU v2

Este documento descreve a arquitetura e as configurações compatíveis do Cloud TPU v2.

arquitetura do sistema.

Os detalhes de arquitetura e as características de desempenho da TPU v2 estão disponíveis em Um supercomputador específico para domínios para treinamento de redes neurais profundas.

Configurações

Um pod de TPU v2 é composto por 512 chips interconectados com links de alta velocidade reconfiguráveis. Para criar uma fração de pod de TPU v2, use a flag --accelerator-type no comando de criação de TPU (gcloud compute tpus tpu-vm). Especifique o tipo de acelerador especificando a versão do TPU e o número de núcleos de TPU. Por exemplo, para uma única TPU v2, use --accelerator-type=v2-8. Para um slice de pod v2 com 128 TensorCores, use --accelerator-type=v2-128.

O comando a seguir mostra como criar uma fatia de pod de TPU v2 com 128 TensorCores:

  $ gcloud compute tpus tpu-vm create tpu-name \
    --zone=zone \
    --accelerator-type=v2-128 \
    --version=tpu-vm-tf-2.18.0-pod-pjrt

Para mais informações sobre como gerenciar TPUs, consulte Gerenciar TPUs. Para mais informações sobre a arquitetura do sistema TPU do Cloud TPU, consulte Arquitetura do sistema.

A tabela a seguir lista os tipos de TPU v2 compatíveis:

Versão da TPU Fim da compatibilidade
v2-8 (data final ainda não definida)
v2-32 (data final ainda não definida)
v2-128 (data final ainda não definida)
v2-256 (data final ainda não definida)
v2-512 (data final ainda não definida)