TPU v2

Este documento descreve a arquitetura e as configurações disponíveis para o Cloud TPU v2.

Arquitetura do sistema

Os detalhes de arquitetura e as características de desempenho da TPU v2 estão disponíveis em Um supercomputador específico para domínios voltado ao treinamento de redes neurais profundas.

Configurações

Uma fração da TPU v2 é composta por 512 chips interconectados com links de alta velocidade reconfiguráveis. Para criar uma fração da TPU v2, use a flag --accelerator-type no comando de criação de TPU (gcloud compute tpus tpu-vm). Especifique o tipo de acelerador ao informar a versão da TPU e o número de núcleos de TPU. Por exemplo, para uma única TPU v2, use --accelerator-type=v2-8. Para uma fração da v2 com 128 TensorCores, use --accelerator-type=v2-128.

O comando abaixo mostra como criar uma fração de TPU v2 com 128 TensorCores:

  $ gcloud compute tpus tpu-vm create tpu-name \
    --zone=us-central1-a \
    --accelerator-type=v2-128 \
    --version=tpu-ubuntu2204-base

Para saber como gerenciar TPUs, consulte Gerenciar TPUs. Para saber mais sobre a arquitetura do sistema do Cloud TPU, consulte Arquitetura do sistema.

A tabela abaixo lista os tipos de TPU v2 disponíveis:

Versão da TPU Fim da disponibilidade
v2-8 (data final ainda não definida)
v2-32 (data final ainda não definida)
v2-128 (data final ainda não definida)
v2-256 (data final ainda não definida)
v2-512 (data final ainda não definida)