TPU v2
Este documento descreve a arquitetura e as configurações disponíveis para o Cloud TPU v2.
Arquitetura do sistema
Os detalhes de arquitetura e as características de desempenho da TPU v2 estão disponíveis em Um supercomputador específico para domínios voltado ao treinamento de redes neurais profundas.
Configurações
Uma fração da TPU v2 é composta por 512 chips interconectados com links de alta velocidade
reconfiguráveis. Para criar uma fração da TPU v2, use a flag --accelerator-type
no comando de criação de TPU (gcloud compute tpus tpu-vm). Especifique o
tipo de acelerador ao informar a versão da TPU e o número de núcleos de TPU. Por
exemplo, para uma única TPU v2, use --accelerator-type=v2-8. Para uma fração da v2
com 128 TensorCores, use --accelerator-type=v2-128.
O comando abaixo mostra como criar uma fração de TPU v2 com 128 TensorCores:
$ gcloud compute tpus tpu-vm create tpu-name \ --zone=us-central1-a \ --accelerator-type=v2-128 \ --version=tpu-ubuntu2204-base
Para saber como gerenciar TPUs, consulte Gerenciar TPUs. Para saber mais sobre a arquitetura do sistema do Cloud TPU, consulte Arquitetura do sistema.
A tabela abaixo lista os tipos de TPU v2 disponíveis:
| Versão da TPU | Fim da disponibilidade |
|---|---|
| v2-8 | (data final ainda não definida) |
| v2-32 | (data final ainda não definida) |
| v2-128 | (data final ainda não definida) |
| v2-256 | (data final ainda não definida) |
| v2-512 | (data final ainda não definida) |