TPU v2
Questo documento descrive l'architettura e le configurazioni supportate di Cloud TPU v2.
Architettura di sistema
I dettagli dell'architettura e le caratteristiche delle prestazioni di TPU v2 sono disponibili in un supercomputer specifico per il dominio per l'addestramento di reti neurali profonde.
Configurazioni
Un pod TPU v2 è composto da 512 chip interconnessi con link ad alta velocità riconfigurabili. Per creare una sezione di pod TPU v2, utilizza il flag --accelerator-type
nel comando di creazione della TPU (gcloud compute tpus tpu-vm
). Specifica il tipo di acceleratore specificando la versione di TPU e il numero di core TPU. Ad esempio, per una singola TPU v2, utilizza --accelerator-type=v2-8
. Per una sezione di pod v2
con 128 TensorCore, utilizza --accelerator-type=v2-128
.
Il seguente comando mostra come creare una sezione di pod di TPU v2 con 128 TensorCore:
$ gcloud compute tpus tpu-vm create tpu-name \
--zone=zone \
--accelerator-type=v2-128 \
--version=tpu-vm-tf-2.16.1-pjrt
Per ulteriori informazioni sulla gestione delle TPU, consulta Gestione delle TPU. Per ulteriori informazioni sull'architettura del sistema TPU Cloud TPU, consulta Architettura di sistema.
Nella tabella seguente sono elencati i tipi di TPU v2 supportati:
Versione TPU | Fine del supporto |
---|---|
v2-8 | (Data di fine non ancora impostata) |
v2-32 | (Data di fine non ancora impostata) |
v2-128 | (Data di fine non ancora impostata) |
v2-256 | (Data di fine non ancora impostata) |
v2-512 | (Data di fine non ancora impostata) |