TPU v2

Questo documento descrive l'architettura e le configurazioni supportate di Cloud TPU v2.

Architettura di sistema

I dettagli dell'architettura e le caratteristiche delle prestazioni di TPU v2 sono disponibili in un supercomputer specifico per il dominio per l'addestramento di reti neurali profonde.

Configurazioni

Un pod TPU v2 è composto da 512 chip interconnessi con link ad alta velocità riconfigurabili. Per creare una sezione di pod TPU v2, utilizza il flag --accelerator-type nel comando di creazione della TPU (gcloud compute tpus tpu-vm). Specifica il tipo di acceleratore specificando la versione di TPU e il numero di core TPU. Ad esempio, per una singola TPU v2, utilizza --accelerator-type=v2-8. Per una sezione di pod v2 con 128 TensorCore, utilizza --accelerator-type=v2-128.

Il seguente comando mostra come creare una sezione di pod di TPU v2 con 128 TensorCore:

  $ gcloud compute tpus tpu-vm create tpu-name \
    --zone=zone \
    --accelerator-type=v2-128 \
    --version=tpu-vm-tf-2.16.1-pjrt

Per ulteriori informazioni sulla gestione delle TPU, consulta Gestione delle TPU. Per ulteriori informazioni sull'architettura del sistema TPU Cloud TPU, consulta Architettura di sistema.

Nella tabella seguente sono elencati i tipi di TPU v2 supportati:

Versione TPU Fine del supporto
v2-8 (Data di fine non ancora impostata)
v2-32 (Data di fine non ancora impostata)
v2-128 (Data di fine non ancora impostata)
v2-256 (Data di fine non ancora impostata)
v2-512 (Data di fine non ancora impostata)