Aree geografiche e zone TPU

Panoramica

Le principali differenze tra i tipi di TPU sono il prezzo, le prestazioni, la capacità di memoria e la disponibilità a livello di zona.

Google Cloud Platform utilizza le aree geografiche, suddivise in zone, per definire la località geografica delle risorse di calcolo fisico. Ad esempio, l'area geografica us-central1 indica una regione vicina al centro geografico degli Stati Uniti. Quando crei un nodo TPU, devi specificare la zona in cui vuoi crearlo. Per ulteriori informazioni sulle risorse a livello di area geografica e zona, consulta il documento Risorse globali, a livello di area geografica e di zona di Compute Engine.

Puoi creare la tua configurazione TPU nelle zone mostrate nella seguente tabella.

USA

Tipo di TPU (v2) Core TPU v2 Memoria TPU totale Regione/zona
v2-8 8 64 GiB us-central1-b
us-central1-c
us-central1-f
v2-32 32 256 GiB us-central1-a
v2-128 128 1 TiB us-central1-a
v2-256 256 2 TiB us-central1-a
v2-512 512 4 TiB us-central1-a
Tipo di TPU (v3) Core TPU v3 Memoria TPU totale Zone disponibili
v3-8 8 128 GiB us-central1-a
us-central1-b
us-central1-f

Europa

Tipo di TPU (v2) Core TPU v2 Memoria TPU totale Regione/zona
v2-8 8 64 GiB europe-west4-a
v2-32 32 256 GiB europe-west4-a
v2-128 128 1 TiB europe-west4-a
v2-256 256 2 TiB europe-west4-a
v2-512 512 4 TiB europe-west4-a
Tipo di TPU (v3) Core TPU v3 Memoria TPU totale Zone disponibili
v3-8 8 128 GiB europe-west4-a
v3-32 32 512 GiB europe-west4-a
v3-64 64 1 TiB europe-west4-a
v3-128 128 2 TiB europe-west4-a
v3-256 256 4 TiB europe-west4-a
v3-512 512 8 TiB europe-west4-a
v3-1024 1024 16 TiB europe-west4-a
v3-2048 2048 32 TiB europe-west4-a

Asia Pacifico

Tipo di TPU (v2) Core TPU v2 Memoria TPU totale Regione/zona
v2-8 8 64 GiB asia-east1-c

I tipi di TPU con un numero più elevato di chip o core sono disponibili solo in quantità limitate. I tipi di TPU con un numero di chip o core inferiore hanno maggiori probabilità di essere disponibili.

Calcolo di compromessi in termini di prezzi e prestazioni

Per decidere quale tipo di TPU utilizzare, puoi eseguire esperimenti utilizzando un tutorial di Cloud TPU per addestrare un modello simile alla tua applicazione.

Esegui il tutorial per il 5-10% del numero di passaggi che utilizzerai per eseguire l'addestramento completo su un tipo di TPU v2-8 o v3-8. Il risultato indica il tempo necessario per eseguire il numero di passaggi corrispondente per ogni modello su ciascun tipo di TPU.

Poiché le prestazioni sui tipi di TPU vengono scalate in modo lineare, se sai quanto tempo occorre per eseguire un'attività su un tipo di TPU v2-8 o v3-8, puoi stimare quanto tempo puoi ridurre in termini di attività eseguendo il modello su un tipo di TPU più grande con più chip o core.

Ad esempio, se un tipo v2-8 TPU richiede da 60 minuti a 10.000 passi, un'operazione su un nodo v2-32 dovrebbe richiedere circa 15 minuti.

Quando conosci il tempo approssimativo di addestramento del tuo modello su alcuni diversi tipi di TPU, puoi confrontare il costo di VM/TPU rispetto al tempo di addestramento per decidere il miglior rapporto prezzo/prestazioni.

Per determinare la differenza di costo tra i diversi tipi di TPU per Cloud TPU e la VM di Compute Engine associata, consulta la pagina sui prezzi delle TPU.

Specificare il tipo di TPU

Indipendentemente dal framework utilizzato, TensorFlow, PyTorch o JAX, devi specificare un tipo TPU v2 o v3 con il parametro accelerator-type quando avvii una TPU. Il comando del tipo TPU dipende dal fatto che tu stia utilizzando VM TPU o nodi TPU. I comandi di esempio sono mostrati in Gestione delle TPU.

Passaggi successivi

  • Per visualizzare i prezzi delle TPU in ogni area geografica, consulta la pagina Prezzi.
  • Scopri di più sull'architettura TPU nella pagina Architettura di sistema.
  • Consulta la sezione Quando utilizzare le TPU per scoprire i tipi di modelli che sono adatti a Cloud TPU.