Cloud Tensor Processing Units (TPU)

Accelera lo sviluppo dell'IA con Google Cloud TPU

Le Cloud TPU ottimizzano le prestazioni e i costi per tutti i carichi di lavoro di IA, dall'addestramento all'inferenza. Utilizzando un'infrastruttura di data center di livello mondiale, le TPU offrono affidabilità, disponibilità e sicurezza elevate.

Non sai se le TPU sono adatte a te? Scopri quando utilizzare GPU o CPU su istanze Compute Engine per eseguire i carichi di lavoro di machine learning.

Panoramica

Che cos'è una Tensor Processing Unit (TPU)?

Le Google Cloud TPU sono acceleratori IA progettati su misura, ottimizzati per l'addestramento e l'inferenza di modelli IA di grandi dimensioni. Sono ideali per una varietà di casi d'uso, tra cui chatbot, generazione di codice, generazione di contenuti multimediali, sintesi vocale, servizi di visione artificiale, motori per suggerimenti e modelli di personalizzazione, tra gli altri. 

Quali sono i vantaggi delle Cloud TPU?

Le Cloud TPU sono progettate per scalare in modo economico per un'ampia gamma di carichi di lavoro IA, compresi addestramento, ottimizzazione e inferenza. Le Cloud TPU offrono la versatilità per accelerare i carichi di lavoro sui principali framework di IA, tra cui PyTorch, JAX e TensorFlow. Orchestra senza problemi carichi di lavoro di IA su larga scala tramite l'integrazione di Cloud TPU in Google Kubernetes Engine (GKE). I clienti che cercano il modo più semplice per sviluppare modelli di IA possono anche sfruttare le Cloud TPU in Vertex AI, una piattaforma di IA completamente gestita.

Quando utilizzare le Cloud TPU?

Le Cloud TPU sono ottimizzate per l'addestramento di modelli di deep learning complessi e di grandi dimensioni che prevedono molti calcoli matriciali, ad esempio per creare modelli linguistici di grandi dimensioni (LLM). Le Cloud TPU includono anche SparseCore, ovvero processori di dataflow che accelerano i modelli basati sugli incorporamenti trovati nei modelli di suggerimenti. Altri casi d'uso includono il settore sanitario, come la modellazione del folding delle proteine e la scoperta di farmaci.

Quali sono le differenze tra le Cloud TPU e le GPU?

Una GPU è un processore specializzato progettato originariamente per la manipolazione della grafica computerizzata. La loro struttura parallela le rende ideali per algoritmi che elaborano grandi blocchi di dati presenti in genere nei carichi di lavoro di IA. Scopri di più.

Una TPU è un circuito integrato specifico per applicazioni (ASIC) progettato da Google per le reti neurali. Le TPU dispongono di funzionalità specializzate, come l'unità di moltiplicazione a matrice (MXU) e la topologia di interconnessione proprietaria, che le rendono ideali per accelerare l'addestramento e l'inferenza dell'IA.

Versioni di Cloud TPU

Versione Cloud TPUDescrizioneDisponibilità

Cloud TPU v5p

La Cloud TPU più potente per l'addestramento di modelli IA

Cloud TPU v5p sarà disponibile in Nord America (regione degli Stati Uniti orientali)

Cloud TPU v5e

La Cloud TPU più efficiente, versatile e scalabile

Cloud TPU v5e è in disponibilità generale in Nord America (regioni degli Stati Uniti occidentali/orientali)

Cloud TPU v5p è disponibile in Nord America (us-east5) durante l'anteprima.

Cloud TPU v5p

Descrizione

La Cloud TPU più potente per l'addestramento di modelli IA

Disponibilità

Cloud TPU v5p sarà disponibile in Nord America (regione degli Stati Uniti orientali)

Cloud TPU v5e

Descrizione

La Cloud TPU più efficiente, versatile e scalabile

Disponibilità

Cloud TPU v5e è in disponibilità generale in Nord America (regioni degli Stati Uniti occidentali/orientali)

Cloud TPU v5p è disponibile in Nord America (us-east5) durante l'anteprima.

Come funziona

Dai un'occhiata all'interno delle Google Cloud TPU, inclusa una rara vista dall'interno dei data center in cui avviene la magia. I clienti utilizzano le Cloud TPU per eseguire alcuni dei più grandi carichi di lavoro di IA al mondo e questa potenza proviene da molto più di un semplice chip. In questo video, dai un'occhiata ai componenti del sistema TPU, tra cui networking di data center, interruttori di circuiti ottici, sistemi di raffreddamento ad acqua, verifica della sicurezza biometrica e altro ancora.

Sostituire con video TPU!

Utilizzi comuni

Esegui carichi di lavoro per l'addestramento dell'IA su larga scala

Addestramento su IA potente, scalabile ed efficiente

L'addestramento multislice di Cloud TPU è una tecnologia full stack che consente l'addestramento rapido, semplice e affidabile di modelli di IA su larga scala su decine di migliaia di chip TPU.

Scalabilità quasi lineare fino a decine di migliaia di chip con l'addestramento multislice

Addestramento su IA potente, scalabile ed efficiente

L'addestramento multislice di Cloud TPU è una tecnologia full stack che consente l'addestramento rapido, semplice e affidabile di modelli di IA su larga scala su decine di migliaia di chip TPU.

Scalabilità quasi lineare fino a decine di migliaia di chip con l'addestramento multislice

Ottimizza i modelli IA di base

Adatta gli LLM per le tue applicazioni con Pytorch/XLA

Ottimizza in modo efficiente i modelli di base sfruttando i tuoi dati di addestramento che rappresentano il tuo caso d'uso. Cloud TPU v5e offre prestazioni di ottimizzazione LLM fino a 1,9 volte superiori per dollaro rispetto a Cloud TPU v4.

Ottimizzazione delle prestazioni LLM di Cloud TPU/$

    Adatta gli LLM per le tue applicazioni con Pytorch/XLA

    Ottimizza in modo efficiente i modelli di base sfruttando i tuoi dati di addestramento che rappresentano il tuo caso d'uso. Cloud TPU v5e offre prestazioni di ottimizzazione LLM fino a 1,9 volte superiori per dollaro rispetto a Cloud TPU v4.

    Ottimizzazione delle prestazioni LLM di Cloud TPU/$

      Gestisci carichi di lavoro di inferenza IA su larga scala

      Massimizza le prestazioni/$ con un'infrastruttura IA scalabile

      Cloud TPU v5e consente un'inferenza ad alte prestazioni ed economica per un'ampia gamma di carichi di lavoro IA, inclusi i più recenti LLM e modelli di IA generativa. TPU v5e offre prestazioni in termini di velocità effettiva fino a 2,5 volte superiore per dollaro e una velocità fino a 1,7 volte superiore rispetto a Cloud TPU v4. Ogni chip TPU v5e fornisce fino a 393 trilioni di operazioni int8 al secondo, consentendo a modelli complessi di fare previsioni rapidamente. Un pod TPU v5e offre fino a 100 quadrilioni di operazioni int8 al secondo o 100 petaOps di potenza di calcolo.

      Ulteriori informazioni qui
      Pod Cloud TPU v5e

      Massimizza le prestazioni/$ con un'infrastruttura IA scalabile

      Cloud TPU v5e consente un'inferenza ad alte prestazioni ed economica per un'ampia gamma di carichi di lavoro IA, inclusi i più recenti LLM e modelli di IA generativa. TPU v5e offre prestazioni in termini di velocità effettiva fino a 2,5 volte superiore per dollaro e una velocità fino a 1,7 volte superiore rispetto a Cloud TPU v4. Ogni chip TPU v5e fornisce fino a 393 trilioni di operazioni int8 al secondo, consentendo a modelli complessi di fare previsioni rapidamente. Un pod TPU v5e offre fino a 100 quadrilioni di operazioni int8 al secondo o 100 petaOps di potenza di calcolo.

      Ulteriori informazioni qui
      Pod Cloud TPU v5e

      Cloud TPU in GKE

      Scalabilità semplice con GKE

      Combina la potenza delle Cloud TPU con la flessibilità e la scalabilità di GKE per creare ed eseguire il deployment di modelli di machine learning in modo più rapido e semplice che mai. Con le Cloud TPU disponibili in GKE, ora puoi avere un singolo ambiente operativo coerente per tutti i tuoi carichi di lavoro, standardizzando le pipeline MLOps automatizzate.

      TPU nell'architettura GKE

      Scalabilità semplice con GKE

      Combina la potenza delle Cloud TPU con la flessibilità e la scalabilità di GKE per creare ed eseguire il deployment di modelli di machine learning in modo più rapido e semplice che mai. Con le Cloud TPU disponibili in GKE, ora puoi avere un singolo ambiente operativo coerente per tutti i tuoi carichi di lavoro, standardizzando le pipeline MLOps automatizzate.

      TPU nell'architettura GKE

      Cloud TPU in Vertex AI

      Vertex AI Training e previsioni con Cloud TPU

      Per i clienti che cercano un modo più semplice per sviluppare modelli IA, puoi eseguire il deployment di Cloud TPU v5e con Vertex AI, una piattaforma end-to-end per la creazione modelli di IA su un'infrastruttura completamente gestita, creata appositamente per la gestione a bassa latenza e l'addestramento ad alte prestazioni.

      Vertex AI Training e previsioni con Cloud TPU

      Per i clienti che cercano un modo più semplice per sviluppare modelli IA, puoi eseguire il deployment di Cloud TPU v5e con Vertex AI, una piattaforma end-to-end per la creazione modelli di IA su un'infrastruttura completamente gestita, creata appositamente per la gestione a bassa latenza e l'addestramento ad alte prestazioni.

      Prezzi

      Prezzi per Cloud TPUTutti i prezzi di Cloud TPU si intendono per chip/ora
      Versione Cloud TPUPrezzo di valutazione (USD)Impegno di 1 anno (USD)Impegno di 3 anni (USD)

      Cloud TPU v5p

      Starting at

      4,2000 $

      per chip/ora

      Starting at

      2,9400 $

      per chip/ora

      Starting at

      1,8900 $

      per chip/ora

      Cloud TPU v5e

      Starting at

      1,2000 $

      per chip/ora

      Starting at

      0,8400 $

      per chip/ora

      Starting at

      0,5400 $

      per chip/ora

      I prezzi di Cloud TPU variano in base al prodotto e alla regione. Visualizza i dettagli qui.

      Prezzi per Cloud TPU

      Tutti i prezzi di Cloud TPU si intendono per chip/ora

      Cloud TPU v5p

      Prezzo di valutazione (USD)

      Starting at

      4,2000 $

      per chip/ora

      Impegno di 1 anno (USD)

      Starting at

      2,9400 $

      per chip/ora

      Impegno di 3 anni (USD)

      Starting at

      1,8900 $

      per chip/ora

      Cloud TPU v5e

      Prezzo di valutazione (USD)

      Starting at

      1,2000 $

      per chip/ora

      Impegno di 1 anno (USD)

      Starting at

      0,8400 $

      per chip/ora

      Impegno di 3 anni (USD)

      Starting at

      0,5400 $

      per chip/ora

      I prezzi di Cloud TPU variano in base al prodotto e alla regione. Visualizza i dettagli qui.

      CALCOLATORE PREZZI

      Stima i costi mensili di Cloud TPU, inclusi i prezzi e le tariffe specifici per regione.

      PREVENTIVO PERSONALIZZATO

      Contatta il nostro team di vendita per ricevere un preventivo personalizzato per la tua organizzazione.

      Inizia la tua proof of concept

      Prova Cloud TPU gratuitamente

      Leggi una rapida introduzione all'uso delle Cloud TPU

      Esecuzione di TensorFlow su una VM Cloud TPU

      Esecuzione di JAX su una VM Cloud TPU

      Esecuzione di PyTorch su una VM Cloud TPU

      Google Cloud
      • ‪English‬
      • ‪Deutsch‬
      • ‪Español‬
      • ‪Español (Latinoamérica)‬
      • ‪Français‬
      • ‪Indonesia‬
      • ‪Italiano‬
      • ‪Português (Brasil)‬
      • ‪简体中文‬
      • ‪繁體中文‬
      • ‪日本語‬
      • ‪한국어‬
      Console
      • Risparmia con il nostro approccio trasparente ai prezzi
      • Il pagamento a consumo di Google Cloud offre risparmi automatici in base all'utilizzo mensile e alle tariffe scontate per risorse prepagate. Contattaci oggi per richiedere un preventivo.
      Google Cloud