Vous ne savez pas si les TPU sont la réponse à vos besoins ? Découvrez quand utiliser des GPU ou des CPU sur des instances Compute Engine pour exécuter vos charges de travail de machine learning.
Présentation
Un GPU est un processeur spécialisé initialement conçu pour manipuler des éléments graphiques réalisés par ordinateur. Grâce à sa structure parallèle, il constitue une solution idéale pour les algorithmes qui traitent de grands blocs de données qu'on rencontre couramment dans les charges de travail d'IA. En savoir plus
Un TPU est un circuit intégré propre à une application (ASIC) spécialement développé par Google pour les réseaux de neurones. Il possède des fonctionnalités spécialisées, telles que l'unité de multiplication de matrice (MXU) et une topologie d'interconnexion propriétaire, ce qui le rend idéal pour accélérer l'entraînement et l'inférence de l'IA.
Versions de Cloud TPU
Version de Cloud TPU | Description | Qui peut en bénéficier ? |
---|---|---|
Cloud TPU v5p | Le Cloud TPU le plus puissant pour l'entraînement de modèles d'IA | Cloud TPU v5p sera disponible en Amérique du Nord (région Est des États-Unis) |
Cloud TPU v5e | Le Cloud TPU le plus efficace, le plus polyvalent et le plus évolutif | Cloud TPU v5e est en disponibilité générale en Amérique du Nord (régions Ouest et Est des États-Unis) |
Cloud TPU v5p est disponible en Amérique du Nord (us-east5) pendant la phase preview.
Cloud TPU v5p
Le Cloud TPU le plus puissant pour l'entraînement de modèles d'IA
Cloud TPU v5p sera disponible en Amérique du Nord (région Est des États-Unis)
Cloud TPU v5e
Le Cloud TPU le plus efficace, le plus polyvalent et le plus évolutif
Cloud TPU v5e est en disponibilité générale en Amérique du Nord (régions Ouest et Est des États-Unis)
Cloud TPU v5p est disponible en Amérique du Nord (us-east5) pendant la phase preview.
Fonctionnement
Découvrez la magie des TPU Google Cloud, y compris une vue exceptionnelle des centres de données où se déroule toute l'action. Nos clients utilisent des Cloud TPU pour exécuter certaines des charges de travail d'IA les plus importantes au monde, et cette puissance ne se résume pas à une simple puce. Dans cette vidéo, découvrez les composants du système TPU : mise en réseau de centres de données, commutateurs de circuits optiques, systèmes de refroidissement à eau, vérification de la sécurité biométrique, etc.
Utilisations courantes
Cloud TPU Multislice Training est une technologie full stack qui permet d'entraîner des modèles d'IA à grande échelle de façon rapide, facile et fiable sur des dizaines de milliers de puces TPU.
Cloud TPU Multislice Training est une technologie full stack qui permet d'entraîner des modèles d'IA à grande échelle de façon rapide, facile et fiable sur des dizaines de milliers de puces TPU.
Affinez efficacement les modèles de fondation en exploitant vos propres données d'entraînement correspondant à votre cas d'utilisation. Cloud TPU v5e offre des performances de réglage de LLM jusqu'à 1,9 fois supérieures pour chaque dollar dépensé par rapport à Cloud TPU v4.
Affinez efficacement les modèles de fondation en exploitant vos propres données d'entraînement correspondant à votre cas d'utilisation. Cloud TPU v5e offre des performances de réglage de LLM jusqu'à 1,9 fois supérieures pour chaque dollar dépensé par rapport à Cloud TPU v4.
Cloud TPU v5e permet des inférences hautes performances et économiques pour un large éventail de charges de travail d'IA, y compris les derniers modèles LLM et d'IA générative. TPU v5e offre des performances de débit jusqu'à 2,5 fois supérieures par dollar et jusqu'à 1,7 fois plus vite qu'avec Cloud TPU v4. Chaque puce de TPU v5e assure jusqu'à 393 000 milliards d'opérations int8 par seconde, ce qui permet à des modèles complexes de réaliser des prédictions rapides. Un pod de TPU v5e fournit jusqu'à 100 quadrillions d'opérations int8 par seconde, soit 100 pétaOps de puissance de calcul.
Cloud TPU v5e permet des inférences hautes performances et économiques pour un large éventail de charges de travail d'IA, y compris les derniers modèles LLM et d'IA générative. TPU v5e offre des performances de débit jusqu'à 2,5 fois supérieures par dollar et jusqu'à 1,7 fois plus vite qu'avec Cloud TPU v4. Chaque puce de TPU v5e assure jusqu'à 393 000 milliards d'opérations int8 par seconde, ce qui permet à des modèles complexes de réaliser des prédictions rapides. Un pod de TPU v5e fournit jusqu'à 100 quadrillions d'opérations int8 par seconde, soit 100 pétaOps de puissance de calcul.
Alliez la puissance des Cloud TPU à la flexibilité et l'évolutivité de GKE pour créer et déployer des modèles de machine learning plus rapidement et plus facilement que jamais. Grâce aux Cloud TPU disponibles dans GKE, vous pouvez désormais disposer d'un environnement opérationnel cohérent unique pour toutes vos charges de travail et standardiser les pipelines MLOps automatisés.
Alliez la puissance des Cloud TPU à la flexibilité et l'évolutivité de GKE pour créer et déployer des modèles de machine learning plus rapidement et plus facilement que jamais. Grâce aux Cloud TPU disponibles dans GKE, vous pouvez désormais disposer d'un environnement opérationnel cohérent unique pour toutes vos charges de travail et standardiser les pipelines MLOps automatisés.
Pour les clients qui cherchent le moyen le plus simple de développer des modèles d'IA, vous pouvez déployer Cloud TPU v5e avec Vertex AI, une plate-forme de bout en bout permettant de créer des modèles d'IA sur une infrastructure entièrement gérée et conçue spécialement pour la diffusion à faible latence et l'entraînement hautes performances.
Pour les clients qui cherchent le moyen le plus simple de développer des modèles d'IA, vous pouvez déployer Cloud TPU v5e avec Vertex AI, une plate-forme de bout en bout permettant de créer des modèles d'IA sur une infrastructure entièrement gérée et conçue spécialement pour la diffusion à faible latence et l'entraînement hautes performances.
Tarification
Tarifs de Cloud TPU | Tous les tarifs de Cloud TPU sont calculés par puce-heure | ||
---|---|---|---|
Version de Cloud TPU | Tarif d'évaluation (USD) | Engagement sur un an (USD) | Engagement sur trois ans (USD) |
Cloud TPU v5p | Starting at 4,2000 $ par puce heure | Starting at 2,9400 $ par puce heure | Starting at 1,8900 $ par puce heure |
Cloud TPU v5e | Starting at 1,2000 $ par puce heure | Starting at 0,8400 $ par puce heure | Starting at 0,5400 $ par puce heure |
Les tarifs de Cloud TPU varient selon les produits et les régions. En savoir plus
Tarifs de Cloud TPU
Tous les tarifs de Cloud TPU sont calculés par puce-heure
Cloud TPU v5p
Starting at
4,2000 $
par puce heure
Starting at
2,9400 $
par puce heure
Starting at
1,8900 $
par puce heure
Cloud TPU v5e
Starting at
1,2000 $
par puce heure
Starting at
0,8400 $
par puce heure
Starting at
0,5400 $
par puce heure
Les tarifs de Cloud TPU varient selon les produits et les régions. En savoir plus