¿No sabes si las TPU son adecuadas? Descubre cuándo debes usar las GPUs o las CPUs de las instancias de Compute Engine para ejecutar las cargas de trabajo de aprendizaje automático.
Información general
Una GPU es un procesador especializado que se diseñó originalmente para manipular los gráficos de un ordenador. Su estructura paralela los convierte en ideales para los algoritmos que procesan grandes bloques de datos que suelen encontrarse en las cargas de trabajo de IA. Más información
Una TPU es un circuito integrado (ASIC) específico de una aplicación diseñado por Google para las redes neuronales. Las TPU cuentan con características especializadas, como la multiplicación de la matriz (MXU) y la topología de interconexión propia, lo que las convierte en ideales para agilizar el entrenamiento y la inferencia de la IA.
Versiones de TPU de Cloud
Versión de TPU de Cloud | Descripción | Disponibilidad |
---|---|---|
TPU de Cloud v.5p | La TPU de Cloud más potente para entrenar modelos de IA | La versión 5p de la TPU de Cloud estará disponible en Norteamérica (regiones orientales de EE. UU.) |
TPU de Cloud (5ª versión) | La TPU de Cloud más eficiente, versátil y escalable | La versión 5e de la TPU de Cloud está disponible para el público general en Norteamérica (regiones occidentales y orientales de EE. UU.) |
La versión 5p de la TPU de Cloud está disponible en Norteamérica (us-east5) durante su fase de versión preliminar.
TPU de Cloud v.5p
La TPU de Cloud más potente para entrenar modelos de IA
La versión 5p de la TPU de Cloud estará disponible en Norteamérica (regiones orientales de EE. UU.)
TPU de Cloud (5ª versión)
La TPU de Cloud más eficiente, versátil y escalable
La versión 5e de la TPU de Cloud está disponible para el público general en Norteamérica (regiones occidentales y orientales de EE. UU.)
La versión 5p de la TPU de Cloud está disponible en Norteamérica (us-east5) durante su fase de versión preliminar.
Cómo funciona
Adéntrate en la magia de las TPUs de Google Cloud y en una exclusiva vista interna de los centros de datos donde todo tiene lugar. Con las TPUs de Cloud, los clientes pueden ejecutar algunas de las mayores cargas de trabajo de IA del mundo, y esa potencia no se limita a un chip. En este vídeo, puedes comprobar los componentes del sistema de TPU, como las redes de centros de datos, los interruptores de circuito óptico, los sistemas de refrigeración de agua y la verificación de seguridad biométrica, entre otros.
Usos habituales
El entrenamiento Multislice de la TPU de Cloud es una tecnología full stack que permite entrenar modelos de IA a gran escala de forma rápida, sencilla y fiable en decenas de miles de chips de TPUs.
El entrenamiento Multislice de la TPU de Cloud es una tecnología full stack que permite entrenar modelos de IA a gran escala de forma rápida, sencilla y fiable en decenas de miles de chips de TPUs.
Perfecciona los modelos básicos de forma eficiente aprovechando datos de entrenamiento propios que representen tu caso práctico. La versión 5e de la TPU de Cloud ofrece un rendimiento de ajuste de LLM hasta 1,9 veces superior por dólar invertido en comparación con Cloud TPU v4.
Perfecciona los modelos básicos de forma eficiente aprovechando datos de entrenamiento propios que representen tu caso práctico. La versión 5e de la TPU de Cloud ofrece un rendimiento de ajuste de LLM hasta 1,9 veces superior por dólar invertido en comparación con Cloud TPU v4.
La versión 5e de TPU de Cloud ofrece inferencias de alto rendimiento y rentables en una amplia variedad de cargas de trabajo de IA, incluidos los LLMs y los modelos de IA generativa más recientes. La versión 5e de TPU ofrece un rendimiento hasta 2,5 veces más alto por dólar invertido y una velocidad hasta 1,7 veces mayor que Cloud TPU v4. Cada chip de TPU v5e proporciona hasta 393 billones de operaciones int8 por segundo, lo que permite que los modelos complejos hagan predicciones rápidas. Los pods de la versión 5e de TPU ofrecen hasta 1000 billones de operaciones int8 por segundo o 100 petaOps de potencia de computación.
La versión 5e de TPU de Cloud ofrece inferencias de alto rendimiento y rentables en una amplia variedad de cargas de trabajo de IA, incluidos los LLMs y los modelos de IA generativa más recientes. La versión 5e de TPU ofrece un rendimiento hasta 2,5 veces más alto por dólar invertido y una velocidad hasta 1,7 veces mayor que Cloud TPU v4. Cada chip de TPU v5e proporciona hasta 393 billones de operaciones int8 por segundo, lo que permite que los modelos complejos hagan predicciones rápidas. Los pods de la versión 5e de TPU ofrecen hasta 1000 billones de operaciones int8 por segundo o 100 petaOps de potencia de computación.
Combina la potencia de las TPU de Cloud con la flexibilidad y la escalabilidad de GKE para crear y desplegar modelos de aprendizaje automático con mayor rapidez y facilidad que nunca. Gracias a las TPUs de Cloud que están disponibles en GKE, ahora puedes tener un único entorno de operaciones coherente para todas tus cargas de trabajo con la finalidad de estandarizar los flujos de procesamiento automatizados de MLOps.
Combina la potencia de las TPU de Cloud con la flexibilidad y la escalabilidad de GKE para crear y desplegar modelos de aprendizaje automático con mayor rapidez y facilidad que nunca. Gracias a las TPUs de Cloud que están disponibles en GKE, ahora puedes tener un único entorno de operaciones coherente para todas tus cargas de trabajo con la finalidad de estandarizar los flujos de procesamiento automatizados de MLOps.
Si buscas la forma más sencilla de desarrollar modelos de IA, puedes desplegar la versión 5e de TPU de Cloud con Vertex AI. Se trata de una plataforma integral para crear modelos de IA en una infraestructura totalmente gestionada que se ha creado especialmente para ofrecer un servicio de baja latencia y un entrenamiento de alto rendimiento.
Si buscas la forma más sencilla de desarrollar modelos de IA, puedes desplegar la versión 5e de TPU de Cloud con Vertex AI. Se trata de una plataforma integral para crear modelos de IA en una infraestructura totalmente gestionada que se ha creado especialmente para ofrecer un servicio de baja latencia y un entrenamiento de alto rendimiento.
Precios
Precios de las TPU de Cloud | Todos los precios de las TPU de Cloud se aplican por hora de chip | ||
---|---|---|---|
Versión de TPU de Cloud | Precio de evaluación (USD) | Compromiso de 1 año (USD) | Compromiso de 3 años (USD) |
TPU de Cloud v.5p | Starting at 4,2000 USD por hora de chip | Starting at 2,9400 USD por hora de chip | Starting at 1,8900 USD por hora de chip |
TPU de Cloud (5ª versión) | Starting at 1,2000 USD por hora de chip | Starting at 0,8400 USD por hora de chip | Starting at 0,5400 USD por hora de chip |
Los precios de las TPU de Cloud varían según el producto y la región. Consulta los detalles.
Precios de las TPU de Cloud
Todos los precios de las TPU de Cloud se aplican por hora de chip
TPU de Cloud v.5p
Starting at
4,2000 USD
por hora de chip
Starting at
2,9400 USD
por hora de chip
Starting at
1,8900 USD
por hora de chip
TPU de Cloud (5ª versión)
Starting at
1,2000 USD
por hora de chip
Starting at
0,8400 USD
por hora de chip
Starting at
0,5400 USD
por hora de chip
Los precios de las TPU de Cloud varían según el producto y la región. Consulta los detalles.