Cloud Tensor Processing Unit (TPU)

Acelera el desarrollo de IA con Google Cloud TPU

Cloud TPU optimiza el rendimiento y el costo de todas las cargas de trabajo de IA, desde el entrenamiento hasta la inferencia. Gracias a la infraestructura de centros de datos de primer nivel, las TPU ofrecen alta confiabilidad, disponibilidad y seguridad.

¿No sabes si las TPU son adecuadas? Aprende cuándo usar GPU o CPU en las instancias de Compute Engine para ejecutar tus cargas de trabajo de aprendizaje automático.

Descripción general

¿Qué es una unidad de procesamiento tensorial (TPU)?

Las Google Cloud TPU son aceleradoras de IA con diseño personalizado que están optimizadas para el entrenamiento y la inferencia de grandes modelos de IA. Son ideales para una variedad de casos de uso, como chatbots, generación de código, generación de contenido multimedia, voz sintética, servicios de visión, motores de recomendaciones y modelos de personalización, entre otros. 

¿Cuáles son las ventajas de las Cloud TPU?

Las Cloud TPU están diseñadas para escalar de manera rentable en una amplia variedad de cargas de trabajo de IA, que abarcan el entrenamiento, los ajustes y la inferencia. Las Cloud TPU proporcionan la versatilidad necesaria para acelerar las cargas de trabajo en frameworks de IA líderes, como PyTorch, JAX y TensorFlow. Organiza sin problemas cargas de trabajo de IA a gran escala a través de la integración de Cloud TPU en Google Kubernetes Engine (GKE). Los clientes que buscan la forma más sencilla de desarrollar modelos de IA también pueden aprovechar las Cloud TPU en Vertex AI, una plataforma de IA completamente administrada.

¿Cuándo usar Cloud TPUs?

Las Cloud TPU están optimizadas para el entrenamiento de modelos de aprendizaje profundo grandes y complejos que presentan muchos cálculos de matrices, por ejemplo, la creación de modelos de lenguaje extenso (LLM). Las Cloud TPU también tienen SparseCores, que son procesadores de Dataflow que aceleran los modelos que se basan en incorporaciones que se encuentran en los modelos de recomendación. Otros casos de uso incluyen la atención médica, como el modelado de plegamiento de proteínas y el descubrimiento de fármacos.

¿En qué se diferencian las Cloud TPU de las GPU?

Una GPU es un procesador especializado y diseñado originalmente para manipular gráficos por computadora. Su estructura paralela las hace ideales para los algoritmos que procesan grandes bloques de datos que suelen encontrarse en las cargas de trabajo de IA. Obtener más información.

Una TPU es un circuito integrado específico de la aplicación (ASIC) diseñado por Google para redes neuronales. Las TPU poseen funciones especializadas, como las unidades de multiplicación de matrices (MXU) y la topología de interconexión patentada, que las hacen ideales para acelerar el entrenamiento y la inferencia de la IA.

Versiones de Cloud TPU

Versión de Cloud TPUDescripciónDisponibilidad

Cloud TPU v5p

La Cloud TPU más potente para entrenar modelos de IA

Cloud TPU v5p estará disponible en Norteamérica (región del este de EE.UU.)

Cloud TPU v5e

La Cloud TPU más eficiente, versátil y escalable

Cloud TPU v5e está disponible para el público general en Norteamérica (regiones Oeste y Este de EE.UU.).

Cloud TPU v5p está disponible en Norteamérica (us-east5) durante la Versión preliminar.

Cloud TPU v5p

Descripción

La Cloud TPU más potente para entrenar modelos de IA

Disponibilidad

Cloud TPU v5p estará disponible en Norteamérica (región del este de EE.UU.)

Cloud TPU v5e

Descripción

La Cloud TPU más eficiente, versátil y escalable

Disponibilidad

Cloud TPU v5e está disponible para el público general en Norteamérica (regiones Oeste y Este de EE.UU.).

Cloud TPU v5p está disponible en Norteamérica (us-east5) durante la Versión preliminar.

Cómo funciona

Descubre la magia de las Google Cloud TPU, incluida una vista inusual de los centros de datos en los que todo ocurre. Los clientes usan las Cloud TPU para ejecutar algunas de las cargas de trabajo de IA más grandes del mundo, y esa potencia proviene de mucho más que un chip. En este video, observarás los componentes del sistema de TPU, incluidas las redes de los centros de datos, los interruptores de circuitos ópticos, los sistemas de enfriamiento de agua, la verificación de seguridad biométrica y mucho más.

Reemplazar con el video de TPU.

Usos comunes

Ejecuta cargas de trabajo de entrenamiento de IA a gran escala

Entrenamiento de IA potente, escalable y eficiente

El entrenamiento de Cloud TPU Multislice es una tecnología de pila completa que permite entrenar modelos de IA a gran escala de manera rápida, fácil y confiable en decenas de miles de chips TPU.

Escalamiento casi lineal a decenas de miles de chips con el entrenamiento de Multislice

Entrenamiento de IA potente, escalable y eficiente

El entrenamiento de Cloud TPU Multislice es una tecnología de pila completa que permite entrenar modelos de IA a gran escala de manera rápida, fácil y confiable en decenas de miles de chips TPU.

Escalamiento casi lineal a decenas de miles de chips con el entrenamiento de Multislice

Ajusta los modelos de base de IA

Adapta los LLM a tus aplicaciones con Pytorch/XLA

Ajusta de manera eficaz los modelos de base a través del aprovechamiento de tus propios datos de entrenamiento que representan tu caso de uso. Cloud TPU v5e ofrece un rendimiento de ajuste de los LLM hasta 1.9 veces superior por dólar en comparación con Cloud TPU v4.

Rendimiento del ajuste de Cloud TPU LLM/$

    Adapta los LLM a tus aplicaciones con Pytorch/XLA

    Ajusta de manera eficaz los modelos de base a través del aprovechamiento de tus propios datos de entrenamiento que representan tu caso de uso. Cloud TPU v5e ofrece un rendimiento de ajuste de los LLM hasta 1.9 veces superior por dólar en comparación con Cloud TPU v4.

    Rendimiento del ajuste de Cloud TPU LLM/$

      Entrega cargas de trabajo de inferencia de IA a gran escala

      Maximiza el rendimiento/$ con infraestructura de IA que escala

      Cloud TPU v5e permite una inferencia rentable y de alto rendimiento para una amplia variedad de cargas de trabajo de IA, incluidos los LLMs y los modelos de IA generativa más recientes. TPU v5e ofrece hasta 2.5 veces más rendimiento por dólar y 1.7 veces más velocidad en comparación con Cloud TPU v4. Cada chip TPU v5e proporciona hasta 393 billones de operaciones int8 por segundo, lo que permite que los modelos complejos hagan predicciones rápidas. Un pod de TPU v5e ofrece hasta 100,000 billones de operaciones int8 por segundo o 100 petaOps de potencia de procesamiento.

      Más información aquí
      Pod de Cloud TPU v5e

      Maximiza el rendimiento/$ con infraestructura de IA que escala

      Cloud TPU v5e permite una inferencia rentable y de alto rendimiento para una amplia variedad de cargas de trabajo de IA, incluidos los LLMs y los modelos de IA generativa más recientes. TPU v5e ofrece hasta 2.5 veces más rendimiento por dólar y 1.7 veces más velocidad en comparación con Cloud TPU v4. Cada chip TPU v5e proporciona hasta 393 billones de operaciones int8 por segundo, lo que permite que los modelos complejos hagan predicciones rápidas. Un pod de TPU v5e ofrece hasta 100,000 billones de operaciones int8 por segundo o 100 petaOps de potencia de procesamiento.

      Más información aquí
      Pod de Cloud TPU v5e

      Cloud TPU en GKE

      Escalamiento sin esfuerzo con GKE

      Combina la potencia de las Cloud TPUs con la flexibilidad y escalabilidad de GKE para compilar y, luego, implementar modelos de aprendizaje automático más rápido y con más facilidad que nunca. Con las Cloud TPUs disponibles en GKE, ahora puedes tener un solo entorno de operaciones coherente para todas tus cargas de trabajo, lo que estandariza las canalizaciones automatizadas de MLOps.

      TPU en la arquitectura de GKE

      Escalamiento sin esfuerzo con GKE

      Combina la potencia de las Cloud TPUs con la flexibilidad y escalabilidad de GKE para compilar y, luego, implementar modelos de aprendizaje automático más rápido y con más facilidad que nunca. Con las Cloud TPUs disponibles en GKE, ahora puedes tener un solo entorno de operaciones coherente para todas tus cargas de trabajo, lo que estandariza las canalizaciones automatizadas de MLOps.

      TPU en la arquitectura de GKE

      Cloud TPU en Vertex AI

      Vertex AI Training y Prediction con Cloud TPUs

      Para los clientes que buscan una forma más sencilla de desarrollar modelos de IA, pueden implementar Cloud TPU v5e con Vertex AI, una plataforma de extremo a extremo para crear modelos de IA en una infraestructura completamente administrada creada para brindar entregas de latencia baja y un entrenamiento de alto rendimiento.

      Vertex AI Training y Prediction con Cloud TPUs

      Para los clientes que buscan una forma más sencilla de desarrollar modelos de IA, pueden implementar Cloud TPU v5e con Vertex AI, una plataforma de extremo a extremo para crear modelos de IA en una infraestructura completamente administrada creada para brindar entregas de latencia baja y un entrenamiento de alto rendimiento.

      Precios

      Precios de Cloud TPUTodos los precios de Cloud TPU se calculan por hora de chip.
      Versión de Cloud TPUPrecio de evaluación (USD)Compromiso por 1 año (USD)Compromiso por 3 años (USD)

      Cloud TPU v5p

      Starting at

      $4.2000

      por hora chip

      Starting at

      $2.9400

      por hora chip

      Starting at

      $1.8900

      por hora chip

      Cloud TPU v5e

      Starting at

      $1.2000

      por hora chip

      Starting at

      $0.8400

      por hora chip

      Starting at

      $0.5400

      por hora chip

      Los precios de Cloud TPU varían según el producto y la región.Consulta los detalles aquí.

      Precios de Cloud TPU

      Todos los precios de Cloud TPU se calculan por hora de chip.

      Cloud TPU v5p

      Precio de evaluación (USD)

      Starting at

      $4.2000

      por hora chip

      Compromiso por 1 año (USD)

      Starting at

      $2.9400

      por hora chip

      Compromiso por 3 años (USD)

      Starting at

      $1.8900

      por hora chip

      Cloud TPU v5e

      Precio de evaluación (USD)

      Starting at

      $1.2000

      por hora chip

      Compromiso por 1 año (USD)

      Starting at

      $0.8400

      por hora chip

      Compromiso por 3 años (USD)

      Starting at

      $0.5400

      por hora chip

      Los precios de Cloud TPU varían según el producto y la región.Consulta los detalles aquí.

      CALCULADORA DE PRECIOS

      Estima tus costos mensuales de Cloud TPU, incluidos los precios y las tarifas específicos de una región.

      COTIZACIÓN PERSONALIZADA

      Comunícate con nuestro equipo de Ventas a fin de obtener una cotización personalizada para tu organización.

      Comienza tu prueba de concepto

      Prueba Cloud TPU gratis

      Obtén una introducción breve al uso de Cloud TPU

      Ejecuta TensorFlow en la VM de Cloud TPU

      Ejecuta JAX en la VM de Cloud TPU

      Ejecuta PyTorch en la VM de Cloud TPU

      Google Cloud
      • ‪English‬
      • ‪Deutsch‬
      • ‪Español‬
      • ‪Español (Latinoamérica)‬
      • ‪Français‬
      • ‪Indonesia‬
      • ‪Italiano‬
      • ‪Português (Brasil)‬
      • ‪简体中文‬
      • ‪繁體中文‬
      • ‪日本語‬
      • ‪한국어‬
      Consola
      • Ahorra dinero con nuestro enfoque transparente de precios
      • Los precios de prepago de Google Cloud ofrecen ahorros automáticos en función del uso mensual y las tarifas con descuento para recursos prepagados. Comunícate con nosotros hoy para obtener una cotización.
      Google Cloud