Unidad de procesamiento de tensor (TPU) de Ironwood

Ironwood: la TPU de 7.ª generación de Google Cloud diseñada para la inferencia

Entrena, ajusta y sirve modelos y conjuntos de datos más grandes de forma eficiente con la TPU más potente hasta la fecha.

Solicita más información sobre Ironwood.

Nombre

Apellidos

Correo de empresa

Prefijo de llamada

Teléfono de empresa

Cargo

Nombre de la empresa

Quiero darme de alta para que Google me envíe noticias, novedades de productos, información de eventos y ofertas especiales de Google Cloud.

Acepto que mis datos personales se traten de acuerdo con la Política de Privacidad de Google.

¿Tu infraestructura está preparada para la era de la inferencia?

Ironwood es la unidad de procesamiento de tensor (TPU) más potente, eficaz y eficiente energéticamente de Google hasta la fecha, diseñada para alimentar modelos de IA inferencial y de pensamiento a escala. Ironwood se ha desarrollado a partir de la amplia experiencia de Google en el desarrollo de TPUs para sus servicios internos y para los clientes de Google Cloud. Está diseñado para gestionar las demandas de computación y memoria de modelos como los modelos de lenguaje extenso (LLMs), las mezclas de expertos y las tareas de razonamiento avanzadas. Admite tanto cargas de entrenamiento como de servicio en la arquitectura de AI Hypercomputer de Google Cloud.

Optimización para modelos de lenguaje extensos (LLMs): Ironwood se ha diseñado específicamente para satisfacer las crecientes necesidades de los LLMs y las aplicaciones de IA generativa.
Tecnología de interconexión mejorada: aprovecha las mejoras de la tecnología de interconexión de TPU, que permite una comunicación más rápida y una latencia reducida.
Computación de alto rendimiento: disfruta de mejoras significativas en el rendimiento para una amplia gama de tareas de inferencia.
IA sostenible: Ironwood continúa el compromiso de Google Cloud con la sostenibilidad, ofreciendo un rendimiento excepcional con una eficiencia energética optimizada

Ironwood integra una mayor densidad de computación, capacidad de memoria y ancho de banda de interconexión con mejoras significativas en la eficiencia energética. Estas funciones están diseñadas para ofrecer un mayor rendimiento y una latencia más baja en las cargas de trabajo exigentes de inferencia y entrenamiento de IA, especialmente en las que se usan modelos grandes y complejos. Las TPUs de Ironwood funcionan en la arquitectura de AI Hypercomputer de Google Cloud.

Los productos de inteligencia artificial de Cloud cumplen las políticas del acuerdo de nivel de servicio. Pueden ofrecer garantías de latencia o disponibilidad diferentes respecto a otros servicios de Google Cloud.