¿Qué es AI Hypercomputer?
Una arquitectura que combina hardware creado para un propósito específico, software abierto y consumo flexible. Cada componente se integra cuidadosamente para funcionar bien en conjunto, lo que mejora tu rendimiento, costo y productividad de los desarrolladores.
Consulta los anuncios más recientes (abril de 2026): Qué sigue en la infraestructura de IA de Google: Escalabilidad para la era de los agentes

Entrenamiento más inteligente y rápido
Crea modelos en semanas, no en meses. Usa la pila de entrenamiento de Google para acelerar el desarrollo y las pruebas sin sacrificar el rendimiento.
Entrena y ajusta LLM más rápido
Desarrolla LLM un 36% más rápido y aprovecha hasta un 97% de productividad (Goodput) de cada acelerador con TPU 8t junto con software diseñado en colaboración con Google DeepMind e integrado en frameworks de código abierto, desde Pathways hasta Pallas (entrenamiento) y desde Ray hasta Agent Sandbox (ajuste). También sabemos que no hay una solución única para todos, por lo que trabajamos en estrecha colaboración con NVIDIA para ofrecer las GPUs más recientes. Google Cloud estará entre los primeros en ofrecer instancias basadas en la NVIDIA Vera Rubin NVL72 de próxima generación cuando esté disponible a finales de este año.
Entrena modelos ligeros de forma más inteligente con datos propios
Usa Gemini Enterprise Agent Platform con BigQuery para entrenar modelos con datos propios 16 veces más rápido combinando tu patrimonio de datos, el desarrollo de AA y los aceleradores en un solo lugar. Ambos están potenciados por AI Hypercomputer, ya sea que uses VMs G4 o TPUs Ironwood.
Crea agentes físicos adaptables con MuJoCo-Warp
Ejecuta simulaciones basadas en GPU en MuJoCo-Warp de DeepMind, hasta 100 veces más rápido que MuJoCo estándar. Luego, simula casos extremos imposibles, riesgosos o costosos con medios sintéticos de Veo, Genie y Nano Banana, o bien, transfiere petabytes de datos de sensores del mundo real en BigQuery. Obtén más información para crear agentes físicos en Google Cloud aquí.
Inferencia eficiente y responsiva
Obtén perfiles de modelos validados y software de Google y de código abierto totalmente integrado para mejorar la capacidad de respuesta de las aplicaciones con menos complejidad y desperdicio.
Entrega LLM con latencia casi nula
Usar tecnologías de inferencia integradas para ofrecer servicios útiles y responsivos a los clientes. Reduce el tiempo hasta el primer token en un 71% con GKE Inference Gateway, entrega hasta 120,000 tokens por segundo con llm-d para la entrega desagregada y carga modelos 5 veces más rápido con Anywhere Cache y TPU 8i para mantener tu memoria de trabajo exactamente donde se necesita.
Entrega modelos visuales, de percepción y de medios previamente compilados
Implementa modelos de AA clásicos un 70% más rápido con uno de los más de 200 modelos disponibles en Gemini Enterprise Agent Platform, con la TPU o GPU que elijas, incluidas las VMs A5X (NVIDIA Vera Rubin) y la TPU 8i cuando estén disponibles más adelante este año.
Atiende a los agentes de forma segura y rentable
Entrega enjambres de agentes de forma segura en GKE Agent Sandbox, aprovisionando hasta 300 zonas de pruebas por segundo mientras pausas y reanudas al instante según sea necesario, para que nunca pagues por agentes inactivos.

Operaciones flexibles, abiertas y confiables
Usa cualquier framework o acelerador en entornos híbridos y de múltiples nubes con mantenimiento y administración de clústeres automatizados aptos para exaescala.

Cambia entre TPU y GPU sin reescribir el código
TorchTPU elimina la curva de aprendizaje de TPU para los desarrolladores proporcionando compatibilidad nativa con PyTorch, por lo que puedes usar el mejor acelerador disponible sin reescribir el código de forma compleja.
Implementa IA en cualquier entorno a prácticamente cualquier escala
Basado en Kubernetes de código abierto, GKE te ofrece portabilidad en múltiples nubes con escala empresarial, ya que admite hasta 130,000 nodos y se integra de forma nativa con Agent Platform y Google Distributed Cloud para implementaciones híbridas.
Automatiza el mantenimiento de clústeres con herramientas avanzadas de diagnóstico y observabilidad de clústeres
Todos los aceleradores en AI Hypercomputer son compatibles con las capacidades de Cluster Director, que incluyen un estado de salud previo a la implementación, paneles de observabilidad de 360 grados y verificaciones de estado permanentes.
Conecta cargas de trabajo de múltiples nubes en minutos en lugar de semanas
Conecta servicios en todas las nubes sin conexiones lentas con Red Multinube, una red troncal de confianza para más del 65% de las empresas de Fortune 100 que mueve más de 27 exabytes de datos por mes.
Obtén capacidad de aceleración a tu manera
Nuestros modelos de consumo flexibles te ofrecen varias formas de programar y reducir el costo de los aceleradores. Ahorra hasta un 91% en trabajos por lotes o tolerantes a errores con VMs Spot, hasta un 50% en trabajos con una fecha de inicio flexible con el programador dinámico de cargas de trabajo y hasta un 50% de descuento cuando te registras para obtener descuentos por compromiso de uso.
Sistemas listos para agentes
Supera los límites de rendimiento y usa la energía de forma responsable a medida que escalas en la base de infraestructura en la que confían Google y los laboratorios de IA de vanguardia
Reduce los riesgos de tu hoja de ruta de IA con una base confiable
Google Cloud respalda a 9 de los 10 principales laboratorios de IA y al 70% de las startups de IA financiadas. Cuando implementas en AI Hypercomputer, usas centros de datos que procesaron de manera confiable más de 100,000 millones de tokens para casi 350 clientes solo en diciembre de 2025.
Logra una eficiencia energética líder en la industria
Los centros de datos de Google Cloud, incluido AI Hypercomputer, ofrecen una eficiencia energética líder en la industria, con seis veces más potencia de procesamiento por unidad de electricidad que hace cinco años. Esto permite que nuestra TPU de 8ª generación ofrezca un 80% mejor relación precio-rendimiento y un 20% más de eficiencia energética que la generación anterior.
Reduce tu impacto en la red y las comunidades
Google se compromete a pagar el 100% de la energía que usan nuestros centros de datos y cualquier costo de infraestructura nuevo que se deba directamente a nuestro crecimiento. Asóciate con nosotros para garantizar que, a medida que aumenten tus ambiciones de IA, los hogares y las empresas locales no paguen la cuenta. En los próximos años, financiaremos nueva energía e infraestructura para nuestros modelos y seguiremos invirtiendo en fuentes de energía alternativas como la nuclear avanzada, la geotérmica y el almacenamiento de larga duración.
Protege tu IP más valiosa desde el silicio hasta el perímetro
Los chips Titan personalizados de nuestra arquitectura Titanium ofrecen una raíz de confianza de hardware verificable y seguridad de confianza cero. En un análisis independiente de cloudvulndb.org, se muestra que nuestros sistemas experimentan hasta un 70% menos de vulnerabilidades críticas que otras nubes líderes.

Impulsamos a los innovadores líderes del mundo










Lectura de 5 min
Lectura de 5 min
Lectura de 5 min
Curso de 2 horas
Guía de 15 minutos
Guía de 15 minutos
Guía de 15 minutos
Guía de 15 minutos
Lectura de 15 min
Lectura de 15 min
Lectura de 5 min
Lectura de 5 min
Lectura de 5 min
Curso de 2 horas
Guía de 15 minutos
Guía de 15 minutos
Guía de 15 minutos
Guía de 15 minutos
Lectura de 15 min
Lectura de 15 min