AI Hypercomputer

Entrena, entrega y opera tus aplicaciones de IA en la infraestructura nativa de agentes que impulsa Google.

AI Hypercomputer

Entrena, entrega y opera tus aplicaciones de IA en la infraestructura nativa de agentes que impulsa Google.

¿Qué es AI Hypercomputer?

Una arquitectura que combina hardware creado para un propósito específico, software abierto y consumo flexible. Cada componente se integra cuidadosamente para funcionar bien en conjunto, lo que mejora tu rendimiento, costo y productividad de los desarrolladores.

Consulta los anuncios más recientes (abril de 2026): Qué sigue en la infraestructura de IA de Google: Escalabilidad para la era de los agentes 

Diagrama de arquitectura de AI Hypercomputer

Entrenamiento más inteligente y rápido

Crea modelos en semanas, no en meses. Usa la pila de entrenamiento de Google para acelerar el desarrollo y las pruebas sin sacrificar el rendimiento.

Desarrolla LLM un 36% más rápido y aprovecha hasta un 97% de productividad (Goodput) de cada acelerador con TPU 8t junto con software diseñado en colaboración con Google DeepMind e integrado en frameworks de código abierto, desde Pathways hasta Pallas (entrenamiento) y desde Ray hasta Agent Sandbox (ajuste). También sabemos que no hay una solución única para todos, por lo que trabajamos en estrecha colaboración con NVIDIA para ofrecer las GPUs más recientes. Google Cloud estará entre los primeros en ofrecer instancias basadas en la NVIDIA Vera Rubin NVL72 de próxima generación cuando esté disponible a finales de este año. 

Usa Gemini Enterprise Agent Platform con BigQuery para entrenar modelos con datos propios 16 veces más rápido combinando tu patrimonio de datos, el desarrollo de AA y los aceleradores en un solo lugar. Ambos están potenciados por AI Hypercomputer, ya sea que uses VMs G4 o TPUs Ironwood

Ejecuta simulaciones basadas en GPU en MuJoCo-Warp de DeepMind, hasta 100 veces más rápido que MuJoCo estándar. Luego, simula casos extremos imposibles, riesgosos o costosos con medios sintéticos de Veo, Genie y Nano Banana, o bien, transfiere petabytes de datos de sensores del mundo real en BigQuery. Obtén más información para crear agentes físicos en Google Cloud aquí.

Inferencia eficiente y responsiva

Obtén perfiles de modelos validados y software de Google y de código abierto totalmente integrado para mejorar la capacidad de respuesta de las aplicaciones con menos complejidad y desperdicio.

Usar tecnologías de inferencia integradas para ofrecer servicios útiles y responsivos a los clientes. Reduce el tiempo hasta el primer token en un 71% con GKE Inference Gateway, entrega hasta 120,000 tokens por segundo con llm-d para la entrega desagregada y carga modelos 5 veces más rápido con Anywhere Cache y TPU 8i para mantener tu memoria de trabajo exactamente donde se necesita.

Implementa modelos de AA clásicos un 70% más rápido con uno de los más de 200 modelos disponibles en Gemini Enterprise Agent Platform, con la TPU o GPU que elijas, incluidas las VMs A5X (NVIDIA Vera Rubin) y la TPU 8i cuando estén disponibles más adelante este año.

Entrega enjambres de agentes de forma segura en GKE Agent Sandbox, aprovisionando hasta 300 zonas de pruebas por segundo mientras pausas y reanudas al instante según sea necesario, para que nunca pagues por agentes inactivos.

Pila de inferencia

Operaciones flexibles, abiertas y confiables

Usa cualquier framework o acelerador en entornos híbridos y de múltiples nubes con mantenimiento y administración de clústeres automatizados aptos para exaescala.

operations

TorchTPU elimina la curva de aprendizaje de TPU para los desarrolladores proporcionando compatibilidad nativa con PyTorch, por lo que puedes usar el mejor acelerador disponible sin reescribir el código de forma compleja.

Basado en Kubernetes de código abierto, GKE te ofrece portabilidad en múltiples nubes con escala empresarial, ya que admite hasta 130,000 nodos y se integra de forma nativa con Agent Platform y Google Distributed Cloud para implementaciones híbridas.

Todos los aceleradores en AI Hypercomputer son compatibles con las capacidades de Cluster Director, que incluyen un estado de salud previo a la implementación, paneles de observabilidad de 360 grados y verificaciones de estado permanentes.

Conecta servicios en todas las nubes sin conexiones lentas con Red Multinube, una red troncal de confianza para más del 65% de las empresas de Fortune 100 que mueve más de 27 exabytes de datos por mes.

Nuestros modelos de consumo flexibles te ofrecen varias formas de programar y reducir el costo de los aceleradores. Ahorra hasta un 91% en trabajos por lotes o tolerantes a errores con VMs Spot, hasta un 50% en trabajos con una fecha de inicio flexible con el programador dinámico de cargas de trabajo y hasta un 50% de descuento cuando te registras para obtener descuentos por compromiso de uso.

Sistemas listos para agentes

Supera los límites de rendimiento y usa la energía de forma responsable a medida que escalas en la base de infraestructura en la que confían Google y los laboratorios de IA de vanguardia

Google Cloud respalda a 9 de los 10 principales laboratorios de IA y al 70% de las startups de IA financiadas. Cuando implementas en AI Hypercomputer, usas centros de datos que procesaron de manera confiable más de 100,000 millones de tokens para casi 350 clientes solo en diciembre de 2025.

Los centros de datos de Google Cloud, incluido AI Hypercomputer, ofrecen una eficiencia energética líder en la industria, con seis veces más potencia de procesamiento por unidad de electricidad que hace cinco años. Esto permite que nuestra TPU de 8ª generación ofrezca un 80% mejor relación precio-rendimiento y un 20% más de eficiencia energética que la generación anterior.

Google se compromete a pagar el 100% de la energía que usan nuestros centros de datos y cualquier costo de infraestructura nuevo que se deba directamente a nuestro crecimiento. Asóciate con nosotros para garantizar que, a medida que aumenten tus ambiciones de IA, los hogares y las empresas locales no paguen la cuenta. En los próximos años, financiaremos nueva energía e infraestructura para nuestros modelos y seguiremos invirtiendo en fuentes de energía alternativas como la nuclear avanzada, la geotérmica y el almacenamiento de larga duración.

Los chips Titan personalizados de nuestra arquitectura Titanium ofrecen una raíz de confianza de hardware verificable y seguridad de confianza cero. En un análisis independiente de cloudvulndb.org, se muestra que nuestros sistemas experimentan hasta un 70% menos de vulnerabilidades críticas que otras nubes líderes.

Sistemas

Impulsamos a los innovadores líderes del mundo

Cómo WPP acelera 10 veces el entrenamiento de robots humanoides con VMs G4
WPP optimizó de forma significativa el entrenamiento de robots humanoides aprovechando las VMs G4 de Google Cloud y NVIDIA Isaac Sim, lo que redujo los ciclos de aprendizaje por refuerzo de 24 horas a menos de una hora. Dominando movimientos humanos complejos como el baile en la simulación, están acortando la brecha entre la simulación y la realidad para permitir un movimiento robótico más preciso y natural para las industrias del cine y el marketing.
Capacitación sobre robots humanoides de WPP
Obtener más información
La IA convierte a los fans del deporte en diseñadores de indumentaria
Puma se asoció con Google Cloud para su infraestructura de IA integrada (AI Hypercomputer), lo que le permite usar Gemini para instrucciones del usuario junto con el programador dinámico de cargas de trabajo para escalar la inferencia de forma dinámica en GPU, lo que reduce drásticamente los costos y el tiempo de generación.
Diseñador de indumentaria con IA de Puma
3:20
Obtener más información
Ayudar a los trabajadores de primera línea de las fábricas sin experiencia en programación a crear sus propias soluciones de IA
Toyota eligió Google Cloud por el rendimiento de escalamiento único de Google Kubernetes Engine, que fue cuatro veces más rápido que el de los competidores en sus pruebas, lo que proporcionó la velocidad y la capacidad de respuesta fundamentales necesarias para democratizar con éxito la IA para los trabajadores de primera línea de la fábrica.
Fábrica de Toyota
Obtener más información
Creación de un modelo de base bilingüe y potente para resolver problemas empresariales complejos
Su solución aceleró el desarrollo de la IA, mejoró el rendimiento en 1.3 veces y permitió una colaboración segura entre humanos y la IA en toda la empresa y sus filiales.
Colaboración con el modelo de IA de LG
2:46
Obtener más información
Major League Baseball atiende a equipos y fans más rápido con agentes en AI Hypercomputer
Major League Baseball usó AI Hypercomputer para crear agentes de IA, lo que redujo el desarrollo de meses a semanas y la respuesta ante incidentes de horas a segundos.
Estadio de la MLB
3:19
Obtener más información

Más información sobre AI Hypercomputer

Inicia tu recorrido de IA hoy

Comunícate con uno de nuestros expertos en infraestructura para intercambiar ideas, analizar tu próximo proyecto o ver una demostración.

Google Cloud