AI Hypercomputer

在为 Google 提供支持的智能体原生基础设施上训练、部署和运行 AI 应用。

AI Hypercomputer

在为 Google 提供支持的智能体原生基础设施上训练、部署和运行 AI 应用。

什么是 AI Hypercomputer?

一种结合了专用硬件、开源软件和灵活使用模式的架构。每个组件都经过精心集成,可协同工作,从而提升性能、降低成本并提高开发者工作效率。

查看最新公告(2026 年 4 月)Google AI 基础设施新动向:为智能体时代提供规模化支撑

AI Hypercomputer 架构图

更智能、更快速的训练

在数周(而非数月)内构建模型。使用 Google 的训练栈可加快开发和测试速度,同时不影响性能。

使用 TPU 8t,并结合 Google DeepMind 共同设计的软件以及与开源框架(从 PathwaysPallas [训练],从 RayAgent Sandbox [调优])集成的软件,可将 LLM 的开发速度提高 36%,并从每个加速器中挤出高达 97% 的效率 (Goodput)。我们也知道,没有一种解决方案可以满足所有需求,因此我们与 NVIDIA 密切合作,提供最新的 GPU;Google Cloud 将成为首批提供基于新一代 NVIDIA Vera Rubin NVL72(将于今年晚些时候推出)的实例的云服务提供商之一。

Gemini Enterprise Agent PlatformBigQuery 搭配使用,将数据资产、机器学习开发和加速器整合到一处,以快 16 倍的速度基于专有数据训练模型。无论您使用 G4 虚拟机还是 Ironwood TPU,都由 AI Hypercomputer 提供支持。

在 DeepMind 的 MuJoCo-Warp 上运行基于 GPU 的模拟,速度比标准 MuJoCo 快 100 倍。然后,使用 Veo、Genie 和 Nano Banana 的合成媒体模拟不可能、有风险或成本高昂的极端情况,或者在 BigQuery 中注入 PB 级的真实传感器数据。如需详细了解如何在 Google Cloud 上构建物理智能体,请点击此处

响应迅速、高效的推理

获取经过验证的模型配置文件,以及完全集成的 Google 软件和开源软件,以更低的复杂性和浪费提高应用响应能力。

使用集成式推理技术为客户提供实用、响应迅速的服务。利用 GKE Inference Gateway 将首 token 延迟时间缩短 71%,使用 llm-d 进行分离式服务每秒可提供多达 12 万个 token,并使用 Anywhere Cache 和 TPU 8i 将模型加载速度提升到原来的 5 倍,从而将工作内存保持在需要的位置。

使用 Gemini Enterprise Agent Platform 提供的 200 多个模型之一,以 70% 更快的速度部署传统机器学习模型,并使用您选择的 TPU 或 GPU,包括 A5X 虚拟机 (NVIDIA Vera Rubin) 和 TPU 8i(将于今年晚些时候推出)。

在 GKE Agent Sandbox 中安全地部署大量智能体,每秒预配多达 300 个沙盒,并根据需要即时暂停和恢复,因此您永远不会为闲置的智能体付费。

推理堆栈

灵活、开放、可靠的运营

在混合云和多云环境中,使用任何框架或加速器,并利用适合 E 级规模的自动集群维护和管理功能。

operations

TorchTPU 通过提供原生 PyTorch 支持,消除了开发者的 TPU 学习曲线,让您无需重写复杂的代码即可使用最佳可用的加速器。

GKE 基于开源 Kubernetes,可提供企业级规模的多云可移植性,支持多达 13 万个节点,同时与 Agent Platform 和 Google Distributed Cloud 原生集成,实现混合部署。

AI Hypercomputer 上的每个加速器都由 Cluster Director 功能提供支持,包括部署前健康状况清单、360 度可观测性信息中心和始终开启的健康状况检查。

使用跨云网络(一个深受《财富》100 强中超过 65% 的公司信赖的网络主干,每月传输超过 27 EB 的数据),在不同云之间连接服务,而不会出现连接延迟。

我们灵活的使用模式为您提供了多种调度和降低加速器成本的方法。使用 Spot 虚拟机,批量作业或容错作业可节省高达 91% 的费用;使用动态工作负载调度器,开始日期灵活的作业可节省高达 50% 的费用;注册承诺使用折扣,可节省高达 50% 的费用。

可供智能体使用的系统

在 Google 和前沿 AI 实验室信赖的基础设施基础上进行扩缩时,突破性能极限,以负责任的方式使用能源

Google Cloud 为排名前 10 的 AI 实验室中的 9 家以及 70% 获得融资的 AI 初创公司提供支持。通过在 AI Hypercomputer 上部署,您将使用数据中心,这些数据中心仅在 2025 年 12 月就为近 350 家客户可靠地处理了超过 1, 000 亿个 token。

Google Cloud 的数据中心(包括 AI Hypercomputer)提供业界领先的能源效率,每单位电量的计算能力是五年前的六倍。这使得我们的第 8 代 TPU 的性价比比上一代高 80%,能效高 20%。

Google 承诺支付数据中心使用的全部电力费用,以及由我们的发展直接推动的任何新基础设施成本。与我们合作,确保在您调整 AI 目标的同时,当地家庭和企业不会为此付出代价。在未来几年,我们将资助新的电力和基础设施来部署我们的模型,并继续投资于先进核能地热能长时储能等替代能源。

我们的 Titanium 架构采用定制的 Titan 芯片,可提供可验证的硬件信任根和零信任安全性。cloudvulndb.org 的独立分析表明,与其他领先的云服务相比,我们的系统遇到的严重漏洞最多可减少 70%。

系统

为全球领先的创新者提供助力

WPP 如何借助 G4 虚拟机将类人机器人训练速度提升 10 倍
WPP 利用 Google Cloud 的 G4 虚拟机和 NVIDIA Isaac Sim 大幅优化了类人机器人的训练,将强化学习周期从 24 小时缩短到不到 1 小时。通过在模拟环境中掌握跳舞等复杂的人类动作,他们正在弥合“模拟到现实”的差距,为电影和营销行业实现更精准、更自然的机器人动作。
WPP 类人机器人培训
深入了解
AI 让体育迷变身运动套装设计师
Puma 与 Google Cloud 合作以利用其集成式 AI 基础设施 (AI Hypercomputer),通过本次合作可以使用 Gemini 处理用户提示并使用动态工作负载调度器在 GPU 上动态扩缩推理,从而大幅降低成本和生成时间。
Puma AI 工具包设计师
3:20
深入了解
帮助没有编码专业知识的一线工厂工人构建自己的 AI 解决方案
Toyota 选择 Google Cloud 是因为 Google Kubernetes Engine 具有独特的扩缩性能 - 在测试中比竞争对手快四倍 - 这提供了关键的速度和响应能力,有助于成功地将 AI 普及到一线工厂工人。
Toyota 工厂
深入了解
构建强大的双语基础模型来解决复杂的业务问题
其解决方案加快了 AI 开发速度,将性能提升了 1.3 倍,并实现了 LG 旗下各公司安全、企业级的人机协作。
LG AI 模型协作
2:46
深入了解
美国职业棒球大联盟借助 AI Hypercomputer 上的智能体,更快地为球队和球迷提供服务
美国职业棒球大联盟使用 AI Hypercomputer 构建 AI 智能体,将开发时间从数月缩短到数周,将突发事件响应时间从数小时缩短到数秒。
MLB 棒球场
3:19
深入了解

详细了解 AI Hypercomputer

即刻开启您的 AI 探索之旅

联系我们的一位基础设施专家,与他们一起集思广益、探讨您的下一个项目或观看演示。