AI Hypercomputer

在 Google 採用的代理原生基礎架構上,訓練、提供及操作 AI 應用程式。

AI Hypercomputer

在 Google 採用的代理原生基礎架構上,訓練、提供及操作 AI 應用程式。

什麼是 AI Hypercomputer?

結合專用硬體、開放式軟體和彈性使用模式的架構。各項元件都經過精心整合,可順暢運作,進而提升效能、降低成本及提高開發人員工作效率。

查看最新公告 (2026 年 4 月):Google AI 基礎架構的發展方向:因應 AI 代理時代的規模需求

AI Hypercomputer 架構圖

更聰明快速的訓練

不必耗費數月,只要數週內就能建構模型。運用 Google 的訓練堆疊,即可加快開發和測試速度,同時兼顧效能。

使用 TPU 8t 搭配 Google DeepMind 共同設計的軟體,並整合開放原始碼架構,從 PathwaysPallas (訓練),RayAgent Sandbox (調整),可將 LLM 開發速度提升 36%,並將每個加速器的生產力 (Goodput) 提升至 97%。我們也瞭解,單一解決方案無法滿足所有需求,因此與 NVIDIA 密切合作,提供最新的 GPU。今年稍晚,新一代 NVIDIA Vera Rubin NVL72 上市後,Google Cloud 也會搶先提供相關的執行個體。

結合資料資產、機器學習開發和加速器,在 BigQuery 中使用 Gemini Enterprise Agent Platform,以專屬資料訓練模型,速度可提升 16 倍。無論使用 G4 VMIronwood TPU,兩者皆由 AI Hypercomputer 提供支援。

在 DeepMind 的 MuJoCo-Warp 上執行 GPU 模擬,速度比標準 MuJoCo 快 100 倍。接著,使用 Veo、Genie 和 Nano Banana 的合成媒體,模擬不可能、有風險或成本高昂的極端情況,或在 BigQuery 中擷取數 PB 的實際感應器資料。如要進一步瞭解如何在 Google Cloud 建構實體代理,請按這裡

回應迅速且有效率的推論

取得經過驗證的模型設定檔,以及完全整合的 Google 和開放式軟體,以更精簡的方式提升應用程式回應速度,減少資源浪費。

運用整合式推論技術,為客戶提供實用且反應迅速的服務。使用 GKE Inference Gateway 將首個詞元的生成時間縮短 71%,使用 llm-d 進行分散式服務,每秒可提供多達 12 萬個詞元,並使用 Anywhere Cache 和 TPU 8i 將模型載入速度提高 5 倍,確保工作記憶體能隨時派上用場。

Gemini Enterprise Agent Platform 提供超過 200 個模型,可讓您選擇 TPU 或 GPU (包括今年稍晚推出的 A5X VM (NVIDIA Vera Rubin) 和 TPU 8i),以快 70% 的速度部署傳統機器學習模型。

在 GKE Agent Sandbox 中安全地提供大量代理,每秒可佈建多達 300 個沙箱,並視需要立即暫停和恢復,因此您不必為閒置的代理付費。

推論堆疊

彈性、開放、可靠的作業

在混合雲和多雲端環境中,使用任何架構或加速器,並透過自動化叢集維護和管理功能,輕鬆處理超大規模的工作負載。

operations

TorchTPU 提供原生 PyTorch 支援,讓開發人員不必學習 TPU 的相關知識,即可使用最優質的加速器,不必重寫複雜的程式碼。

GKE 以開放原始碼 Kubernetes 為基礎,可讓您在多雲端環境中具備企業規模的可攜性,最多可容納 130,000 個節點。此外,GKE 還能與 Agent Platform 和 Google Distributed Cloud 原生整合,方便您進行混合部署。

AI Hypercomputer 上的每個加速器都支援 Cluster Director 功能,包括部署前健康狀態檢查、360 度觀測資訊主頁,和全天候健康狀態檢查。

您可以使用 Cross-Cloud Network 跨雲端連結各項服務,不必擔心連線延遲。這款骨幹網路受到超過 65% 的《財富》雜誌百大企業信賴,每月處理的資料量超過 27 EB。

我們提供彈性的計費模式,讓您能以多種方式排定加速器使用時間,藉此降低成本。使用 Spot VM 處理批次或容錯工作,最多可省下 91% 的費用;使用 Dynamic Workload Scheduler 處理開始日期有彈性的工作,最多可省下 50% 的費用;註冊承諾使用折扣,最多可省下 50% 的費用。

支援代理的系統

Google 和前沿 AI 研究室都信賴這項基礎架構,您可盡情調度資源,同時兼顧效能和能源使用效率

全球頂尖的 AI 研究室中,有 9 成選擇 Google Cloud,此外,有 70% 已獲融資的 AI 新創公司也是我們的合作夥伴。只要在 AI Hypercomputer 上進行部署,就能使用極其可靠的資料中心,光是 2025 年 12 月,這些中心就已為近 350 位客戶處理超過 1,000 億個詞元。

Google Cloud 的資料中心 (包括 AI Hypercomputer) 擁有業界領先的能源效率,現在每單位電力可提供的運算能力比五年前多六倍。與前一代相比,第 8 代 TPU 的成本效益提升 80%,能源效率也提高 20%。

Google 承諾負擔資料中心 100% 的用電費用,以及因 Google 業務成長而產生的新基礎設施成本。歡迎與我們合作,確保您在擴大 AI 應用規模的同時,不會讓當地家庭和企業承擔額外費用。未來幾年,我們將出資建設新的電力和基礎設施,藉此支援我們的模型,並持續投資替代能源,例如先進核能地熱長時間儲能

我們的 Titanium 架構採用特製的 Titan 晶片,提供可驗證的硬體信任根和零信任安全機制。cloudvulndb.org 的獨立分析顯示,我們的系統發生重大安全漏洞的頻率,比其他一流雲端服務低 70%。

系統

為全球頂尖創新者提供助力

WPP 如何運用 G4 VM 將人形機器人訓練速度提升 10 倍
WPP 運用 Google Cloud 的 G4 VM 和 NVIDIA Isaac Sim,大幅縮短類人型機器人的訓練時間,將強化學習週期從 24 小時縮短至不到 1 小時。透過模擬環境掌握複雜的人類動作 (例如跳舞),他們正在縮小「從模擬到實現」的差距,為電影和行銷產業打造更精準自然的機器人動作。
WPP 人形機器人訓練
深入探究
AI 讓體育迷化身球衣設計師
Puma 與 Google Cloud 合作,採用整合式 AI 基礎架構 (AI Hypercomputer),搭配 Gemini 和 Dynamic Workload Scheduler,根據使用者提示詞,動態調整 GPU 推論規模,大幅降低成本和生成時間。
Puma AI 球衣設計師
3:20
深入探究
協助不具程式設計專業知識的工廠第一線人員,打造專屬 AI 解決方案
Toyota 選擇 Google Cloud 的原因在於 Google Kubernetes Engine 獨特的擴充效能。在 Toyota 的測試中,GKE 的速度比競爭對手快四倍,能提供所需的關鍵速度和反應能力,成功讓第一線工廠員工都能使用 AI。
Toyota 工廠
深入探究
建構強大的雙語基礎模型,解決複雜的業務問題
這項解決方案加速了 AI 開發作業,效能提升 1.3 倍,並讓 LG 集團旗下各公司能安全地在企業層級進行人機協作。
LG AI 模型合作
2:46
深入探究
美國職棒大聯盟運用 AI Hypercomputer 上的代理,更快為球隊和球迷提供服務
美國職棒大聯盟運用 AI Hypercomputer 建構 AI 代理,將開發時間從數月縮短至數週,事件應變時間從數小時縮短至數秒。
MLB 球場
3:19
深入探究

進一步瞭解 AI Hypercomputer

立即開始使用 AI

歡迎與我們的基礎架構專家聯絡,一起發想點子、討論下一個專案,或觀看產品示範。

Google Cloud