AI Hypercomputer

在 Google 採用的代理原生基礎架構上，訓練、提供及操作 AI 應用程式。

AI Hypercomputer

在 Google 採用的代理原生基礎架構上，訓練、提供及操作 AI 應用程式。

新聞與活動

瞭解 Google 在 Gartner®《Magic Quadrant™ for AI Infrastructure》(AI 基礎架構 Magic Quadrant™) 報告中，獲評為領導品牌的原因
閱讀報告，瞭解為何 AI Hypercomputer 在執行力和願景方面都獲得最高評價。
掌握 TPU 最新消息
訂閱我們的郵寄清單，搶先掌握 TPU 新產品發布和活動資訊。
讓開發人員與全球社群交流
我們的 Google Cloud x NVIDIA 社群成員人數已突破 10 萬人，是開發人員交流、分享和向同業學習的最佳平台。

AI 基礎架構的未來

AI Hypercomputer 是一種結合專用硬體、開放式軟體和彈性計費模式的架構。各項元件都經過精心整合，可順暢運作，進而提升效能、降低成本及提高開發人員工作效率。

32:53

更聰明快速的訓練

不必耗費數月，只要數週內就能建構模型。運用 Google 的訓練堆疊，即可加快開發和測試速度，同時兼顧效能。

11:08

加快大型語言模型的訓練和調整速度

使用 TPU 8t 搭配 Google DeepMind 共同設計的軟體，並整合開放原始碼架構，從 Pathways 到 Pallas (訓練)，Ray 到 Agent Sandbox (調整)，可將 LLM 開發速度提升 36%，並將每個加速器的生產力 (Goodput) 提升至 97%。我們也瞭解，單一解決方案無法滿足所有需求，因此與 NVIDIA 密切合作，提供最新的 GPU。今年稍晚，新一代 NVIDIA Vera Rubin NVL72 上市後，Google Cloud 也會搶先提供相關的執行個體。

使用專屬資料，以更聰明的方式訓練輕量級模型

結合資料資產、機器學習開發和加速器，在 BigQuery 中使用 Gemini Enterprise Agent Platform，以專屬資料訓練模型，速度可提升 16 倍。無論使用 G4 VM 或 Ironwood TPU，兩者皆由 AI Hypercomputer 提供支援。

使用 MuJoCo-Warp 建構自動調整式實體代理

在 DeepMind 的 MuJoCo-Warp 上執行 GPU 模擬，速度比標準 MuJoCo 快 100 倍。接著，使用 Veo、Genie 和 Nano Banana 的合成媒體，模擬不可能、有風險或成本高昂的極端情況，或在 BigQuery 中擷取數 PB 的實際感應器資料。如要進一步瞭解如何在 Google Cloud 建構實體代理，請按這裡。

回應迅速且有效率的推論

取得經過驗證的模型設定檔，以及完全整合的 Google 和開放式軟體，以更精簡的方式提升應用程式回應速度，減少資源浪費。

以趨近於零的延遲時間提供大型語言模型

運用整合式推論技術，為客戶提供實用且反應迅速的服務。透過 GKE Inference Gateway 將首個詞元生成時間 (TTFT) 縮短 71%，並利用 llm-d 進行解耦式推論 (disaggregated serving)，每秒可處理多達 12 萬個詞元；此外，搭配使用 Rapid Cache 與 TPU 8i 可將模型載入速度提升 5 倍，確保工作記憶體能精準發揮效用。

提供預先建構的視覺、感知和媒體模型

Gemini Enterprise Agent Platform 提供超過 200 個模型，可讓您選擇 TPU 或 GPU (包括今年稍晚推出的 A5X VM (NVIDIA Vera Rubin) 和 TPU 8i)，以快 70% 的速度部署傳統機器學習模型。

以安全且符合成本效益的方式提供代理服務

在 GKE Agent Sandbox 中安全地提供大量代理，每秒可佈建多達 300 個沙箱，並視需要立即暫停和恢復，因此您不必為閒置的代理付費。

彈性、開放、可靠的作業

在混合雲和多雲端環境中，使用任何架構或加速器，並透過自動化叢集維護和管理功能，輕鬆處理超大規模的工作負載。

無須重寫程式碼，即可在 TPU 和 GPU 之間切換

TorchTPU 提供原生 PyTorch 支援，讓開發人員不必學習 TPU 的相關知識，即可使用最優質的加速器，不必重寫複雜的程式碼。

在任何環境部署 AI，幾乎不受規模限制

GKE 以開放原始碼 Kubernetes 為基礎，可讓您在多雲端環境中具備企業規模的可攜性，最多可容納 130,000 個節點。此外，GKE 還能與 Agent Platform 和 Google Distributed Cloud 原生整合，方便您進行混合部署。

運用進階叢集診斷和觀測工具，自動執行叢集維護作業

AI Hypercomputer 上的每個加速器都支援 Cluster Director 功能，包括部署前健康狀態檢查、360 度觀測資訊主頁，和全天候健康狀態檢查。

幾分鐘內就能連線多雲端工作負載，不必耗費數週

您可以使用 Cross-Cloud Network 跨雲端連結各項服務，不必擔心連線延遲。這款骨幹網路受到超過 65% 的《財富》雜誌百大企業信賴，每月處理的資料量超過 27 EB。

隨心所欲取得加速器容量

我們提供彈性的計費模式，讓您能以多種方式排定加速器使用時間，藉此降低成本。使用 Spot VM 處理批次或容錯工作，最多可省下 91% 的費用；使用 Dynamic Workload Scheduler 處理開始日期有彈性的工作，最多可省下 50% 的費用；註冊承諾使用折扣，最多可省下 50% 的費用。

支援代理的系統

Google 和前沿 AI 研究室都信賴這項基礎架構，您可盡情調度資源，同時兼顧效能和能源使用效率

以值得信賴的基礎降低 AI 藍圖的風險

全球頂尖的 AI 研究室中，有 9 成選擇 Google Cloud，此外，有 70% 已獲融資的 AI 新創公司也是我們的合作夥伴。只要在 AI Hypercomputer 上進行部署，就能使用極其可靠的資料中心，光是 2025 年 12 月，這些中心就已為近 350 位客戶處理超過 1,000 億個詞元。