進一步瞭解如何在 Google Cloud 中,透過 NVIDIA GPU 使用全球規模的生成式 AI。查看從 NVIDIA GTC 2024 中精選的 Google Cloud 內容。
NVIDIA 和 Google Cloud 提供加速器最佳化解決方案,能滿足要求最嚴苛的工作負載,包括機器學習、高效能運算、資料分析、圖形和遊戲工作負載。
優點
提升各種工作負載的效能
透過 Google Cloud 中最新的 NVIDIA GPU,您可以輕鬆使用 NVIDIA H100、A100、L4、T4、P100、P4 或 V100 佈建 Compute Engine 執行個體,讓各種要求嚴苛的工作負載加速運作。
採用以秒計費模式,有效降低成本
Google Cloud 採用以秒計費模式,讓您用多少就付多少,系統每月還會自動套用最高 30% 的折扣。無須預繳費用,同時享有相同的運作時間與可擴充的效能。
使用自訂機器設定將工作負載最佳化
您可以根據需求,為執行個體準確設定適當比例的處理器、記憶體和 NVIDIA GPU,藉此將工作負載最佳化,不需要為了配合受限的系統配置而修改工作負載量。
主要功能與特色
A3 VM 採用 NVIDIA H100 Tensor 核心 GPU,專為訓練及處理要求特別嚴苛的生成式 AI 工作負載和 LLM 而打造。搭配使用 NVIDIA GPU 與 Google Cloud 頂尖的基礎架構技術,可大幅擴大規模、提高效能與超級運算能力。
加速器最佳化 A2 VM 採用 NVIDIA Ampere A100 Tensor Core GPU,每個 A100 GPU 可提供的運算效能最高可達前一代 GPU 的 20 倍。這些 VM 經過特別設計,可為各種規模的 AI、資料分析和高效能運算作業提高速度,助您解決最艱鉅的運算難題。
G2 是業界第一個採用新推出 NVIDIA L4 Tensor 核心 GPU 的雲端 VM,專為生成式 AI 等大型推論 AI 工作負載而打造。G2 能讓您有效執行 AI 推論工作負載,發揮最佳成本效益。G2 是一種通用 GPU,可以大幅提升 HPC、圖形和影片轉碼工作負載的效能。
使用 Google Kubernetes Engine (GKE) 自動調度 GPU 資源,便可順暢地根據需求建立具 NVIDIA GPU 的叢集、達成負載平衡,並將作業費用降至最低。GKE 支援 NVIDIA A100 GPU 中的多執行個體 GPU (MIG),因此可針對多使用者、多模型 AI 推論工作負載,以更精細的方式佈建合適的 GPU 加速作業。
NVIDIA CloudXR 是以 NVIDIA RTX™ 技術為基礎所打造的突破性創新功能。Google Cloud Marketplace 以虛擬機器映像檔 (VMI) 的形式提供 NVIDIA RTX 虛擬工作站,讓使用者能存取高品質的 XR。使用者可以輕鬆設定、擴充及享有高品質的沉浸式體驗,以及從雲端串流處理 XR 工作流程。
準備好了嗎?聯絡我們
進一步瞭解 Google Cloud 和 NVIDIA 如何協助您推動企業轉型。
客戶
說明文件
最新消息