コンテンツに移動
コンピューティング

Google Cloud と NVIDIA が GTC 2026 で業界全体に AI イノベーションを拡大

2026年3月24日
https://storage.googleapis.com/gweb-cloudblog-publish/images/Google_Cloud_NVIDIA_Hero_Image_for_GTC26_B.max-2600x2600.jpg
Mark Lohmeyer

VP and GM, AI and Computing Infrastructure

Try Gemini Enterprise Business Edition today

The front door to AI in the workplace

Try now

※この投稿は米国時間 2026 年 3 月 17 日に、Google Cloud blog に投稿されたものの抄訳です。

エージェント型 AI の時代により、企業インフラストラクチャのニーズは根本的に変化しています。組織が動的な推論と自律的な実行が可能なシステムを構築するにつれて、基盤となるインフラストラクチャも進化する必要があります。これらのエージェント ワークロードを大規模な混合エキスパート(MoE)アーキテクチャとともにスケールするには、細部まで最適化された共同設計のスタックが必要です。

こうした需要に応えるため、Google は AI に最適化された Infrastructure as a Service である Google Cloud AI Hypercomputer を構築しました。これは、パフォーマンスが最適化されたハードウェア、最先端のソフトウェア、オープン フレームワーク、柔軟な使用量モデルを包括的な単一システムに統合したものであり、超低レイテンシ、高スループット、費用対効果の高い推論を実現します。この統合アーキテクチャ内でお客様にさらに多くのオプションを提供するために、Google は NVIDIA とのパートナーシップを拡大しています。

今週開催される NVIDIA GTC 2026 で、Google Cloud と NVIDIA はパートナーシップを拡大し、共同設計した AI インフラストラクチャ基盤を紹介する一連の新しい発表を行います。

インフラストラクチャとハードウェア

      • NVIDIA RTX Pro 6000 Blackwell Server Edition を搭載した Google Cloud G4 VM の勢い

      • NVIDIA vGPU テクノロジーを使用した、柔軟な分割式 G4 VM のプレビュー版 - NVIDIA RTX Pro 6000 Blackwell Server Edition では業界初

      • NVIDIA Vera Rubin NVL72 プラットフォームのサポート予定

ソフトウェアとプラットフォーム

      • NVIDIA Dynamo と GKE Inference Gateway のインテグレーション

      • Vertex AI Training と Model Garden 全体で NVIDIA のサポートを強化

エコシステム

    • 公共部門向け AI スタートアップ アクセラレータ プログラムの開始

発表内容を詳しく見ていきましょう。

G4 VM で AI ワークロードを高速化

NVIDIA RTX Pro 6000 Blackwell Server エディション GPU を搭載した G4 VM は、高度な空間コンピューティングから完全な AI 開発ライフサイクルまで、さまざまな高パフォーマンス ワークロードを強化するために構築されています。たとえば、Otto Group One.O や WPP などの企業は、G4 を使用して物理的に正確なシミュレーションやリアルタイムの 3D レンダリングを大規模に実行しています。

シミュレーション以外にも、G4 はモデルのファインチューニングと推論で優れた性能を発揮し、特に 300 億から 1,000 億以上のパラメータを持つモデルに適しています。4 ビット浮動小数点(FP4)精度と Google のピアツーピア(P2P)通信を活用することで、お客様はモデル提供のスループットの向上とレイテンシの大幅な削減を実現し、リアルタイムのマルチモーダル AI エージェントや応答性の高い生成 AI アプリケーションという新しいクラスを可能にしています。

お客様がすでに G4 VM のパフォーマンスと効率性を活用して、最も要求の厳しいワークロードを高速化させている例をいくつかご紹介します。

「Google Cloud の G4 VM は、膨大な量のフォトリアルなシミュレーションをパイプラインで処理するために必要とされる、スケーラブルな GPU バックボーンを提供してくれます。スループットが 4 倍に向上したことで、ML チームはより迅速にイテレーションを行い、より豊富なデータでトレーニングし、モデルが実環境に導入されるよりかなり前にエッジケースを検証できるようになりました。」– General Motors、AI / ML エンジニアリング担当ディレクター、Sony Mohapatra 氏

NVIDIA Blackwell を搭載した G4 VM を使用することで、マルチモーダル モデルをさらに進化させられるようになりました。推論の高速化、信頼性の向上、言語を問わない即時応答などです。目標は変わりません。企業規模で機能する音声エージェントを、妥協せずに作成することです。今後も共同で開発を続け、お客様がこのツールをどのように活用されるかを楽しみにしています。」– ElevenLabs、共同創業者、Mati Staniszewski 氏

「Google Cloud G4 VM は、当社のロボット連携レイヤの計算バックボーンを提供し、物流センター全体で自律型フリートをミリ秒単位の精度で同期できるようにします。忠実度の高いデジタルツインで複雑な倉庫環境をシミュレートすることで、サプライ チェーン全体を仮想的に最適化してから、ロボットに床を移動させることができます。」 - Otto Group One.O、CEO、Stefan Borsutzky 博士

「G4 VM に移行したところ、Terraform スクリプトを更新するだけで、処理レイテンシが 50% 削減され、スループットが 6 倍に向上しました。運用オーバーヘッドを追加することなく、コア ワークロードのパフォーマンスをこれほど向上させることはめったにありません。」– Imgix、エンジニアリング責任者、Alfonso Acosta 氏

分割式 G4 VM の導入

このたび、AI およびグラフィック ワークロード向けの非常に効率的で費用対効果の高いエントリー ポイントとなる、分割式 G4 VM のプレビュー版がリリースされました。NVIDIA 仮想 GPU(vGPU)テクノロジーを使用したこれらの新しい構成により、NVIDIA RTX PRO 6000 Blackwell Server エディション GPU のパワーを柔軟かつ小規模な単位で活用できるため、アプリケーションの特定の需要に合わせてインフラストラクチャを適切なサイズに調整できます。

「企業は、複雑なエージェント型 AI ワークロードをスケールするために、前例のないほどの柔軟性を必要としています。NVIDIA は Google Cloud とともに、NVIDIA RTX PRO 6000 を搭載した分割式 G4 VM を導入し、お客様が GPU 容量のサイズを適正化して ROI を最大化できるようにしました。Vertex AI 上の NVIDIA NeMo から GKE の NVIDIA Dynamo まで、共同設計されたスタックにより、次世代の推論モデルと MoE モデル向けのオープンで高性能なプラットフォームを提供します。」- NVIDIA、ハイパースケール / HPC 担当バイス プレジデント兼ゼネラル マネージャー、Ian Buck 氏

高度なハードウェアへのアクセスをより細かく制御できるため、分割式 G4 VM はパフォーマンスを犠牲にすることなく、リソース割り当てを最適化してオーバーヘッドを削減できます。特定のニーズに合わせて、追加の GPU スライスサイズから選択できるようになりました。

  • 1/2 GPU: LLM 推論、ロボット センサー シミュレーション、高忠実度 3D レンダリングなど、より負荷の高いタスクに最適です。

  • 1/4 GPU: 中程度のクリエイティブ デザイン、動画のコード変換、リアルタイムのデータ可視化など、主流のワークロード向けに最適化されています。

  • 1/8 GPU: リモート デスクトップ、生産性向上ツール、エントリーレベルのストリーミング サービスなどの軽量アプリケーションに最適です。

これらの柔軟な G4 サイズ ポートフォリオにより、次のことが可能です。

  • インフラストラクチャの適切なサイジング: 軽量なリモート デスクトップから集中的なデータ処理まで、GPU 容量をアプリケーションの需要に正確に一致させます。

  • 費用効率を最大化: 特定のタスクに必要な分割 GPU リソースのみを利用して料金を支払うことで、運用オーバーヘッドを削減します。

  • 多様なワークロードをスケール: 高忠実度のクリエイティブ デザインやストリーミングから、複雑なロボット シミュレーションやリアルタイム推論まで、幅広いイノベーションを推進します。

これらの部分的な G4 VM は Google Kubernetes Engine(GKE)で管理できるため、開発者は高度なコンテナ ビンパッキングを使用して、さらに高い費用対効果とリソース使用率を実現できます。Dynamic Workload Scheduler を使用して管理する場合、分割スライスにフォールバックの優先順位を設定できます。これにより、スケジューラが各ワークロードで利用可能な GPU 構成を自動的に検出できるようになるため、取得可能性が大幅に向上します。

「G4 vGPU の柔軟なサイズ設定により、各分子シミュレーションの規模に合わせてコンピューティング リソースを正確に調整できるため、創薬パイプライン全体で最大限の効率を確保できます。このきめ細かい制御により、研究者は固定されたハードウェア構成に制約されることなく、小規模なワークフローと大規模な並列処理の間をシームレスに切り替えられます。」– Schrödinger、EVP、CIO、Shane Brauner 氏

NVIDIA Vera Rubin NVL72 で AI Hypercomputer をスケーリング

NVIDIA との緊密なエンジニアリング パートナーシップを基盤として、Google は NVIDIA Blackwell アーキテクチャの後継である、先日発表された NVIDIA Vera Rubin プラットフォームをサポートできることを誇りに思います。Google は 2026 年下半期に NVIDIA Vera Rubin NVL72 ラック規模システムをいち早く提供するクラウド プロバイダとなる予定です。このシステムを Google の AI Hypercomputer アーキテクチャに統合し、次世代の推論 AI とエージェント型 AI を強化します。

AI インフラストラクチャ スタック全体で効率性を実現

Google は、完全にオープンなエコシステムへの取り組みの一環として、Dynamo と GKE Inference Gateway のインテグレーションを発表いたしました。これにより、アプリケーション レイヤとハードウェア全体にわたってモジュール式のオープンソース コントロール プレーンが提供されます。Dynamo と GKE の Inference Gateway を組み合わせることで、チームはインフラストラクチャを正確なニーズに合わせて調整し、アクセラレータから最大限の費用対効果を引き出し、新しい AI モデルの市場投入までの時間を短縮し、デプロイを将来にわたって保証できます。

A4X VM(NVIDIA GB200 NVL72 と Dynamo を搭載)向けの新しい高度なスケーリング レシピを通じて、大規模な MoE アーキテクチャのパフォーマンスを最大化する方法を学ぶことができます。これらの構成は、AI Hypercomputer で AI 推論ワークロードを実行する際に、メモリとインターコネクトのボトルネックを克服する方法を示しています。

また、Dynamic Workload Scheduler を通じてリソースの取得可能性を高めています。A4X および A4X Max(NVIDIA GB300 NVL72 搭載)の Calendar モードと Flex Start、および G4 VM の新しい Flex Start サポートが提供されます。Dynamic Workload Scheduler を使用すると、必要な容量を正確に予約したり、柔軟な開始ウィンドウを使用したりできます。

Google Cloud の長年の顧客である Snap は、主要なデータ処理パイプライン 2 つを NVIDIA L4 Tensor コア GPU を搭載した Google Cloud G2 VM に移行することで、大幅な費用削減を実現しました。これは、GKE 上の Spark と NVIDIA の新しい cuDF ライブラリを活用することで実現しました。cuDF ライブラリは、シャッフルを多用するワークロードの最適化を自動化し、GPU の効率を最大限に高めます。詳しくは、GTC セッション S81678 をご覧ください。

Vertex AI のトレーニングと Model Garden の進化

Google は、Vertex AI トレーニング クラスタの 2 つの主要なインフラストラクチャの進歩により、次世代 AI の需要に対応しています。まず、A4X VM ドメインのサポートにより、Vertex AI のマネージド インフラストラクチャとフレームワーク機能を活用して、NVIDIA GB200 NVL72 ラック スケール システムで大規模なトレーニングを行うことができます。これらの集中的なワークロードが中断されないようにするため、新しいハードウェアの復元機能により、構成可能な事前対応型の障害検出スキャンを適用できます。これにより、潜在的なハードウェアの問題を特定して軽減し、重要な「ヒーロー」トレーニングの実行が中断されるのを防ぎます。これらの機能により、グッドプットが向上し、数週間にわたるトレーニング ジョブが費用のかかる再起動なしで順調に進むようになります。

「私たちは Google および NVIDIA とともに、高性能で一貫性があり、正確で応答性の高い AI エージェントを提供するという、エージェント型エンタープライズの新たな基準を打ち立てています。NVIDIA GB200 NVL72 上の Vertex AI トレーニング クラスタを活用して Agentforce 360 プラットフォームを強化することで、インフラストラクチャのボトルネックを解消し、GPU を完全に飽和状態に保つことができました。この高パフォーマンスで復元力のあるアーキテクチャにより、研究者は大規模なイノベーションに集中でき、最も複雑な推論ワークロードで大きな成果を上げています。」- Salesforce、最高科学責任者、Silvio Savarese 氏

同時に、NVIDIA の Nemotron 3 ファミリーのオープンモデルのサポートにより、Vertex AI Model Garden の範囲を拡大し続けています。たとえば、Nemotron 3 Nano はワンクリックでデプロイできるため、プライベート VPC への統合が簡単です。また、カタログを拡大し、NVIDIA Nemotron 3 Super 120B モデルを追加しました。これにより、高性能な大規模推論にすぐにアクセスできます。これらのモデルの価値を最大限に高めるため、Google は NVIDIA の最新のパフォーマンス ライブラリを Vertex AI に直接統合し、NVIDIA TensorRT-LLM で一般的なオープンソース モデルを最適化しました。

公共部門向けの AI スタートアップを支援

エコシステム内の継続的なイノベーションを促進するため、Google Public Sector と NVIDIA は AI スタートアップ アクセラレータ プログラムを開始します。この 1 年間のイニシアチブでは、公共部門向けのソリューションを構築する、AI に重点を置いた独立系ソフトウェア ベンダー(ISV)の選抜されたコホートをサポートします。

参加者は、NVIDIA Inception と Google Cloud の ISV アクセラレータ リソースの両方にアクセスできます。GTC で開始され、Google Cloud Next まで続くこの共同プログラムでは、ミッション クリティカルな公共部門アプリケーションをスケールするために必要な、共同設計されたインフラストラクチャ、技術ガイダンス、市場開拓サポートを、新興テクノロジーのリーダーに提供します。プログラムについて詳しくは、お問い合わせフォームにご記入ください。今後、他のコホートも選出され、発表される予定です。

共同エンジニアリングのコラボレーションが AI スタックのあらゆるレイヤを強化

複雑なエージェント型 AI への移行には、単なるコンピューティング能力以上のものが求められます。完全に最適化された共同設計のスタックが必要です。Google は、分割式 G4 インスタンスや今後リリースされる Vera Rubin プラットフォームなどの柔軟なハードウェアを AI Hypercomputer アーキテクチャに統合し、ソフトウェアの緊密な共同エンジニアリングと組み合わせることで、最も野心的な AI ビジョンを現実に変えるために必要なスケール、レジリエンス、効率性を実現します。

GTC に参加されますか?ブース番号 513 にぜひお立ち寄りください。詳細をご覧いただき、Google のチームと直接お話いただけます。Google と NVIDIA のコラボレーションの詳細については、cloud.google.com/NVIDIA をご覧ください。

 

-AI およびコンピューティング インフラストラクチャ担当バイス プレジデント兼ゼネラル マネージャー、Mark Lohmeyer

投稿先