Google Distributed Cloud の新たなイノベーション

Muninder Sambi
VP, Google Distributed Cloud
※この投稿は米国時間 2026 年 4 月 23 日に、Google Cloud blog に投稿されたものの抄訳です。
このたびの Google Cloud Next において、Gemini と Google の高度な AI スタックをデータの所在地に導入する Google Distributed Cloud(GDC)の新機能を発表いたしました。これにより、AI イノベーションと主権を両立させることが可能になります。これは、「ソブリン ネオクラウド」アーキテクチャの触媒として機能します。
GDC を使用すると、Google Cloud をデータセンターやエッジなど、お客様が必要とする場所で利用できるようになります。特定のセキュリティとハードウェアの要件を満たすために、2 つの異なるモデルが用意されています。GDC エアギャップは、最大限のセキュリティとコンプライアンスを確保するために設計された Google 提供の専用ハードウェアで実行される、ネットワークから完全に分離されたデプロイです。GDC 接続では、独自のハードウェアで、Google が管理する統合ソフトウェア ライフサイクルを利用できます。
これまで、データに関する厳格な規制と主権の要件を持つ企業や政府機関は、最新の AI 機能を利用できませんでした。唯一の選択肢は、自社でシステムを構築することでしたが、これは複雑で、時間と費用がかかります。GDC はその苦労を解消します。お客様は労力をかけずに、世界クラスの AI イノベーションを独自の環境で実現できます。
GDC は、AI ワークロード向けに最適化されたマネージド インフラストラクチャ、Gemini またはオープンモデルの柔軟な選択肢、費用対効果の高い効率的な推論サービスなど、オンプレミスの完全な AI ソリューションを提供します。この基盤により、データを完全に制御しながら、セキュアな AI エージェントとアプリケーションを構築して実行できます。


GDC の新しいイノベーションがどのように連携して、お客様のソブリン AI ワークロードをサポートするかを見ていきましょう。
マネージド AI インフラストラクチャ
オンプレミスでソブリン AI のニーズをサポートするには、コンピューティング、ストレージ、ネットワーキングの膨大なパフォーマンス要求に対応できるマネージド インフラストラクチャが必要です。オンプレミスの AI ワークロードは動的で予測不可能なため、Google はさまざまな要件で最高のパフォーマンスを実現する、以下の新しいインフラストラクチャ イノベーションを導入しています。
-
NVIDIA Blackwell GPU: 第 5 世代の NVIDIA NVLink を活用してデータセンター規模の帯域幅を自社環境に直接提供する NVIDIA Blackwell(NVIDIA HGX B200)および NVIDIA Blackwell Ultra プラットフォーム(NVIDIA HGX B300)GPU で AI パフォーマンスを加速します。
-
Google Cloud マシン ファミリー: GDC はすでに、汎用ワークロード向けに N2 および N3 マシン ファミリーをサポートしていますが、新たに A4 マシン ファミリーもサポートするようになりました。A4 マシン ファミリーは、ピーク時のコンピューティング能力が 2.25 倍に向上しており、要求の厳しい推論タスクを処理できます。また、メモリ最適化 M2 と M3 マシン ファミリーを GDC に導入し、ERP やデータ分析など、より高いメモリ対 vCPU 比率を必要とするワークロードに対応します。
-
ストレージのスケールとパフォーマンスの強化: GDC は、ゾーンあたり 6 PB のオブジェクト ストレージをサポートするようになりました(以前は 1 PB)。これは、以前のストレージ容量の 6 倍です。さらに、ゾーンごとに 30 IOPS/GB(以前は 3 IOPS/GB)を提供するようになってパフォーマンスが 10 倍に向上し、ストレージのボトルネックが最小限に抑えられます。
データセンターの基盤モデル
GDC を使用すると、Google のフラッグシップである Gemini モデルのパワーを自社環境に直接取り込むことができます。最新世代の NVIDIA Blackwell GPU を搭載した独自の境界内でのネイティブ デプロイが可能になるため、世界クラスの生成 AI と厳格なデータ主権のギャップを埋めることができます。
このたび、最新の Gemini Flash モデルが、GDC 接続のお客様向けに NVIDIA Blackwell および Blackwell Ultra プラットフォームで(プレビュー版として)利用可能になりました。これにより、GDC エアギャップのお客様向けの既存のサポートが拡充されます。


「Google Distributed Cloud で Gemini をデプロイしたことで、当社のグローバルな製造が大幅に改善されました。最先端の AI をローカルで実行することで、IoT データを分析してリアルタイムの予測メンテナンスと品質管理を実現し、クラウドのレイテンシを回避できます。クラウドのようなアジリティを保持しながら、IP に対する厳格なデータ主権を維持しています。」- Samsung SDS、最高経営責任者、Junhee Lee 氏
AI 推論サービス: Google Distributed Cloud AI ゲートウェイの導入
パフォーマンスを最適化し、インフラストラクチャの複雑さを抽象化するために、ソブリン環境向けの AI ゲートウェイを導入します。このインテリジェントなミドルウェアは、モデルのコントロール プレーンとして機能します。これには、次のような利点があります。
-
動的リクエスト ルーティング: 推論リクエストを、ハードコードされたロジックではなく、費用、レイテンシ、精度に基づいて適切な AI モデルに自動的にルーティングします。
-
インテリジェントなロード バランシング: 推論効率を最適化するためにリクエストをルーティングし、使用率に基づいて GPU を選択します。
-
割り当て管理: リクエストに優先順位を付け、優先度の高いアプリケーションに必要なスループットを確保し、割り当て管理の目標を達成します。
-
オブザーバビリティ: すべての推論呼び出しにトレースとロギングが組み込まれており、コンプライアンスが重視される環境での監査可能性を確保できます。


エージェント型 AI アプリケーションとエージェント
エッジで AI を真に運用化するには、組織に基盤モデル以上のものが必要です。それは、エージェント型 AI アーキテクチャ上に構築された、アクションを実行できる自律的でセキュアなエージェントです。ここに、Google Distributed Cloud 向けの新しいソブリン エージェント型 AI アーキテクチャを発表できることを嬉しく思います。Kubernetes 上にサードパーティ プロバイダと構築されたこのアーキテクチャにより、エージェント ワークフローが、セキュアなお客様の組織の境界内で完全に実行されるようになります。


このエージェント アーキテクチャを使用すると、開発、コーディング、データ分析などのエージェント タスク用の強力な AI エージェントを、セキュアな境界内で構築してデプロイできます。
Google Distributed Cloud で AI をどこでも利用可能に
GDC は、Google やその他のモデルをオンプレミスで、接続された環境でもエアギャップのある環境でもサービングするのに最適なプラットフォームであり、すべてのお客様が主権を損なうことなく AI やエージェント ソリューションを活用できるようになります。これらのプロダクトの詳細については、ウェブサイトをご覧ください。ここで説明したイノベーションは、ソブリン AI 時代に必要な柔軟性とセキュリティを提供します。これらのプロダクトの実際の動作をご覧になるには、GDC ブレイクアウト セッションまたは Next ’26 のショーケースにご参加ください。
- Google Distributed Cloud、バイス プレジデント、Muninder Sambi



