コンピューティングの最新情報: コア ワークロードとエージェント ワークロードのスケーリング

Nirav Mehta
VP, Product Management, Compute Platforms
※この投稿は米国時間 2026 年 4 月 23 日に、Google Cloud blog に投稿されたものの抄訳です。
Google Cloud Next では、エージェントの世界における中核的な汎用ワークロードと AI ワークロードを、より高いパフォーマンスと低コストで実現するための、さまざまなコンピューティング機能を発表します。
その重要性: IT リーダーや開発者は、エージェント型 AI と、ウェブサーバー、データベース、エンタープライズ アプリケーションといった日々のカスタマー エクスペリエンスを支える汎用ユースケースとの間で、コンピューティングへの投資とリソースのバランスを取る必要に迫られています。
エージェントはコンピューティング インフラストラクチャに予測不能な負荷をかけることがあり、その需要はしばしば指数関数的に増加します。1 回のユーザー インタラクションであっても、数百もの同時実行(高スループットかつ低レイテンシ)タスクが瞬時に開始される場合があります。一方、汎用ワークロードは、エージェントの世界を支えるために必要なデータを生成して保持します。静的でサイロ化されたインフラストラクチャに依存してこれらのワークロードを実行すると、パフォーマンスのボトルネックや費用の増大を招くおそれがあり、需要の急増に組織として対応できなくなる可能性があります。
世界規模の旅行アプリケーションを例に考えてみましょう。単純なバカンスの検索ひとつで、エージェントによる在庫チェック、動的料金設定モデル、AI によるパーソナライズされた旅行プラン作成といった、膨大なオーケストレーションが即座にトリガーされます。最新のアーキテクチャがなければ、このような需要の急増によってコアとなる予約データベースが過負荷状態になり、業務が停止してしまう可能性があります。
Google は、柔軟なコンピューティング基盤でこの課題に対処します。汎用ワークフローとエージェント ワークフローの両方に対応する Google Cloud インフラストラクチャにより、パフォーマンス、容量、スケールをリアルタイムで柔軟に調整することで、双方のワークフローのメリットを最大限に引き出します。この動的な柔軟性は、Google Kubernetes Engine(GKE)の自動オーケストレーションと新たに導入された Agent Sandbox に直接支えられており、安全で分離された実行環境をマシンレベルの速度で即座にプロビジョニングできます。
それでは、Next ‘26 で発表された新しいコンピューティング機能を詳しく見ていきましょう。
AI ワークロードと汎用ワークロードを同時に実行
エージェントによるプランニングや強化学習は、予測不能な自律タスクのバーストを処理するために、きわめて流動性の高いコンピューティングに依存しています。エージェントが生成したコードを分離するために静的インフラストラクチャに依存すると、プロビジョニングに深刻な遅延が生じ、クラウドの予算が大幅に膨らむ可能性があります。適応型のクラウド基盤を導入することで、こうしたボトルネックを解消できます。GKE Agent Sandbox を活用すると、チームは数千もの実行環境を安全に起動できるようになります。これらのスケーラブルなサンドボックスと効率的な Google Axion プロセッサを組み合わせることで、組織は総所有コストを最適化しながら、AI イノベーションを推進できます。
Google Cloud コンピューティングに関する最新リリースと発表の内容は次のとおりです。
-
Google Axion N4A の一般提供開始: Google 独自のカスタム Arm ベース Axion CPU のアジリティを活用できます。Java アプリケーション、スケールアウト ウェブサーバー、スタートアップ / エンタープライズ / パートナーが構築する SaaS など、コスト重視のワークロードにおいて、同等の現行世代 x86 ベース VM と比較して最大 2 倍優れたコスト パフォーマンスを実現します。詳しくはこちらをご覧ください。
-
コスト パフォーマンスに優れた Axion N4A を搭載した GKE Agent Sandbox の一般提供開始: GKE Agent Sandbox は、ハイパースケーラーの中で唯一のネイティブ サンドボックス サービスとして、スケーラブルで低レイテンシのインフラストラクチャを提供します。パフォーマンスを損なうことなく、エージェントが信頼できないコードやツール呼び出しを安全に実行できるように設計されています。Google Axion を使用すると、費用や選択肢を妥協することなく、最先端のインフラストラクチャ上にエージェントを構築できます。Google Axion N4A インスタンスで実行される GKE Agent Sandbox は、他社主要ハイパースケール クラウド プロバイダと比較して最大 30% 優れたコスト パフォーマンスを実現します。GKE Agent Sandbox はこちらからお試しいただけます。
-
Google 初の Axion ベアメタル インスタンス「Google Axion C4A.metal」のプレビュー版を公開: C4A.metal インスタンスは、ネストされた仮想化に伴うパフォーマンス オーバーヘッドや複雑さを排除し、Android 開発、自動車シミュレーション、CI / CD パイプライン、セキュリティ ワークロード、カスタム ハイパーバイザに対応します。C4A.metal は今年の夏に一般提供開始予定です。詳しくは、こちらをご覧ください。
-
C4 インスタンスが、すべての構成において Intel Xeon 6(Granite Rapids)のサポートを拡充: ネイティブ FP16 サポートを備えた Intel AMX を活用して、LLM 推論やベクトル検索などの AI ワークロードでスループットの向上、レイテンシの短縮、パフォーマンスの向上を実現します。これにより、他の大手ハイパースケーラーが提供する同等の Intel Xeon 6 ベース VM と比較して、13% 優れたコスト パフォーマンスを提供します。C4 VM は、すべての構成で Intel Xeon 6 プロセッサを搭載できます。詳しくはこちらをご覧ください。
-
フレキシブル CUD の拡張サポートを一般提供開始: フレキシブル確約利用割引により、TCO を最適化しながら、複数のリージョンと VM ファミリーにわたって費用を移行できるようになりました。サポート対象が拡大され、メモリ最適化(M1~M4)VM ファミリーと HPC 最適化(H3、H4D)VM ファミリーに加え、Cloud Run にも対応しています。詳しくはこちらをご覧ください。
お客様からは次のような声が寄せられています。
Unity: Unity は、Unity Vector を使用してリアルタイム AI の費用構造を再定義しています。Unity はオンデマンドの特徴処理ワークロードを Google Axion N4A インスタンスに移行することで、レイテンシを犠牲にすることなく、費用対効果を 20% 改善しました。Unity Vector が需要の増加に対応するためにスケールアップする中でも、N4A インスタンスへの移行により、サステナブルな費用で業界トップクラスのパフォーマンスを提供し続けています。
Deutsche Börse: ドイツを代表する市場インフラストラクチャ プロバイダの Deutsche Börse は、最新世代の C4 および C4D インスタンスを含む数十もの基幹金融アプリケーションを Google Compute Engine VM に移行、モダナイズしました。これにより、レイテンシの影響を受けやすい Oracle データベースやポストトレード処理を大規模にサポートするとともに、リリース速度、運用のアジリティ、復元力の向上を実現しました。これにより、日々数百万件に及ぶ金融取引を処理するために必要な一貫したパフォーマンスを実現し、製品化までの時間を 58% 短縮、TCO を 33% 削減しました。
WP Engine: WP Engine は、ミリ秒単位の遅延も許されない数百万件のデジタル エクスペリエンスを支えています。C4D インスタンスと N4D インスタンスで GKE クラスタを実行することで、WP Engine はモバイル デバイス向けに最適化された REST API のレイテンシを最大 60% 削減し、データ量の多いアプリケーション リクエストの処理を最大 51% 高速化しました。
eDreams ODIGEO: eDreams ODIGEO は、ミリ秒単位の差がカスタマー エクスペリエンスを左右する、AI を活用した大規模な旅行プラットフォームを運営しています。同社は、基盤となる Java ベースの e コマース モジュールを GKE から Axion 仮想マシンへ移行しました。これにより、数週間かかっていた手動によるコード最適化が不要になり、コードを一切変更することなく P95 レイテンシを 75% も改善できました。また、従来の x86 インフラストラクチャでは達成できなかったコスト効率で、グローバル サービスをスケールできる価格性能比も実現しました。
Chainguard: 基盤となるソフトウェア ビルド システムで絶対的な分離を重視する Chainguard は、新しい Axion C4A ベアメタル インスタンスをデプロイしました。これにより、パッケージ ビルドの強固なハイパーバイザ セキュリティ境界を確立し、アーキテクチャのパリティを保ったまま開発パイプラインを保護します。さらに、ビルドのパフォーマンスを損なうことなく、堅牢な保護を実現します。
I/O やレイテンシの影響を受けやすいワークロードを同時に実行
AI ワークロードとコア ワークロードはいずれも、データの保存、読み取り、移動を単一の高性能なオペレーションとして実行できる機能に依存しています。従来、これらの処理ステージは、vCPU 数に依存するネットワークやストレージの制限によって遅延が生じ、AI モデルが機能するために必要なデータが不足してしまうことがありました。高速データアクセスを実現する Hyperdisk の強化されたパフォーマンスと、一貫した転送を実現する高性能ネットワーキングを活用することで、これらの制約を解消できます。データ パイプラインをコンピューティングとは独立してスケールできるようにすることで、AI トレーニングや I/O の影響を受けやすいワークロードは、需要のピーク時でも必要な専用帯域幅を確保でき、安定したパフォーマンスを維持できます。
-
C4N(プレビュー版): モバイルアプリの同時リクエストやリアルタイムの在庫更新といった高負荷ネットワーク アプリケーションを実行すると、トラフィックのピーク時にボトルネックが発生する可能性があります。C4N は、複雑なパケット処理をオフロードする Titanium アダプタを備えており、業界トップクラスの毎秒 9,500 万パケットというスループットを実現します。他の主要なハイパースケーラーと比較して、高トラフィック ネットワーク アプリケーションにおいて 40% の性能優位性を発揮します。大規模なデータセットの高速転送を目的に設計された C4N は、VM 間で最大約 400 Gbps の帯域幅を提供し、vCPU あたりの帯域幅が 4 倍に向上しています。また、インターネット ゲートウェイを介した下り(外向き)ネットワーク帯域幅は、C4 VM と比較して 8 倍に向上しています。また、Hyperdisk Extreme を搭載した C4N は、25 GiB/秒のブロック ストレージ スループットと約 100 万 IOPS を達成し、最新のデータベースやエンタープライズ AI アプリケーションに必要な低レイテンシかつ高速のデータアクセスを実現します。C4N プレビュー版へのアクセスはこちらからご登録いただけます。
-
M4N(プレビュー版): メモリ使用量の多いデータベースを実行する場合、メモリ速度を確保するためにコンピューティング コア(vCPU)をオーバープロビジョニングする必要があり、ソフトウェア ライセンス費用の増加につながります。この問題を解決するために、新しい M4N シリーズを導入しました。Hyperdisk Extreme を搭載した M4N で Oracle ワークロードを実行すると、TCO を 20% 以上削減できます。また、vCPU あたり 26.57 GiB の RAM を活用することで、はるかに少ないコア数でスケールでき、より効率的に Oracle を実行できます。M4N と Hyperdisk Extreme を組み合わせることで、主要ハイパースケーラーのなかでも、ハイメモリ インスタンスにおけるコアあたりの IOPS とスループットでトップレベルの性能を発揮します。プレビュー版には、こちらからご登録いただけます。
-
Z4D の発表: 新しい Z4D インスタンスにより、I/O 集約型のワークロードを最適化し、ネットワーク ベースのストレージ ボトルネックを解消します。ノード上で最大 84 TiB の高性能ローカル SSD を直接確保することで、組織は SQL、NoSQL、ベクトル データベース向けに膨大なデータセットを処理できるようになります。Z4D は、C4N および M4N と同等の、最大 400 Gbps の VM 間帯域幅を提供します。Z4D の仮想マシンとベアメタル インスタンスは、近日中にプレビュー版としてリリースされる予定です。
お客様から寄せられた声をご紹介します。
Ericsson: 5G コアのワークロードは本質的にネットワーク負荷が高く、高スループットのパケット処理と決定論的なレイテンシが求められます。標準的なパブリック クラウド インスタンスでは、大規模環境でこれらを維持するのは容易ではありません。Google Cloud C4N を活用することで、Ericsson On-Demand を支えるネットワーク パフォーマンスの最適な選択肢を見つけました。ネットワークに最適化されたコンピューティングに重点を置いた C4N のアーキテクチャにより、Ericsson の 5G Core-as-a-Service は、最近達成した 1 Tbps など、前例のないスループット レベルを実現しながら、顧客が期待するキャリア グレードの信頼性を維持しています。
Teradata: Teradata の Autonomous Knowledge Cloud は、世界最大規模の企業がエンタープライズ インテリジェンスを活用し、信頼できるデータを測定可能なビジネス成果へと変換できるようにします。顧客は Teradata を活用し、パフォーマンスと効率が価値を直接左右する、ミッション クリティカルかつ I/O 集約型の分析を大規模に実行しています。C4N インスタンスは、このような要求の厳しいワークロードに適しており、優れたコスト パフォーマンスを実現するとともに、より効率的で最適化されたデプロイをサポートします。C4N を利用することで、Teradata は顧客のインサイト獲得を加速し、安心してスケールできる環境を提供します。さらに、データと AI への投資からより大きな成果を引き出せるよう支援します。
厳しいストレージ要件に対応
ウェブサーバー、アプリケーション、データベースなどの基盤となるワークロードには、エージェントの世界が機能するために必要なデータが蓄積されています。この重要な情報を固定的なハードウェア上でサイロ化すると、ボトルネックが発生し、企業のモダナイゼーションが完全に停滞する可能性があります。たとえば、グローバルな小売ブランドがホリデー シーズンのプロモーションを実施しているとします。しかし、従来のハードウェアではエージェント型クエリの急増に処理が追いつかず、在庫データベースがタイムアウトして、顧客のリクエストが破棄されてしまいます。
組織は、データ配信を滞らせないように、vCPU あたりの IOPS とスループットに優れた、トップレベルのパフォーマンスを発揮するデータベース ホストを必要としています。これらのアプリケーションを最新のクラウド インフラストラクチャに移行することで、総所有コストと運用スループットが大幅に向上します。戦略的なクラウド移行を通じて、モダナイゼーションを妨げるアーキテクチャ上の障壁を排除し、AI 活用に向けてデータの価値を引き出せます。スループットと容量に左右されやすいワークロード向けの、Fluid Compute の新機能をご紹介します。
-
Hyperdisk Balanced の改善: Hyperdisk Balanced は、アプリケーションやリレーショナル データベースなどの汎用ワークロード向けに、高速で効率的なブロック ストレージを提供します。Hyperdisk Balanced を使用すると、ボリュームあたり最大 2.4 GiB/秒のスループットと 16 万 IOPS を実現します。これは、他のハイパースケーラーの汎用ブロック ストレージ サービスを上回る性能であり、平均レイテンシも代替サービスよりも低く抑えられます。Hyperdisk Balanced High Availability を使用すると、SQL Server や PostgreSQL などの高可用性データベースにおいて、ディスク全体のパフォーマンスをアクティブな VM に動的にルーティングすることで、4 倍のパフォーマンス向上を実現できます。これにより、ストレージのオーバープロビジョニングが不要になります。ゼロ ダウンタイムの暗号鍵のローテーションとインスタント スナップショットの整合性グループを活用することで、より簡単にセキュリティを強化できます。これらの機能により、汎用ワークロードでの TCO 削減、パフォーマンスの向上、ワークロードのレジリエンス強化を実現できます。詳しくはこちらをご覧ください。
-
Hyperdisk ML のパフォーマンス向上と Hyperdisk Exapools の一般提供: 合計スループットが(1.2 TiB/秒から)2 TiB/秒に向上した Hyperdisk ML は、AI ストレージのボトルネック解消に貢献します。ディスクあたりのスループットが競合製品の 200 倍以上でり、貴重なアクセラレータ クラスタをアイドル状態にさせません。これにより、AI コンピューティングの ROI を最大化しながら、次世代のインテリジェント エージェントを支えます。さらに Hyperdisk Exapools は、大規模なトレーニング要件に対応するため、あらゆるハイパースケーラーの中で、AI クラスタあたり最高水準の総合ブロック ストレージ性能と容量を提供します。Hyperdisk ML と Hyperdisk Exapools について、詳細をご覧ください。
-
Z4M の発表: 最大 168 TiB のローカル SSD と最大 400 Gbps のネットワーク帯域幅、RDMA のサポート、ベアメタル シェイプを提供し、分散並列ファイル システムや大規模な AI / ML ワークロードの実行に対応します。Z4M は Cluster Director と統合され、アクセラレータとコロケーションするオプションを提供することで、データへの高速かつ低レイテンシのアクセスを実現します。Z4M VM とベアメタル インスタンスは、2026 年第 3 四半期にプレビュー版が提供される予定です。
お客様から寄せられた声をご紹介します。
Shopify: ブラック フライデーの週末セール期間中、Shopify は 8,100 万人の購入者に対して 1 億 3,600 万個の荷物を追跡し、146 億ドルを超える取引を処理しました。この処理は、Compute Engine の Z シリーズを基盤とするストレージ上に構築された Shop アプリを使用して行われ、その間、速度や信頼性を損なうことはありませんでした。
HubX: 迅速なモデル読み込みがユーザー エクスペリエンスを左右する、AI 搭載モバイルアプリの膨大なポートフォリオを運用する中で、HubX は GKE に Hyperdisk ML をデプロイし、深刻な I/O ボトルネックを解消しました。この専用ストレージ レイヤを活用することで、HubX は数百の同時リーダーをサポートし、トラフィックが急増するピーク時でも Pod の初期化時間を 30 倍に短縮できました。これにより、アイドル状態のアクセラレータにかかる費用を大幅に削減し、複雑な推論ワークロードを想定どおりにスケールできました。
エージェントの時代に対応する流動的なインフラストラクチャ
基盤ワークロードとエージェントが容量やパフォーマンスを奪い合う必要がなくなります。Google Cloud の Fluid Compute を活用することで、ボトルネックを回避し、基盤ワークロードと AI ワークロードの双方が連携して最大限のパフォーマンスを発揮できる、適応型のクラウド インフラストラクチャを実現できます。
準備ができたら、 Google Cloud コンソールにアクセスして、次の大規模プロジェクトに向けて VM をスピンアップしましょう。または、Migration Center の AI 搭載ツールセットを使用して、費用の見積もり、ビジネスケースの作成、モダナイゼーション オプションの評価を行い、移行計画を開始することもできます。
- コンピューティング プラットフォーム部門プロダクト管理担当バイス プレジデント、Nirav Mehta



