Google Cloud ネットワーキングの最新情報

Muninder Sambi
VP, PM and GM, Networking, Google Cloud
Rob Enns
VP & GM, Cloud Networking
※この投稿は米国時間 2025 年 4 月 10 日に、Google Cloud blog に投稿されたものの抄訳です。
AI の時代が到来し、AI モデルのトレーニング、推論、サービングにかつてないネットワーク能力が求められ、業界の根本的な再編成が進んでいます。この変革を推進するために、組織は膨大な容量を処理し、シームレスな接続を実現して、堅牢なセキュリティを提供するグローバルなネットワーキング ソリューションを必要としています。
Next 25 では、こうした重要なニーズに対応し、Google のクラウド ネットワーキング プロダクトとクロスクラウド ネットワーク ソリューションにおける一連のイノベーションを通じて、お客様が分散型 AI アプリケーションを簡単に構築して提供できるようにします。
これらのイノベーションには、AI によって最適化されたネットワーキング、シンプルで安全なサービス ネットワーキング、ゼロデイ脅威に対するゼロトラスト セキュリティが含まれます。また、ウェブ、メディア、生成 AI サービス向けのグローバル フロントエンドのプログラマビリティとパフォーマンスを備えたクロスクラウド ネットワーク ソリューションの拡張も行っています。さらに、Google の広範なグローバル インフラストラクチャを活用して、企業の拠点間の安全でシンプルな接続を実現するフルマネージド型グローバル ネットワークを提供する最新のソリューション Cloud WAN も提供しています。
AI 最適化ネットワーキング: パフォーマンス、セキュリティ、スケーラビリティ
AI モデルを最大限に活用するには、膨大な量のデータと負荷の高い処理に対応できるネットワークが必要です。巨大なモデルをトレーニングする場合でも、ユーザーにモデルを提供する(推論する)場合でも、速度、信頼性、セキュリティは不可欠です。複雑なインフラストラクチャを扱い、超高速な応答を提供するために大量のデータを移動することになるでしょう。Google のイノベーションは、このような要求の厳しい AI ワークロードに必要なインフラストラクチャの実現に重点を置いています。
-
400G の Cloud Interconnect と Cross-Cloud Interconnect による大規模データの取り込み: 100G の Cloud Interconnect と Cross-Cloud Interconnect の 4 倍の帯域幅で AI データセットをより迅速にオンボードし、クロスクラウドでトレーニングできます。オンプレミス環境や他のクラウド環境から Google Cloud への接続も可能です。今年後半に提供予定です。
-
かつてないスケールのクラスタ: 現在プレビュー版で提供されている非ブロッキング構成では、クラスタあたり最大 30,000 個の GPU のネットワーキング サポートを使用して大規模な AI サービスを構築できます。
-
ゼロトラスト RDMA セキュリティ: ゼロトラスト ネットワーキングのための動的な違反措置に関するポリシーを備えた RDMA ファイアウォールにより、高性能 GPU と TPU トラフィックのセキュリティを確保します。今年後半に提供予定です。
-
GPU 間通信の高速化: 一般提供が開始された高スループット、低レイテンシの RDMA ネットワーキングにより、最大 3.2 Tbps の非ブロッキング GPU 間帯域幅を実現します。
「Google Cloud は、リソースの使用率を最適化しながら、ユーザーへの高パフォーマンスで安全な AI エクスペリエンスの大規模な提供を可能にし、当社の AI インフラストラクチャにおいて重要な役割を担っています。」- Snap, Inc.、AI プラットフォーム、エンジニアリング ディレクター、Xu Ning 氏
AI 推論の複雑さが増すにつれ、特に企業が複数のタスクに最適化されたモデルをデプロイする場合、ネットワーク面で大きな課題が生じます。AI 機能に対する需要が高まると、ネットワーク インフラストラクチャに負担がかかります。なぜなら、多くの場合、リージョン全体に分散している GPU や TPU リソースにデータを効率的にルーティングするには、高帯域幅と低レイテンシが必要だからです。さらに、生成 AI アプリケーションやエージェントの導入により攻撃対象領域が拡大し、推論中に機密データが漏洩する脆弱性が生じるため、堅牢な AI の安全性とセキュリティ対策が必要になります。こうした課題に対処するため、Google は現在プレビュー版として GKE Inference Gateway をリリースしています。このサービスは、次のような機能を提供します。
-
差別化された生成 AI アプリケーションのパフォーマンス。高額なサービング費用は不要です。GKE Inference Gateway の新機能は、内部ベンチマークを基に、他のマネージドおよびオープンソースの Kubernetes サービスと比較して、サービング費用が最大 30%、テール レイテンシが最大 60% 減少し、スループットが最大 40% 向上します。GKE Inference Gateway の機能には、Google Jetstream、NVIDIA、vLLM のモデルサーバー指標に基づくインテリジェントなロード バランシング、動的リクエスト ルーティング、効率的で動的な LoRA ファインチューニング モデルなどがあります。
-
パワフルな新しいインテグレーションを使用した AI のセキュリティと安全性。今後は、Model Armor、NVIDIA NeMo Guardrails、Palo Alto Networks の AI ランタイム セキュリティと併せて、GKE Inference Gateway と Cloud Load Balancing を活用できるようになります。この組み合わせによるアプローチでは、Service Extensions を使用して AI モデルを包括的に保護し、プラットフォーム エンジニアリング チームとセキュリティ チームのガバナンスが簡素化されます。
-
LLM 推論向けの Google Cloud Load Balancing 最適化機能を使用することで、複数のクラウド プロバイダまたはオンプレミス インフラストラクチャで NVIDIA GPU の容量を活用できます。
「エージェント AI を安全かつ費用対効果の高い方法でデプロイするためのフルスタック統合インフラストラクチャは、さまざまな業界の企業から求められています。リアルタイム オブザーバビリティのための NVIDIA 推論ソフトウェアと、堅牢なセキュリティ適用のための NeMo Guardrails を GKE Inference Gateway と統合することで、NVIDIA と Google Cloud は、AI のデプロイにおけるパフォーマンスと信頼性を高める高度な機能を実現しています。」- NVIDIA、エンタープライズ向け生成 AI ソフトウェア担当バイス プレジデント、Kari Briski 氏
ウェブ、メディア、AI 向けのプログラム可能なグローバル フロントエンド
クロスクラウド ネットワークのグローバル フロントエンド ソリューションは、バックエンドがホストされている場所に関係なく、最も要求の厳しいウェブ、メディア、最新の生成 AI アプリケーションを高速化し、保護します。インフラストラクチャをインターネットに公開する必要はありません。本日は、最新の生成 AI アプリ向けの新しいイノベーションをご紹介します。
-
Service Extensions によるエッジのプログラマビリティ: WebAssembly(Wasm)を活用した Service Extensions プラグインによるオープンなプログラマビリティで、エッジの可能性を引き出します。Rust、C++、Go で書かれた 60 以上のサンプル プラグインを使用して、アプリケーションを自動化、拡張、カスタマイズできます。Cloud Load Balancing のサポートは一般提供されており、Cloud CDN のサポートは今年一般適用される予定です。
-
ウェブ パフォーマンスの高速化: Cloud CDN の高速なキャッシュ無効化機能で、静的コンテンツと動的コンテンツをグローバル スケールで配信し、パフォーマンスを向上させます。また、TLS 1.3 0-RTT で接続を再開してアプリケーションのパフォーマンスを高めます。どちらの機能もプレビュー版で利用できます。
-
エンドツーエンドの mTLS セキュリティ: エンドツーエンドの mTLS でセキュリティ ポスチャーを強化し、Cloud Load Balancing を介してクライアントからバックエンド インフラストラクチャまでデータを保護します。クライアントからフロントエンドへの mTLS は昨年リリース済みで、バックエンドへの mTLS は現在プレビュー版です。
「Service Extensions プラグインを使用すると、リクエストパスやレスポンスパスでカスタムコードを直接実行し、ウェブサービスを簡単にカスタマイズできます。WebAssembly のようなオープン スタンダードに基づくエッジ プログラマビリティ ソリューションと、すぐに使える例が豊富にあれば、開発者はビジネスのカスタム要件に迅速に対応できます。」- Shopify、プリンシパル エンジニア、Justin Reid 氏
サービス中心のネットワーキングで開発を簡素化
最先端の生成 AI アプリケーションを構築する場合でも、既存のシステムをモダナイズする場合でも、サービス中心のアーキテクチャは迅速なイテレーションに不可欠です。Google はサービス中心のアーキテクチャのパイオニアとして、NetOps、DevOps、SecOps、デベロッパーの各チームがサービスのデプロイと管理を簡素化できるよう取り組んでいます。基盤となるネットワーキング レイヤとセキュリティ レイヤの複雑さを抽象化することで、開発者が複数のアプリケーションにわたってサービスを迅速にデプロイ、更新、保護できるようにしています。このたび、Google は、自動化、セキュリティ、スケールの分野で、サービス中心のネットワーキングを強化した新たなイノベーションを発表しました。
-
サービス ディスカバリと管理の合理化。App Hub のインテグレーションにより、サービス ディスカバリとカタログ化が自動化され、プロデューサーとコンシューマーのやり取りが簡素化されます。Service Health(今年後半にリリース予定)は、ネットワーク ドリブンなクロスリージョン フェイルオーバーで復元力のあるグローバル サービスを実現します。
-
マルチネットワーク、マルチサービス、マルチコンピューティングのデプロイを簡素化。2025 年には、Private Service Connect を使用して単一の GKE クラスタ内で複数のサービスを公開し、ピアリングされていない GKE クラスタ、Cloud Run、サービス メッシュからネイティブにアクセスできるようになります。
「Google との連携により、サービス ディスカバリが合理化され、開発者がより迅速かつ効率的にイテレーションできるようになりました。」- Goldman Sachs、エンジニアリング部門パートナー、Jonathan Perry 氏
進化する攻撃から最新の生成 AI アプリを保護
テラビット規模の DDoS、データの引き出しのための DNS トンネリング、従来の防御を回避する AI を駆使した脅威の増加など、高度な攻撃が急増しています。このようなサイバーリスクによって、ネットワーク セキュリティに対するアプローチの根本的な転換が余儀なくされ、従来の境界防御の枠を超えた高度なネットワーク セキュリティ機能の必要性が増しています。このたび、分散型マルチクラウド アプリケーションとインターネットに接続されたサービスを包括的に保護する、強力なネットワーク セキュリティの拡張機能を発表いたします。
Google の戦略は、以下の 3 つの柱で構成されています。


ワークロードの保護: 脅威耐性を最大 24 倍向上させる世界規模の DDoS 対策
分散型アプリケーションとインターネットに接続されたサービスを重大なネットワーク攻撃ベクトルから保護することは、極めて重要です。本日は、次のような重要な機能強化についてご紹介します。
-
DNS Armor: DNS トラフィックは適切なモニタリングが不足していることが多く、データの引き出しの主要なターゲットとなっています。攻撃者は、DNS トンネリングやドメイン生成アルゴリズム(DGA)などの高度な手法を使用して、この盲点を突き、従来のセキュリティ制御を回避します。DNS Armor は、Infoblox Threat Defense を活用して、毎日 700 億件の DNS イベントを可視化することで、DNS ベースのデータ引き出しの攻撃を検出します。今年、プレビュー版で利用可能になる予定です。
-
セキュリティ ポスチャーの強化の適用: Cloud Armor の新しい階層型ポリシーを使用して、組織全体で一貫した保護を実現し、セキュリティ ポスチャーを強化します。新しい種類のネットワークと Cloud NGFW 階層型ファイアウォール ポリシー用の新しいファイアウォール タグを使用して、ネットワーク アーキテクチャに依存しないきめ細かい保護を適用します。今四半期にプレビュー版の提供を開始します。
-
2024 年には、他の主要なパブリック クラウドと比較して最大 24 倍の効率を実現する Cloud NGFW Enterprise をリリースしました。Google は、2025 年後半にリリース予定の新しいレイヤ 7 ドメイン フィルタリングで Cloud NGFW の改善を続けています。これにより、ファイアウォール管理者は、許可された宛先のみへのアウトバウンド ウェブ トラフィックをモニタリングおよび制御できるようになります。
「当社は、Google Cloud 上の重要なアプリケーションとウェブサイトを保護するために、Cloud NGFW と Cloud Armor を使用しています。Next で発表された新しいネットワーク セキュリティのイノベーションは、ユーザーの保護を強化し、ネットワーク セキュリティの管理を簡素化するのに役立っています。」- UKG、セキュリティ エンジニアリング担当シニア ディレクター、Jason Jones 氏
データの保護: インライン ネットワーク DLP の導入
データドリブンな現代において、企業の知的財産は最も価値のある資産です。しかし、そのセキュリティとコンプライアンスを保証することは簡単ではありません。Google は、保存データと転送中のデータの両方での堅牢かつ合理化されたデータ損失防止(DLP)の必要性を理解しています。まもなくリリースされる Secure Web Proxy とアプリケーション ロードバランサ向けのインライン ネットワーク DLP は、Service Extensions を使用してサードパーティ(Symantec DLP)ソリューションと統合することで、転送中の機密データのリアルタイム保護を実現します。今四半期に提供されるプレビュー版では、インライン ネットワーク DLP により、パフォーマンスやアジリティを損なうことなく、重要なデータを保護し、コンプライアンスを維持できます。
オープンなセキュリティ エコシステム: サードパーティのセキュリティ挿入
Google は、お客様固有のニーズに合わせて保護機能をカスタマイズし、お好みのセキュリティ ソリューションを柔軟に選択できるようにしています。より高度なインテグレーションでセキュリティ パートナー エコシステムを拡大したいと考えているためです。Google は先日、Network Security Integration を使用して、パートナーのネットワーク サービスや仮想アプライアンスを Google Cloud ワークロードに挿入できるようになったことを発表しました。一般提供が開始されたこの機能を使用すると、ルーティング ポリシーやネットワーク アーキテクチャを変更することなく、ハイブリッド環境やマルチクラウド環境全体で一貫したポリシーを維持できます。
さらに、ウェブと API の保護のエコシステムを拡大するために、Imperva と連携して Imperva Application Security を Cloud Load Balancing と統合しました。また、この統合は Service Extensions を通じて行われており、Google Cloud Marketplace で提供が開始されています。
Cloud WAN: AI 時代のエンタープライズ バックボーン
現代のビジネスをつなげるのは、きわめて複雑です。お客様は、さまざまなネットワークやセキュリティ アーキテクチャに対処する必要があり、信頼性、アプリケーションの速度、費用のバランスを取るために難しい選択を迫られています。その結果、最適な結果が得られないことも多いうえに、管理が難しく、セキュリティ ポスチャーが弱まった、複雑なカスタム ソリューションが生まれます。Google の最新のクロスクラウド ネットワーク ソリューションである Cloud WAN は、信頼性とセキュリティに優れたフルマネージド型のエンタープライズ バックボーンであり、エンタープライズ WAN アーキテクチャを変革してこうした課題に対処します。
Cloud WAN には、次のような大きなメリットがあります。
-
コロケーション施設を活用したお客様管理の WAN ソリューションと比較して、総所有コスト(TCO)を最大 40% 削減1
-
99.99% の信頼性を誇る Google の広範なバックボーン ネットワークによるグローバルなリーチとパフォーマンス
-
パブリック インターネットと比較してパフォーマンスが最大 40% 向上するクロスクラウド ネットワーク2
-
主要な SD-WAN ベンダーやセキュリティ ベンダーと緊密に統合されたオープンで柔軟なエコシステム
詳しくは、こちらでお知らせの全文をご覧ください。
AI 時代を実現するネットワーク
Google のクラウド ネットワーキング プロダクトとソリューションは、世界中の組織を接続、簡素化、モダナイズし、保護する機能を提供します。これらの新しいイノベーションと、新しい Cloud WAN により、Google はこれからも新しいテクノロジー、サービス、アプリケーション、ロケーションに適応する柔軟性と、AI 時代に必要なアジリティを提供していきます。
Google Cloud Next 2025 の発表内容の詳細については、クロスクラウド ネットワーク イノベーション セッションをご視聴ください。また、ネットワーキングに関する有意義なブレイクアウト セッションも多数ご用意しています。
1. アーキテクチャには SD-WAN とサードパーティのファイアウォールが含まれており、マルチサイト コロケーション施設を使用したお客様管理の WAN と、Google Cloud が管理およびホストする WAN を比較しています。2. テストでは、ターゲットへのトラフィックがクロスクラウド ネットワークを経由した場合、同じターゲットへのトラフィックがパブリック インターネットを経由した場合と比較して、ネットワーク レイテンシが 40% 以上短縮されました。
-クラウド ネットワーキング担当バイス プレジデント、Muninder Sambi
-クラウド ネットワーキング担当バイス プレジデント兼ゼネラル マネージャー、Rob Enns