デベロッパー

Google Cloud グローバル外部 HTTP(S) ロードバランサ - 詳細

2022年8月12日

https://storage.googleapis.com/gweb-cloudblog-publish/images/GCLB_8.max-2000x2000.png

Google Cloud Japan Team

※この投稿は米国時間 2022 年 7 月 29 日に、Google Cloud blog に投稿されたものの抄訳です。

クラウドでワークロードをプロビジョニングしてアプリケーションを提供する場合、ロードバランサ（LB）をそのアプリケーションまたはサービスのフロントエンドに配置することを強くおすすめします。ロードバランサは、リクエストを処理できる容量を備えたさまざまなバックエンド（インスタンスグループ、ネットワークエンドポイントグループ、Cloud Storage など）に、ユーザーアプリケーションのリクエストをリダイレクトします。

Google Cloud のロードバランシングは、最大限のスケーラビリティを備えた分散型の冗長化されたマネージドサービスです。グローバル外部、リージョン外部、リージョン内部など、さまざまな種類があります。Cloud Load Balancing については、こちらのブログ投稿をご覧ください。

ここでは、グローバル外部 HTTP(S) ロードバランシングを中心に取り上げます。この LB には以下の 2 つのモードがあります。

グローバル外部 HTTP(S) ロードバランサ。このマネージドサービスは、Google Front End（GFE）を基盤として構築されています。HTTP(S) 外部ロードバランサの最新バージョンであり、オープンソースの Envoy プロキシを使用して、高度なトラフィック管理機能（トラフィックのミラーリング、重み付けに基づくトラフィック分割、リクエストやレスポンスに基づくヘッダー変換など）をサポートします。詳細については、高度なトラフィック管理（Envoy）を使用した外部 HTTP(S) ロードバランサの Codelab をご確認ください。
グローバル外部 HTTP(S) ロードバランサ（従来型）。このマネージドサービスは、Google Front End（GFE）を基盤として構築されています。これは、プレミアムネットワークサービスティアではグローバルで、スタンダードネットワークサービスティアではリージョンになります（プレミアムとスタンダードの違いについては、このブログ記事でさらに詳しく説明します）。

前述のとおり、グローバル外部 HTTP(S) ロードバランサは、HTTP(S) 外部ロードバランサの新しいバージョンであり、高度なトラフィック管理機能を備えています。ただし設計上、対象とするユースケースと必要な機能を特定してからオプションを選択することをおすすめします。サポートされるロードバランシング機能の詳細については、「ロードバランサの機能」や「外部 HTTP(S) ロードバランシングのユースケース」のドキュメントを参照してください。このブログ記事では、Google Cloud グローバル外部 HTTP(S) ロードバランシングの 2 つのモードについて説明します。

最初に、アーキテクチャの観点から考慮するべき次の主要な要素について分析してみましょう。下の図 1 は、グローバル外部 HTTP(S) ロードバランサと従来のグローバル外部 HTTP(S) ロードバランサのアーキテクチャの概要を示しています。

注: 次のアーキテクチャは、プレミアムネットワークサービスティアでデプロイするとグローバル外部 HTTP(S) ロードバランサ（従来）にも適用できます。詳細については、このブログ投稿の後半で紹介します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/GCLB_7.max-1300x1300.png

図 1: Google Cloud グローバルロードバランサのアーキテクチャの概要（クリックして拡大）

パフォーマンスの向上: Google Cloud グローバルロードバランサの背後でホストされているアプリケーションにトラフィックを追加して、クライアントやエンドユーザーに最も近いポイントから Google の信頼性の高いグローバルネットワークインフラストラクチャに入れる機能（プレミアムネットワークサービスティアで有効）を提供し、クライアントとバックエンドサーバー間のレイテンシを低減します。また、事前定義されたポリシーとヘルスチェックの指標に基づいてバックエンドインスタンスに負荷を分散して、リクエストを処理するのに十分な容量のあるインスタンスにリダイレクトすることで、最終的に全体のパフォーマンスを最適化できます。さらに、コンテンツ配信の機能を有効にすると、画像や動画などの静的コンテンツを Google のエッジロケーション（ユーザーの近くでキャッシュおよび配信）にキャッシュ保存して、パフォーマンスをさらに最適化できます。

セキュリティの最適化: アプリケーションやサービスへの最初のエントリポイントとして機能し、Google のエッジロケーションでクライアント接続を終了します。トラフィックは、バックエンドに転送される前に、ネットワークレイヤの DDoS 攻撃やアプリケーションレイヤ攻撃について検査されます。これは、バックエンドシステムに到達する前にこうした攻撃を軽減できる最適なアプローチです。また、Google Cloud Armor を使用してアプリケーションレイヤのセキュリティを確立し、Identity-Aware Proxy で HTTPS によってアクセスされるアプリケーションの一元的な認可レイヤを確立することで、セキュリティをさらに強化できます。これらの機能は、クラウド環境を保護する多層防御を可能にする重要な要素です。

復元性: ヘルスチェック指標に合格しなかったインスタンスを再起動するための自動修復、障害シナリオが発生した場合にバックエンドインスタンス（同一または別のリージョン）にトラフィックをリダイレクトする機能によって、全体的なソリューションの復元性が向上します。

柔軟性: 柔軟なハイブリッドアーキテクチャを提供して、オンプレミスまたは他のクラウドに存在するバックエンドにクラウドのロードバランシング機能を拡張します。これは、さまざまなハイブリッド戦略を可能にする重要な要素です。このようなアーキテクチャは、従来（オンプレミス）のソリューションから最新のクラウドベースソリューションへの短期的な移行によって推進される場合もあれば、特定の機能を有効化したり特定のコンプライアンス要件を充足したりするために、アーキテクチャ決定が長期にわたって行われる場合もあります。

運用の簡素化: マネージドサービスという性質上、インフラストラクチャの構築やピーク時間におけるスケーリングについて心配する必要がなく、サーバーレス機能をグローバルレベルで利用できます。また、Google のグローバル外部 HTTP(S) ロードバランサ（プレミアムティア）を使用すると、単一のエニーキャスト IP がフロントエンドで使用され、グローバルに分散できます。これにより、リージョンごとにロードバランサをデプロイしたり、DNS ソリューションとポリシーのレイヤを使用してグローバルおよびリージョンレベルでトラフィックをリダイレクトしたりする必要がなくなります。

Google Cloud のグローバル HTTP(S) ロードバランサは、どのようにしてこうしたアーキテクチャ上の利点をもたらすのでしょうか？

その答えを簡単にするために、下の図 2 に示す Google Cloud グローバル HTTP(S) ロードバランサのアーキテクチャコンポーネントを分析する必要があります。このアーキテクチャの概要は、どちらのモードにも当てはまりますが、スタンダードティアをグローバル外部 HTTP(S) ロードバランサ（従来型）と併せて使用する場合は除きます。これについては、後ほどこのブログで説明します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/GCLB_5.max-1600x1600.png

図 2: Google Cloud ロードバランサのアーキテクチャコンポーネント（クリックして拡大）

ソフトウェア定義されたロードバランシング: Google Cloud のグローバルロードバランシングはハードウェアベースではありません。マネージドサービスとして提供される、ソフトウェア定義の完全分散型ソリューションです。外部ロードバランサは、Google Front End（GFE）に存在します。GFE は世界中に分散され、Google のポイントオブプレゼンス（POP）に配置されています。GFE は他のシステムやコントロールプレーンと連携してグローバルロードバランシングを実行します。適切な証明書を使用し、前方秘匿性に対応するなどのベストプラクティスに沿ってすべての安全な HTTP 接続を（可能な限りクライアントの近くで）終了するため、GFE 機能はこのようなアーキテクチャでは重要な要素となります。さらに、GFE は、Google グローバルネットワークのエッジレイヤ（POP）での DoS 攻撃に対する保護も適用します。
Google グローバルネットワーク: 高度にプロビジョニングされた、低レイテンシのネットワークです。Gmail、Google 検索、YouTube などの高度にスケーラブルなサービスを支えているネットワークと同じものです。Google Cloud グローバルロードバランシングは、これと同じフロントエンドインフラストラクチャ（GFE）上に構築されています。さらに、Google の海底ケーブルは、100 を超えるネットワークエッジロケーション（POP）を含むクラウドインフラストラクチャを相互接続しているため、このグローバルネットワークで重要な役割を果たしています。このネットワークにより、トラフィックリクエストの送信元にできるだけ近い場所で Google バックボーンにユーザートラフィックを取り込めるようになり、ユーザーエクスペリエンスの向上につながっています。

このような接続性はプレミアムネットワークサービスティアと呼ばれ、図 3 に示すように、Google の高速で信頼性の高いプライベートグローバルネットワークを介して移動距離を最大化する「コールドポテトルーティング」アプローチを採用しています。この方法は、公共のインターネットを経由してトラフィックをエンドツーエンドでルーティングするよりも効率的です。通常、公共のインターネットでは、ローカル ISP はトラフィックを別の ISP に渡します（ほとんどの場合、宛先に到達するまでにトラフィックは複数の ISP を経由します）。その結果、複数の ISP とネットワーキングホップを通過するトラフィックには、パス全体でより高いレイテンシと帯域幅の制約が生じます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/GCLB_6.max-1400x1400.png

図 3: Google Cloud ロードバランシングを使用したプレミアムネットワークサービスティア（クリックして拡大）

Google Cloud グローバル外部ロードバランサ（従来型）では、単一のエニーキャスト仮想 IP アドレス（VIP）で上記のように動作するプレミアムティアを選択するオプションがあります。なお、スタンダードティアも選択できます。この場合、図 4 に示すように、グローバル外部ロードバランサ（従来型）がリージョンレベルで動作し、リージョンごとに IP および転送ルールが存在し、バックエンドはそのリージョン IP と転送ルールと同じリージョンに存在する必要があります。

プレミアムティアとは対照的に、スタンダードティアのトラフィックルーティングはホットポテトルーティングアプローチに基づいており、図 4 に示すように、宛先が別のリージョンにある場合でも、バックエンドインスタンスからの送信トラフィックはそのリージョンのインターネットピアリングから接続される Google のネットワークに存在します。スタンダードティアでは、トラフィックはインターネットを介してルーティングされ、場合によっては複数の ISP を経由して、異なるリージョンにある宛先の IP に到達します。そのため、プレミアムティアよりも低価格であり、レイテンシがあまり問題にならない特定のユースケースで使用できます。なお、システムと想定されるユーザーがすべて同じリージョンに存在する場合もあります。詳細については、こちらのブログ投稿をご覧ください。したがって、アーキテクチャ全体とその機能に影響するため、どちらのティアを選択するのかを決定することが重要です。詳しくは、このネットワークサービスティアのディシジョンツリーを参照してください。

https://storage.googleapis.com/gweb-cloudblog-publish/images/GCLB_3.max-1400x1400.png

図 4: Google Cloud ロードバランシングを使用したスタンダードネットワークサービスティア（クリックして拡大）

グローバル（外部）転送ルール: グローバル転送ルールは、Google Front End（GFE）で配布されて適用されます。グローバル転送ルールにより、単一のグローバルエニーキャスト IP が提供されます。グローバル外部 HTTP(S) ロードバランサとグローバル外部 HTTP(S) ロードバランサ（従来型）をプレミアムティアで使用している場合、この IP は、IPv4 または IPv6 にできます。これらは GFE に登録され、サイト、アプリケーション、バックエンドバケットの DNS レコードで使用できます。グローバルに分散されたソリューションに関して、各リージョンの IP と DNS に悩まされることはありません。ただし、スタンダードティアでグローバル外部 HTTP(S) ロードバランシング（従来型）を使用している場合、転送ルールはリージョンレベルで動作し、バックエンドが転送ルールを含む同じリージョンに存在する必要があります（図 4 を参照）。
URL マップ: HTTP(S) リクエストが特定のエニーキャストまたはリージョン VIP 宛てに送信された後、リクエストは Google エッジフロントエンドに到達し、ロードバランサがリクエストのルーティング先を（特定のバックエンドサービスまたはバックエンドバケットに）決定する必要があります。この決定は、転送ルールと HTTP(S) プロキシによってリクエストが転送された後に、URL マップで定義されたルールに基づいて行われます。このアプローチにより、グローバル HTTP(S) ロードバランサは URL マップレベルで事前に構成されたルールに基づいて、リクエストを異なる宛先にルーティングするために単一の URL マップを使用できます。図 5 は、URL マップのアーキテクチャコンポーネントと、それが全体的なグローバル外部 HTTP(S) ロードバランサアーキテクチャに適合する場所を示しています。また、URL マップでは、追加の一致条件を使用できる高度なトラフィック管理を構成できます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/GCLB_4.max-1500x1500.png

図 5: URL マップアーキテクチャコンポーネント（クリックして拡大）

このアプローチを使用すると、ロードバランシングソリューションをフレキシブルに設計して、さまざまな要件に基づいてトラフィックを動作および分散させることができます。要件には以下が含まれます（ただしこれらに限定されません）。

GFE レベルのロードバランサが、トラフィックを処理できる容量を持つトラフィックソースに最も近いインスタンスのグループへとトラフィックをリダイレクトできる近接性ベースのルーティング（プレミアムティアのクラウドグローバルロードバランサまたは従来のグローバルロードバランサを使用している場合はクロスリージョンロードバランシング）。
アプリケーションの特定の部分に対するリクエストなど、URL コンテンツに基づくトラフィックのルーティング。たとえば、マルチメディアを容量の大きいインスタンスグループにリダイレクトし、静的コンテンツへと膨張したトラフィックをCloud CDN から提供することで、ユーザーエクスペリエンスを向上させ、レイテンシを短縮できます。URL マップは、処理する URL ごとにホスト名とパスの部分を使用して、この動作を実行します。このような処理により、ロードバランサが HTTP ヘッダーと URL クエリパラメータに基づいてトラフィックルーティングを決定する、ヘッダーベースおよびパラメータベースのルーティングが提供されます。これにより、追加のティアをデプロイする必要がないため、最終的にクラウドアーキテクチャを簡素化するのに役立ちます。その結果として、Google Cloud グローバル HTTP(S) をさまざまなユースケースで使用できます。特に、次のような高度なトラフィック管理が使用されている場合に有効です。

A/B テスト
バックエンドで実行されているさまざまなサービスにユーザーのトラフィックをリダイレクトする
デバイスのさまざまなカテゴリやリクエスト送信元の地理的位置情報に基づいて、多様なページとエクスペリエンスを提供することで、地理情報関連のコンテンツまたはデバイスタイプに基づいたコンテンツを提供する

バックエンドサービス: 実際のアプリケーションインスタンス、関連するヘルスチェックとバックエンドサービス、分散モードを論理的にグループ化したものです。正常なインスタンスはどれか、過剰に使用されているインスタンスはどれか（CPU の使用率、インスタンスごとの 1 秒あたりのリクエストから）、自動スケーリングをトリガーするタイミングを判断するのに役立ちます。構成の観点から、リクエストをバックエンドサービスにルーティングするようにロードバランシングサービスを構成する必要があります。詳細については、バックエンドサービスの概要のドキュメントを参照してください。
バックエンド: Google Cloud ロードバランサからトラフィックを受信するエンドポイントを指します。バックエンドは、自動スケーリングの有無にかかわらず、マネージドインスタンスグループを使用して仮想マシンを追加および管理するインスタンスグループになることも、非マネージドインスタンスグループになることもできます。または、ネットワークエンドポイントグループ（NEG）を基盤にすることも可能です。この場合、コンテナネイティブのロードバランシングを提供するコンテナ化アプリケーション、トラフィックをオンプレミスまたは他のクラウドに送信するハイブリッドアーキテクチャ、Cloud Run、App Engine、Cloud Functions、API ゲートウェイサービスを使用したサーバーレスアプリケーションなど、複数のユースケースに対応します。

注: 可能な場合、ロードバランサでHTTP/3を有効にして、高レイテンシ接続でのウェブページの読み込み時間とスループットを改善できます。

まとめ

Google Cloud には、さまざまなユースケースの設計を簡素化するためのロードバランシングのオプションが複数用意されています。グローバル外部 HTTP(S) ロードバランシングには、このロードバランシングが提供する 2 つのタイプまたはモードがあります。したがって、アーキテクトやデザイナーは、対象となるソリューションとアプリケーションの要件を最初に理解したうえで、どのタイプのロードバランサを選択すれば最適な設計になるかを決定する必要があります。また、Google Cloud が提供するロードバランシングは、シンプルなものから非常に高度で洗練された設計やユースケースにまでおよびます。設計上の一般的な推奨事項として、常にシンプルで具体的なユースケースから取り組むことをおすすめします。その後、高度なルールとポリシーを定義することでさらに機能を追加して強化していくことができます。

- Google Cloud（ドバイ）パートナー担当カスタマーエンジニア Marwan Al shawi
- デベロッパーリレーションズエンジニア Ammett Williams

投稿先