内部应用负载均衡器概览

本文档介绍配置内部应用负载均衡器时需要了解的概念。

Google Cloud 内部应用负载均衡器是一种基于代理的第 7 层负载均衡器，可让您在单个内部 IP 地址后面运行和扩缩服务。内部应用负载均衡器会将 HTTP 和 HTTPS 流量分配到各个 Google Cloud 平台（例如 Compute Engine、Google Kubernetes Engine [GKE] 和 Cloud Run）上托管的后端。如需了解详情，请参阅用例。

操作模式

您可以将内部应用负载均衡器配置为以下模式：

跨区域内部应用负载均衡器。这是一个多区域负载均衡器，它作为开源 Envoy 代理上的托管式服务实现。跨区域模式使您可以将流量负载均衡到全球分布的后端服务，包括确保流量定向到最近后端的流量管理。此负载均衡器还可实现高可用性。将后端放在多个区域中有助于避免单区域故障。如果一个区域的后端发生故障，流量可以故障切换到另一个区域。

区域级内部应用负载均衡器。这是一个区域级负载均衡器，它作为开源 Envoy 代理上的托管式服务实现。区域级模式要求后端位于单个 Google Cloud 区域中。客户端可以仅限于该区域，也可以位于任何区域，具体取决于转发规则是停用还是启用全球访问权限。此负载均衡器启用了基于 HTTP 或 HTTPS 参数的丰富的流量控制功能。配置此负载均衡器后，它会根据流量需求自动分配 Envoy 代理。

下表介绍了跨区域模式与区域级模式之间的重要差异：

负载均衡器模式	功能
负载均衡器模式	负载均衡器的虚拟 IP 地址 (VIP)	客户端访问	负载均衡后端	高可用性和故障切换
跨区域内部应用负载均衡器	从特定 Google Cloud 区域的子网分配。多个区域的 VIP 地址可以共享同一全球后端服务。如需配置基于 DNS 的全球负载均衡，您可以使用 DNS 路由政策将客户端请求路由到最近的 VIP 地址。	始终可在全球范围内访问。VPC 中任何 Google Cloud 区域的客户端都可以将流量发送到负载均衡器。	全球后端。负载均衡器可以将流量发送到任何区域的后端。	自动故障切换到同一区域或不同区域中的健康后端。
区域级内部应用负载均衡器	从特定 Google Cloud 区域的子网分配。	默认情况下不可全球访问。您可以视需要启用全球访问权限。	区域级后端。负载均衡器只能将流量发送到与负载均衡器的代理位于同一区域的后端。	自动故障切换到同一区域内的健康后端。

识别模式

控制台

在 Google Cloud 控制台中，前往负载均衡页面。

转到“负载均衡”

在负载均衡器标签页中，您可以看到负载均衡器类型、协议和区域。如果区域为空，则负载均衡器处于跨区域模式。下表总结了如何识别负载均衡器的模式。

负载均衡器模式	负载均衡器类型	访问权限类型	区域
跨区域内部应用负载均衡器	应用	内部
区域级内部应用负载均衡器	应用	内部	指定一个区域

gcloud

如需确定负载均衡器的模式，请运行以下命令：

gcloud compute forwarding-rules describe FORWARDING_RULE_NAME

在命令输出中，检查负载均衡方案、区域和网络层级。下表总结了如何识别负载均衡器的模式。

负载均衡器模式	负载均衡方案	转发规则
跨区域内部应用负载均衡器	INTERNAL_MANAGED	全局
区域级内部应用负载均衡器	INTERNAL_MANAGED	区域

架构和资源

下图展示了内部应用负载均衡器所需的 Google Cloud 资源。

跨区域内部应用负载均衡器

下图展示了同一 VPC 网络中高级层级的跨区域内部应用负载均衡器部署的组件。每条全球转发规则都使用客户端用于连接的区域级 IP 地址。

区域级内部应用负载均衡器

下图展示了高级层级的区域级内部应用负载均衡器部署的组件。

内部应用负载均衡器部署需要以下资源：

代理专用子网

在上图中，代理专用子网提供了一组 IP 地址，供 Google 用于代表您运行 Envoy 代理。您必须在使用内部应用负载均衡器的 VPC 网络的每个区域中创建一个代理专用子网。

下表介绍了跨区域模式和区域级模式下代理专用子网之间的差异。跨区域负载均衡器和区域级负载均衡器不能共享相同的子网。

负载均衡器模式代理专用子网 --purpose 标志的值

跨区域内部应用负载均衡器

负载均衡器模式	代理专用子网 `--purpose` 标志的值
跨区域内部应用负载均衡器	GLOBAL_MANAGED_PROXY 基于 Envoy 的跨区域负载均衡器必须在配置了该负载均衡器的每个区域中有一个代理专用子网。同一区域和网络中的跨区域负载均衡器代理共享同一个代理专用子网。
区域级内部应用负载均衡器	REGIONAL_MANAGED_PROXY 一个区域和 VPC 网络中的所有基于 Envoy 的区域级负载均衡器共享同一个代理专用子网

GLOBAL_MANAGED_PROXY

基于 Envoy 的跨区域负载均衡器必须在配置了该负载均衡器的每个区域中有一个代理专用子网。同一区域和网络中的跨区域负载均衡器代理共享同一个代理专用子网。

区域级内部应用负载均衡器

REGIONAL_MANAGED_PROXY

一个区域和 VPC 网络中的所有基于 Envoy 的区域级负载均衡器共享同一个代理专用子网

此外：

代理专用子网仅用于 Envoy 代理，不可用于您的后端。
一个区域和 VPC 网络中的所有内部应用负载均衡器的后端虚拟机或端点都会收到来自代理专用子网的连接。
内部应用负载均衡器的虚拟 IP 地址不位于代理专用子网中。负载均衡器的 IP 地址由其内部代管转发规则定义，如下所述。

转发规则和 IP 地址

转发规则会按照 IP 地址、端口和协议将流量路由到由目标代理和后端服务组成的负载均衡配置。

IP 地址规范。每条转发规则都会引用一个区域级 IP 地址，您可以在 DNS 记录中使用该地址以用于您的应用。您可以预留可用的静态 IP 地址，也可以让 Cloud Load Balancing 为您分配一个 IP 地址。我们建议您预留静态 IP 地址；否则，每当您删除转发规则并创建新的转发规则时，都必须使用新分配的临时 IP 地址更新 DNS 记录。

客户端使用 IP 地址和端口连接到负载均衡器的 Envoy 代理，转发规则的 IP 地址是负载均衡器的 IP 地址（有时称为虚拟 IP 地址或 VIP）。连接到负载均衡器的客户端必须使用 HTTP 1.1 或更高版本。如需查看受支持的协议的完整列表，请参阅负载均衡器功能比较。

与转发规则关联的内部 IP 地址可以来自与您的后端位于同一网络和区域的子网。

端口指定。应用负载均衡器的每条转发规则可以引用 1-65535 中的单个端口。如需支持多个端口，您必须配置多个转发规则。您可以将多条转发规则配置为使用相同的内部 IP 地址 (VIP) 并引用相同的目标 HTTP 或 HTTPS 代理，只要每条转发规则的 IP 地址、端口和协议的整体组合是唯一的即可。这样，您就可以使用具有共享网址映射的单个负载均衡器作为多个应用的代理。

内部应用负载均衡器使用的转发规则类型、IP 地址和负载均衡方案取决于负载均衡器的模式。

跨区域内部应用负载均衡器
	转发规则	`globalForwardingRules.insert` 方法
	区域级 IP 地址	`addresses.insert` 方法
	负载均衡方案	`INTERNAL_MANAGED`
	IP 地址（可选）	`SHARED_LOADBALANCER_VIP`
	从客户端到负载均衡器前端的路由	全球访问权限默认处于启用状态，以允许来自 VPC 中任何区域的客户端访问负载均衡器。后端可以位于多个区域中。
区域级内部应用负载均衡器
	转发规则	`forwardingRules.insert` 方法
	区域级 IP 地址	`addresses.insert` 方法
	负载均衡方案	`INTERNAL_MANAGED`
	IP 地址（可选）	`SHARED_LOADBALANCER_VIP`
	从客户端到负载均衡器前端的路由	您可以启用全球访问权限，以允许来自 VPC 中任何区域的客户端访问负载均衡器。后端也必须与负载均衡器位于同一区域。

转发规则和 VPC 网络

本部分介绍了内部应用负载均衡器使用的转发规则如何与 VPC 网络相关联。

负载均衡器模式	VPC 网络关联
跨区域内部应用负载均衡器区域级内部应用负载均衡器	区域级内部 IPv4 地址始终位于 VPC 网络内。创建转发规则时，您需要指定从中获取内部 IP 地址的子网。此子网必须位于创建代理专用子网的同一区域和 VPC 网络中。因此，存在隐含的网络关联。

目标代理

目标 HTTP 或 HTTPS 代理会终止来自客户端的 HTTP(S) 连接。HTTP(S) 代理会查询网址映射以确定如何将流量路由到后端。目标 HTTPS 代理使用 SSL 证书向客户端进行身份验证。

负载均衡器会保留原始客户端请求的 Host 标头。负载均衡器还会将两个 IP 地址附加到 X-Forwarded-For 标头：

连接到负载均衡器的客户端的 IP 地址
负载均衡器转发规则的 IP 地址

如果传入请求中没有 X-Forwarded-For 标头，则这两个 IP 地址为整个标头值。如果请求具有 X-Forwarded-For 标头，则这两个 IP 地址前保留其他信息，例如代理在连接到负载均衡器时记录的 IP 地址。负载均衡器不会验证此标头中最后两个 IP 地址之前的任何 IP 地址。

如果您作为后端服务器运行代理，则此代理通常会将更多信息附加到 X-Forwarded-For 标头，您的软件可能需要考虑到这一点。来自负载均衡器的代理请求来自代理专用子网中的 IP 地址，后端实例上的代理可能会记录此地址以及后端实例自己的 IP 地址。

根据应用需要处理的流量类型，您可以为负载均衡器配置目标 HTTP 代理或目标 HTTPS 代理。

下表显示了内部应用负载均衡器所需的目标代理 API：

负载均衡器模式	目标代理
跨区域内部应用负载均衡器	`targetHttpProxies` `targetHttpsProxies`
区域级内部应用负载均衡器	`regionTargetHttpProxies` `regionTargetHttpsProxies`

SSL 证书

使用目标 HTTPS 代理的内部应用负载均衡器需要私钥和 SSL 证书作为负载均衡器配置的一部分。

下表指定了每种模式下内部应用负载均衡器所需的 SSL 证书类型：

负载均衡器模式	SSL 证书类型
跨区域内部应用负载均衡器	Certificate Manager 自行管理的证书和 Google 管理的证书。 Certificate Manager 支持以下类型的 Google 管理的证书：使用公共 DNS 进行 DNS 授权。如需了解详情，请参阅部署具有 DNS 授权的 Google 管理的全球证书。私有 Certificate Authority Service。如需了解详情，请参阅创建由 CA Service 实例颁发的 Google 管理的证书。不支持具有负载均衡器授权的 Google 管理的证书。不支持 Compute Engine SSL 证书。
区域级内部应用负载均衡器	Compute Engine 区域 SSL 证书 Certificate Manager 自行管理的区域级证书和 Google 管理的证书。 Certificate Manager 支持以下类型的 Google 管理的证书：具有每个项目的 DNS 授权的 Google 管理的区域级证书。如需了解详情，请参阅部署 Google 管理的区域级证书。使用专用 Certificate Authority Service 的 Google 管理的区域级证书。如需了解详情，请参阅使用 CA Service 部署 Google 管理的区域级证书。不支持具有负载均衡器授权的 Google 管理的证书。

负载均衡器模式

SSL 证书类型

跨区域内部应用负载均衡器

Certificate Manager 自行管理的证书和 Google 管理的证书。

Certificate Manager 支持以下类型的 Google 管理的证书：

使用公共 DNS 进行 DNS 授权。如需了解详情，请参阅部署具有 DNS 授权的 Google 管理的全球证书。
私有 Certificate Authority Service。如需了解详情，请参阅创建由 CA Service 实例颁发的 Google 管理的证书。

不支持具有负载均衡器授权的 Google 管理的证书。

不支持 Compute Engine SSL 证书。

区域级内部应用负载均衡器

Compute Engine 区域 SSL 证书

Certificate Manager 自行管理的区域级证书和 Google 管理的证书。

Certificate Manager 支持以下类型的 Google 管理的证书：

具有每个项目的 DNS 授权的 Google 管理的区域级证书。如需了解详情，请参阅部署 Google 管理的区域级证书。
使用专用 Certificate Authority Service 的 Google 管理的区域级证书。如需了解详情，请参阅使用 CA Service 部署 Google 管理的区域级证书。

不支持具有负载均衡器授权的 Google 管理的证书。

网址映射

目标 HTTP(S) 代理使用网址映射根据 HTTP 属性（例如请求路径、Cookie 或标头）确定路由。根据确定的路由，代理会将客户端请求转发到特定的后端服务。网址映射可指定要执行的其他操作，如重写标头、向客户端发送重定向以及配置超时政策等。

下表指定了每种模式下内部应用负载均衡器所需的网址映射类型。

负载均衡器模式	网址映射类型
跨区域内部应用负载均衡器	`urlMaps`
区域级内部应用负载均衡器	`regionUrlMaps`

后端服务

后端服务向负载均衡器提供配置信息，以便后者将请求定向到其后端，例如 Compute Engine 实例组或网络端点组 (NEG)。如需详细了解后端服务，请参阅后端服务概览。

后端服务范围

下表指明了内部应用负载均衡器使用的后端服务资源和范围：

负载均衡器模式	后端服务资源
跨区域内部应用负载均衡器	`backendServices`
区域级内部应用负载均衡器	`regionBackendServices`

后端协议

应用负载均衡器的后端服务必须使用以下某个协议将请求发送到后端：

HTTP，其使用 HTTP/1.1 且不使用 TLS
HTTPS，其使用 HTTP/1.1 和 TLS
HTTP/2，其使用 HTTP/2 和 TLS（不支持无加密的 HTTP/2）。
H2C，其使用基于 TCP 的 HTTP/2。无需使用 TLS。传统应用负载均衡器不支持 H2C。

负载均衡器仅使用您指定的后端服务协议与其后端通信。如果负载均衡器无法使用指定的后端服务协议与后端通信，则不会回退为使用其他协议。

后端服务协议不需要匹配客户端与负载均衡器通信所用的协议。例如，客户端可以使用 HTTP/2 向负载均衡器发送请求，而负载均衡器可以使用 HTTP/1.1（HTTP 或 HTTPS）与后端进行通信。

后端

下表指定了每种模式下内部应用负载均衡器支持的后端功能。

负载均衡器模式	后端服务上支持的后端¹
	实例组²	可用区级 NEG³	互联网 NEG	无服务器 NEG	混合 NEG	Private Service Connect NEG
跨区域内部应用负载均衡器				Cloud Run
区域级内部应用负载均衡器				Cloud Run

¹ 后端服务上的后端必须是同一类型：全部都是实例组，或者全部都是同一类型的 NEG。此规则的一个例外情况是，您可以在同一后端服务中同时使用 GCE_VM_IP_PORT 可用区级 NEG 和混合 NEG 来支持混合架构。

² 同一后端服务支持组合使用可用区级非托管式实例组、可用区级托管式实例组和区域级托管式实例组。如果将自动扩缩功能用于作为两个或更多后端服务的后端的托管式实例组，请将实例组的自动扩缩政策配置为使用多个信号。

³ 可用区级 NEG 必须使用 GCE_VM_IP_PORT 端点。

后端和 VPC 网络

后端位置的限制取决于后端的类型。

对于实例组、可用区级 NEG 和混合连接 NEG，所有后端都必须位于与后端服务相同的项目和区域中。不过，负载均衡器可以引用与后端服务位于同一项目中，但使用其他 VPC 网络的后端。负载均衡器的 VPC 网络与后端 VPC 网络之间的连接可以使用 VPC 网络对等互连、Cloud VPN 隧道、Cloud Interconnect VLAN 连接或 Network Connectivity Center 框架进行配置。

后端网络定义
- 对于可用区级 NEG 和混合 NEG，您需要在创建 NEG 时明确指定 VPC 网络。
- 对于托管式实例组，VPC 网络在实例模板中定义。
- 对于非托管式实例组，实例组的 VPC 网络设置为与添加到实例组的第一个虚拟机的 nic0 接口的 VPC 网络相匹配。
后端网络要求

您的后端网络必须满足以下网络要求之一：
- 后端的 VPC 网络必须与转发规则的 VPC 网络完全匹配。
- 后端的 VPC 网络必须使用 VPC 网络对等互连连接到转发规则的 VPC 网络。您必须配置子网路由交换，以允许转发规则 VPC 网络中的代理专用子网与后端实例或端点所使用的子网之间进行通信。

后端的 VPC 网络和转发规则的 VPC 网络都必须是附加到同一个 Network Connectivity Center hub 上的 VPC spoke。导入和导出过滤条件必须允许转发规则 VPC 网络中的代理专用子网与后端实例或端点所使用的子网之间进行通信。

对于所有其他类型的后端，所有后端都必须位于同一 VPC 网络和区域中。

后端和网络接口

如果您使用实例组后端，数据包始终会递送到 nic0。如果您想将数据包发送到非 nic0 接口（vNIC 或 Dynamic Network Interface），请改用 NEG 后端。

如果您使用的是可用区级 NEG 后端，数据包会发送到 NEG 中的端点所代表的任何网络接口。NEG 端点必须与 NEG 明确定义的 VPC 网络位于同一 VPC 网络中。

后端子集

后端子集化是区域级内部应用负载均衡器支持的一项可选功能，通过为每个代理实例分配后端子集来提高性能和可伸缩性。

默认情况下，后端子集化处于停用状态。如需了解如何启用此功能，请参阅区域级内部应用负载均衡器的后端子集化。

健康检查

每项后端服务都会指定健康检查，用于定期监控后端是否已准备好从负载均衡器接收连接。这样可以降低向无法处理请求的后端发送请求的风险。健康检查不会检查应用本身是否正常运行。

为了使健康检查探测成功运行，您必须创建入站流量允许防火墙规则，以允许健康检查探测到达您的后端实例。通常，健康检查探测源自 Google 的集中式健康检查机制。但是，对于混合 NEG，健康检查源自代理专用子网。如需了解详情，请参阅分布式 Envoy 健康检查。

健康检查协议

最佳实践是使用其协议与后端服务的协议匹配的健康检查，不过这并非强制性要求，而且也不一定可行。例如，HTTP/2 健康检查能够最准确地测试后端的 HTTP/2 连接性。相比之下，使用混合 NEG 后端的内部应用负载均衡器不支持 gRPC 健康检查。如需查看受支持的健康检查协议的列表，请参阅健康检查部分中的负载均衡功能。

下表指定了内部应用负载均衡器支持的健康检查范围：

负载均衡器模式	健康检查类型
跨区域内部应用负载均衡器	`healthChecks`
区域级内部应用负载均衡器	`regionHealthChecks`

如需详细了解健康检查，请参阅以下内容：

防火墙规则

内部应用负载均衡器需要以下防火墙规则：

允许来自 Google 的中央健康检查范围的流量的入站流量允许规则。如需详细了解特定健康检查探测 IP 地址范围以及必须允许来自这些地址的流量的原因，请参阅探测 IP 范围和防火墙规则。
允许来自代理专用子网的流量的入站流量允许规则。

这些范围的防火墙规则要求有一些例外情况：

混合 NEG 不需要允许来自 Google 健康检查探测范围的流量。但是，如果您在单个后端服务中结合使用混合和可用区级 NEG，则需要允许来自可用区级 NEG 的 Google 健康检查探测范围的流量。
对于区域级互联网 NEG，健康检查是可选项。来自使用区域级互联网 NEG 的负载均衡器的流量源自代理专用子网，然后（使用 Cloud NAT）经过 NAT 转换为手动或自动分配的 NAT IP 地址。此流量包括健康检查探测以及从负载均衡器发送到后端的用户请求。如需了解详情，请参阅区域级 NEG：使用 Cloud NAT 网关。

客户端访问

客户端可以位于内部 TCP/UDP 负载均衡器所在的网络中，或者位于使用 VPC 网络对等互连连接的 VPC 网络中。

对于跨区域内部应用负载均衡器，全球访问默认启用。来自 VPC 中任何区域的客户端都可以访问负载均衡器。

对于区域级内部应用负载均衡器，默认情况下，客户端必须与负载均衡器位于同一区域。您可以启用全球访问权限，以允许来自 VPC 中任何区域的客户端访问负载均衡器。

下表总结了区域级内部应用负载均衡器的客户端访问权限：

在停用全球访问权限的情况下	在启用全球访问权限的情况下
客户端必须位于负载均衡器所在的地区中。客户端还必须位于负载均衡器所在的 VPC 网络中，或者位于使用 VPC 网络对等互连连接到负载均衡器 VPC 网络的 VPC 网络中。	客户端可以位于任何地区中。客户端仍必须位于负载均衡器所在的 VPC 网络中，或者位于使用 VPC 网络对等互连连接到负载均衡器 VPC 网络的 VPC 网络中。
本地客户端可通过 Cloud VPN 隧道或 VLAN 连接访问负载均衡器。这些隧道或连接必须位于负载均衡器所在的地区中。	本地客户端可通过 Cloud VPN 隧道或 VLAN 连接访问负载均衡器。这些隧道或连接可以位于任何地区中。

GKE 支持

GKE 会通过以下方式使用内部应用负载均衡器：

使用 GKE Gateway Controller 创建的内部网关可以使用内部应用负载均衡器的任何模式。您可以通过选择 GatewayClass 来控制负载均衡器的模式。GKE Gateway Controller 始终使用 GCE_VM_IP_PORT 可用区级 NEG 后端。
使用 GKE Ingress 控制器创建的内部 Ingress 始终是区域级内部应用负载均衡器。GKE Gateway 控制器始终使用 GCE_VM_IP_PORT 可用区级 NEG 后端。

您可以使用由 GKE 服务创建和管理的 GCE_VM_IP_PORT 可用区级 NEG 作为任何应用负载均衡器或代理网络负载均衡器的后端。如需了解详情，请参阅通过独立可用区级 NEG 实现容器原生负载均衡机制。

共享 VPC 架构

内部应用负载均衡器支持使用共享 VPC 的网络。共享 VPC 可让组织将多个项目中的资源连接到一个公用 VPC 网络，让它们能够使用该网络中的内部 IP 地址安全高效地相互通信。如果您还不熟悉共享 VPC，请阅读共享 VPC 概览文档。

您可以通过多种方式在共享 VPC 网络中配置内部应用负载均衡器。无论部署类型如何，负载均衡器的所有组件都必须位于同一组织中。

子网和 IP 地址	前端组件	后端组件
在共享 VPC 宿主项目中创建所需的网络和子网（包括代理专用子网）。负载均衡器的内部 IP 地址可以在宿主项目或服务项目中定义，但它必须使用宿主项目中所需共享 VPC 网络的子网。地址本身来自所引用子网的主要 IP 地址范围。	区域内部 IP 地址、转发规则、目标 HTTP(S) 代理和关联的网址映射必须在同一项目中定义。此项目可以是宿主项目，也可以是服务项目。	您可以执行下列任一操作：在与前端组件相同的服务项目中创建后端服务和后端（实例组、无服务器 NEG 或任何其他受支持的后端类型）。根据需要在任意数量的服务项目中创建后端服务和后端（实例组、无服务器 NEG 或任何其他受支持的后端类型）。单个网址映射可以引用不同项目中的后端服务。这种类型的部署称为跨项目服务引用。每个后端服务都必须在其引用的后端所在的项目中定义。与后端服务相关的健康检查也必须在后端服务所在的项目中定义。

子网和 IP 地址

前端组件

后端组件

在共享 VPC 宿主项目中创建所需的网络和子网（包括代理专用子网）。

负载均衡器的内部 IP 地址可以在宿主项目或服务项目中定义，但它必须使用宿主项目中所需共享 VPC 网络的子网。地址本身来自所引用子网的主要 IP 地址范围。

区域内部 IP 地址、转发规则、目标 HTTP(S) 代理和关联的网址映射必须在同一项目中定义。此项目可以是宿主项目，也可以是服务项目。

您可以执行下列任一操作：

在与前端组件相同的服务项目中创建后端服务和后端（实例组、无服务器 NEG 或任何其他受支持的后端类型）。
根据需要在任意数量的服务项目中创建后端服务和后端（实例组、无服务器 NEG 或任何其他受支持的后端类型）。单个网址映射可以引用不同项目中的后端服务。这种类型的部署称为跨项目服务引用。

每个后端服务都必须在其引用的后端所在的项目中定义。与后端服务相关的健康检查也必须在后端服务所在的项目中定义。

虽然您可以在共享 VPC 宿主项目中创建所有负载均衡组件和后端，但此部署类型不会划分网络管理和服务开发责任。

服务项目中的所有负载均衡器组件和后端

以下架构图展示了标准共享 VPC 部署，其中所有负载均衡器组件和后端都位于服务项目中。所有应用负载均衡器都支持此部署类型。

负载均衡器使用宿主项目中的 IP 地址和子网。如果客户端与内部应用负载均衡器位于同一共享 VPC 网络和区域，则可以访问该负载均衡器。客户端可以位于宿主项目、连接的服务项目或任何连接的网络中。

共享 VPC 网络中的内部应用负载均衡器。 — 共享 VPC 网络中的内部应用负载均衡器（点击可放大）。

共享 VPC 环境中的无服务器后端

对于使用无服务器 NEG 后端的内部应用负载均衡器，提供支持的 Cloud Run 服务必须与后端服务和无服务器 NEG 位于同一服务项目中。负载均衡器的前端组件（转发规则、目标代理、网址映射）可以在宿主项目、后端组件所在的服务项目或者同一共享 VPC 环境中的任何其他服务项目中创建。

跨项目服务引用

跨项目服务引用是一种部署模型，其中负载均衡器的前端和网址映射位于一个项目中，而负载均衡器的后端服务和后端位于其他项目中。

借助跨项目服务引用，组织可以配置一个中央负载均衡器并将流量路由到跨多个不同项目分布的数百个服务。您可以在一个网址映射中集中管理所有流量路由规则和政策。您还可以将负载均衡器与一组主机名和 SSL 证书相关联。这样，您就可以优化部署应用所需的负载均衡器数量，并降低可管理性、运营费用和配额要求。

通过为每个职能团队设置不同的项目，您还可以实现组织中的角色分离。服务所有者可以专注于在服务项目中构建服务，而网络团队可以在另一个项目中预配和维护负载均衡器，这两个角色都可以使用跨项目服务引用进行连接。

服务所有者可以维护其服务公开的自主性，并控制哪些用户可以通过使用负载均衡器访问其服务。这是通过名为 Compute Load Balancer Services User 角色 (roles/compute.loadBalancerServiceUser) 的特殊 IAM 角色实现的。

对于内部应用负载均衡器，跨项目服务引用仅在共享 VPC 环境中受支持。

如需了解如何为内部应用负载均衡器配置共享 VPC（无论是否使用跨项目服务引用），请参阅设置使用共享 VPC 的内部应用负载均衡器。

跨项目服务引用的使用说明

如果后端服务具有区域级互联网 NEG 后端，则无法引用跨项目后端服务。所有其他后端类型均受支持。
Google Cloud 不会区分多个项目中使用同一名称的资源（例如，后端服务）。因此，当您使用跨项目服务引用时，我们建议您在组织内的项目中使用唯一的后端服务名称。

示例 1：不同服务项目中的负载均衡器前端和后端

以下是共享 VPC 部署的示例，其中负载均衡器的前端和网址映射在服务项目 A 中创建，而网址映射引用服务项目 B 中的后端服务。

在这种情况下，服务项目 A 中的 Network Admin 或 Load Balancer Admin 需要访问服务项目 B 中的后端服务。服务项目 B 的管理员将 Compute Load Balancer Services User 角色 (roles/compute.loadBalancerServiceUser) 授予服务项目 A 中希望引用服务项目 B 中的后端服务的负载均衡器管理员。

服务项目中的负载均衡器前端和网址映射。 — 不同服务项目中的负载均衡器前端和后端（点击可放大）。

示例 2：宿主项目中的负载均衡器前端和服务项目中的后端

以下是共享 VPC 部署的示例，其中负载均衡器的前端和网址映射在宿主项目中创建，后端服务（和后端）在服务项目中创建。

在这种情况下，宿主项目中的 Network Admin 或 Load Balancer Admin 需要访问服务项目中的后端服务。服务项目管理员将 Compute Load Balancer Services User 角色 (roles/compute.loadBalancerServiceUser) 授予宿主项目 A 中希望引用服务项目中的后端服务的负载均衡器管理员。

宿主项目中的负载均衡器前端和网址映射。 — 宿主项目中的负载均衡器前端和网址映射（点击可放大）。

超时和重试

内部应用负载均衡器支持以下类型的超时：

超时类型和说明	默认值	支持自定义值
超时类型和说明	默认值	跨区域	区域
后端服务超时请求和响应超时。表示从负载均衡器将请求的第一个字节发送到后端，到后端将 HTTP 响应的最后一个字节返回给负载均衡器之间允许的最长时间。如果后端未在此时间限制内将整个 HTTP 响应返回给负载均衡器，则剩余响应数据会被丢弃。	对于后端服务上的无服务器 NEG：60 分钟对于后端服务上的所有其他后端类型：30 秒
客户端 HTTP keepalive 超时客户端与负载均衡器的托管式 Envoy 代理之间的 TCP 连接可以处于空闲状态的最长时间。（同一 TCP 连接可用于多个 HTTP 请求）。	610 秒
后端 HTTP keepalive 超时负载均衡器的托管式 Envoy 代理与后端之间的 TCP 连接可以处于空闲状态的最长时间。（同一 TCP 连接可用于多个 HTTP 请求）。	10 分针（600 秒）

后端服务超时

可配置的后端服务超时表示负载均衡器等待后端处理 HTTP 请求并返回相应的 HTTP 响应的最长时间。除无服务器 NEG 外，后端服务超时的默认值为 30 秒。

例如，如果您要下载一个 500 MB 的文件，并且后端服务超时值为 90 秒，则负载均衡器期望后端在 90 秒内传送整个 500 MB 的文件。有时，配置的后端服务超时值可能会不够长，使得后端无法发送其完整的 HTTP 响应。在这种情况下，如果负载均衡器至少收到来自后端的 HTTP 响应标头，则负载均衡器会返回完整响应标头以及在后端服务超时内尽可能获取的响应正文部分。

建议您将后端服务超时设置为您希望后端处理 HTTP 响应所需的最长时间。如果后端上运行的软件需要更多时间来处理 HTTP 请求并返回完整响应，建议您延长后端服务超时。

后端服务超时接受 1 到 2,147,483,647 秒之间的值，但过大的值不是切实可行的配置选项。Google Cloud 也不保证底层 TCP 连接在后端服务超时的整个期间保持打开状态。客户端系统必须实现重试逻辑，而不是依赖 TCP 连接长时间保持打开状态。

对于与内部应用负载均衡器搭配使用的 WebSocket 连接，活跃的 WebSocket 连接不遵循后端服务超时。后端服务超时后，空闲的 WebSocket 连接会关闭。

Google Cloud 会定期重启或更改响应 Envoy 软件任务的数量。后端服务超时值越大，Envoy 任务重启或替换终止 TCP 连接的可能性就越大。

如需配置后端服务超时，请使用以下方法之一：

控制台

修改负载均衡器后端服务的超时字段。

gcloud

使用 gcloud compute backend-services update 命令修改后端服务资源的 --timeout 参数。

API

修改 regionBackendServices 资源的 timeoutSec 参数

客户端 HTTP keepalive 超时

客户端 HTTP keepalive 超时表示 TCP 连接在（下游）客户端和 Envoy 代理之间可以空闲的最长时间。默认客户端 HTTP keepalive 超时值为 610 秒。您可以将超时配置为 5 到 1,200 秒之间的值。

HTTP keepalive 超时也称为 TCP 空闲超时。

负载均衡器的客户端 HTTP keepalive 超时必须大于下游客户端或代理使用的 HTTP keepalive（TCP 空闲）超时。如果下行客户端的 HTTP keepalive（TCP 空闲）超时大于负载均衡器的客户端 HTTP keepalive 超时，则可能会出现竞态条件。从下行客户端的角度来看，已建立的 TCP 连接可以空闲的时间超过负载均衡器允许的时长。这意味着，在负载均衡器认为 TCP 连接已关闭后，下行客户端可以发送数据包。发生这种情况时，负载均衡器会以 TCP 重置 (RST) 数据包进行响应。

当客户端 HTTP keepalive 超时到期时，GFE 或 Envoy 代理会向客户端发送 TCP FIN 以正常关闭连接。

后端 HTTP keepalive 超时

内部应用负载均衡器是代理，它们在（下游）客户端和 Envoy 代理之间使用第一个 TCP 连接，在 Envoy 代理和后端之间使用第二个 TCP 连接。

负载均衡器的第二个 TCP 连接可能不会在每次请求后关闭；它们可以保持打开状态，以处理多个 HTTP 请求和响应。后端 HTTP keepalive 超时定义了负载均衡器与后端之间的 TCP 空闲超时。后端 HTTP keepalive 超时不适用于 WebSocket。

后端 keepalive 超时固定为 10 分钟（600 秒），无法更改。这有助于确保负载均衡器保持空闲连接至少 10 分钟。在此期限结束后，负载均衡器可以随时向后端发送终止数据包。

负载均衡器的后端 keepalive 超时必须小于后端上运行的软件使用的 keepalive 超时。这样可以避免出现竞态条件，在竞态条件下，后端的操作系统可能通过 TCP 重置 (RST) 关闭 TCP 连接。由于负载均衡器的后端 keepalive 超时不可配置，因此您必须配置后端软件，以使其 HTTP keepalive（TCP 空闲）超时值大于 600 秒。

当后端 HTTP keepalive 超时时，GFE 或 Envoy 代理会向后端虚拟机发送 TCP FIN 以正常关闭连接。

下表列出了修改常用 Web 服务器软件的 keepalive 超时值需要进行的更改。

Web 服务器软件	参数	默认设置	推荐设置
Apache	KeepAliveTimeout	`KeepAliveTimeout 5`	`KeepAliveTimeout 620`
nginx	keepalive_timeout	`keepalive_timeout 75s;`	`keepalive_timeout 620s;`

重试

如需配置重试，您可以在网址映射中使用重试政策。默认重试次数 (numRetries) 为 1。可配置的 perTryTimeout 上限为 24 小时。

如果没有重试政策，则没有 HTTP 正文（例如，GET 请求）并导致 HTTP 502、503 或 504 响应的失败请求会重试一次。

HTTP POST 请求不会重试。

重试请求仅会为最终响应生成一个日志条目。

如需了解详情，请参阅内部应用负载均衡器日志记录和监控。

访问连接的网络

您的客户端可以使用以下方式从连接的网络访问 VPC 网络中的内部应用负载均衡器：

VPC 网络对等互连
Cloud VPN 和 Cloud Interconnect

如需查看详细示例，请参阅内部应用负载均衡器和连接的网络。

会话亲和性

在应用负载均衡器的后端服务上配置的会话亲和性会尽力尝试将来自特定客户端的请求发送到同一个后端，只要运行状况良好的后端实例或端点的数量保持不变，并且之前选择的后端实例或端点未达到容量上限。均衡模式的目标容量决定了后端达到容量上限的条件。

下表概述了不同的应用负载均衡器支持的不同类型的会话亲和性选项。在下一部分会话亲和性类型中，我们将更详细地讨论每种会话亲和性类型。

表格：受支持的会话亲和性设置
产品	会话亲和性选项
跨区域内部应用负载均衡器区域级内部应用负载均衡器	无 (`NONE`) 客户端 IP (`CLIENT_IP`) 生成的 Cookie (`GENERATED_COOKIE`) 标头字段 (`HEADER_FIELD`) HTTP Cookie (`HTTP_COOKIE`) 基于有状态 Cookie 的亲和性 (`STRONG_COOKIE_AFFINITY`) 另外还需注意以下事项：负载均衡位置政策 (`localityLbPolicy`) 的有效默认值会根据您的会话亲和性设置而变化。如果未配置会话亲和性（即会话亲和性保持默认值 `NONE`），则 `localityLbPolicy` 的默认值为 `ROUND_ROBIN`。如果会话亲和性设置为 `NONE` 以外的值，则 `localityLbPolicy` 的默认值为 `MAGLEV`。对于内部应用负载均衡器，如果您使用加权流量拆分，请勿配置会话亲和性。即使您配置了该选项，也是加权流量拆分配置优先。

配置会话亲和性时请注意以下几点：

为进行身份验证或为了安全起见，请勿依赖会话亲和性。除了基于有状态 Cookie 的会话亲和性之外，只要服务后端和健康状况良好的后端数量发生变化，会话亲和性就会被破坏。如需了解详情，请参阅失去会话亲和性。
--session-affinity 和 --subsetting-policy 标志的默认值都是 NONE，并且一次只能将其中一个设置为不同的值。

会话亲和性的类型

内部应用负载均衡器的会话亲和性可分为以下类别之一：

基于哈希的会话亲和性（NONE、CLIENT_IP）
基于 HTTP 标头的会话亲和性 (HEADER_FIELD)
基于 Cookie 的会话亲和性（GENERATED_COOKIE、HTTP_COOKIE、STRONG_COOKIE_AFFINITY）

基于哈希的会话亲和性

对于基于哈希的会话亲和性，负载均衡器使用一致哈希算法来选择符合条件的后端。会话亲和性设置用于确定使用 IP 标头中的哪些字段来计算哈希。

基于哈希的会话亲和性可以是以下类型：

无
客户端 IP 亲和性

无

将会话亲和性设置为 NONE 不并不意味着没有会话亲和性。这意味着未明确配置任何会话亲和性选项。

始终会执行哈希处理来选择后端。将会话亲和性设置为 NONE 表示负载均衡器使用 5 元组哈希来选择后端。5 元组哈希由来源 IP 地址、来源端口、协议、目标 IP 地址和目标端口组成。

会话亲和性 NONE 是默认值。

客户端 IP 亲和性

客户端 IP 会话亲和性 (CLIENT_IP) 是根据数据包的来源 IP 地址和目标 IP 地址创建的二元组哈希。客户端 IP 亲和性会将来自同一客户端 IP 地址的所有请求转发到同一后端，只要该后端具有容量且健康状况良好。

使用客户端 IP 亲和性时，请注意以下几点：

只有在数据包直接发送到负载均衡器时，数据包目标 IP 地址才与负载均衡器转发规则的 IP 地址相同。
如果数据包在传送到 Google Cloud 负载均衡器之前由中间 NAT 或代理系统进行处理，则数据包来源 IP 地址可能与与原始客户端关联的 IP 地址不一致。在许多客户端共享同一有效源 IP 地址的情况下，某些后端虚拟机可能会比其他后端虚拟机接收更多连接或请求。

基于 HTTP 标头的会话亲和性

借助标头字段亲和性 (HEADER_FIELD)，系统会根据后端服务的 consistentHash.httpHeaderName 字段中的 HTTP 标头值将请求路由到后端。为了将请求分配到所有可用的后端，每个客户端都需要使用不同的 HTTP 标头值。

如果满足以下条件，则支持标头字段亲和性：

负载均衡位置政策为 RING_HASH 或 MAGLEV。
后端服务的 consistentHash 指定 HTTP 标头的名称 (httpHeaderName)。

基于 Cookie 的会话亲和性可以是以下类型：

生成的 Cookie 亲和性
HTTP Cookie 亲和性
基于有状态 Cookie 的会话亲和性

生成的 Cookie 亲和性

如果您使用生成的 Cookie 亲和性 (GENERATED_COOKIE)，负载均衡器会在 Set-Cookie 标头中添加一个 HTTP Cookie，以响应初始 HTTP 请求。

生成的 Cookie 的名称因负载均衡器的类型而异。

产品	Cookie 名称
跨区域内部应用负载均衡器	`GCILB`
区域级内部应用负载均衡器	`GCILB`

生成的 Cookie 的路径属性始终是正斜杠 (/)，因此它适用于同一网址映射上的所有后端服务（前提是其他后端服务也使用生成的 Cookie 亲和性）。

您可以使用 affinityCookieTtlSec 后端服务参数将 Cookie 的存留时间 (TTL) 值配置为介于 0 和 1,209,600 秒（含边界值）之间的值。如果未指定 affinityCookieTtlSec，则默认 TTL 值为 0。

当客户端在 HTTP 请求的 Cookie 请求标头中包含生成的会话亲和性 Cookie 时，只要会话亲和性 Cookie 仍然有效，负载均衡器就会将这些请求定向到同一后端实例或端点。方法是将 Cookie 值映射到引用特定后端实例或端点的索引，并确保满足生成的 Cookie 会话亲和性要求。

如需使用生成的 Cookie 亲和性，请配置以下均衡模式和 localityLbPolicy 设置：

对于后端实例组，请使用 RATE 均衡模式。
对于后端服务的 localityLbPolicy，请使用 RING_HASH 或 MAGLEV。如果您未明确设置 localityLbPolicy，负载均衡器会将 MAGLEV 用作隐式默认值。

如需了解详情，请参阅失去会话亲和性。

HTTP Cookie 亲和性

如果您使用基于 HTTP Cookie 的亲和性 (HTTP_COOKIE)，负载均衡器会在 Set-Cookie 标头中添加 HTTP Cookie，以响应初始 HTTP 请求。您可以指定 Cookie 的名称、路径和存留时间 (TTL)。

所有应用负载均衡器都支持基于 HTTP Cookie 的亲和性。

您可以使用以下后端服务参数和有效值，来配置 Cookie 的 TTL 值（以秒、零点几秒 [以纳秒为单位] 或秒加零点几秒 [以纳秒为单位] 为单位）：

consistentHash.httpCookie.ttl.seconds 可设置为介于 0 和 315576000000 之间（含边界值）的值。
consistentHash.httpCookie.ttl.nanos 可以设置为介于 0 和 999999999 之间（含边界值）的值。由于单位是纳秒，因此 999999999 表示 .999999999 秒。

如果未指定 consistentHash.httpCookie.ttl.seconds 和 consistentHash.httpCookie.ttl.nanos，则改为使用 affinityCookieTtlSec 后端服务参数的值。如果未指定 affinityCookieTtlSec，则默认 TTL 值为 0。

当客户端在 HTTP 请求的 Cookie 请求标头中包含 HTTP 会话亲和性 Cookie 时，只要会话亲和性 Cookie 仍然有效，负载均衡器就会将这些请求定向到同一后端实例或端点。方法是将 Cookie 值映射到引用特定后端实例或端点的索引，并确保满足生成的 Cookie 会话亲和性要求。

如需使用 HTTP Cookie 亲和性，请配置以下均衡模式和 localityLbPolicy 设置：

对于后端实例组，请使用 RATE 均衡模式。
对于后端服务的 localityLbPolicy，请使用 RING_HASH 或 MAGLEV。如果您未明确设置 localityLbPolicy，负载均衡器会将 MAGLEV 用作隐式默认值。

如需了解详情，请参阅失去会话亲和性。

基于有状态 Cookie 的会话亲和性

如果您使用基于有状态 Cookie 的亲和性 (STRONG_COOKIE_AFFINITY)，负载均衡器会在 Set-Cookie 标头中添加一个 HTTP Cookie，以响应初始 HTTP 请求。您可以指定 Cookie 的名称、路径和存留时间 (TTL)。

所有应用负载均衡器（传统应用负载均衡器除外）都支持基于有状态 Cookie 的亲和性。

您可以配置 Cookie 的 TTL 值（以秒、零点几秒 [以纳秒为单位] 或秒加零点几秒 [以纳秒为单位] 为单位）。 strongSessionAffinityCookie.ttl 所表示的时长不能设置为超过两周（1,209,600 秒）的值。

Cookie 的值通过在值本身中对所选实例或端点进行编码，来标识所选后端实例或端点。只要 Cookie 有效，如果客户端在后续 HTTP 请求的 Cookie 请求标头中包含会话亲和性 Cookie，负载均衡器就会将这些请求定向到所选的后端实例或端点。

与其他会话亲和性方法不同：

基于状态的基于 Cookie 的亲和性对均衡模式或负载均衡位置政策 (localityLbPolicy) 没有特定要求。
当自动扩缩功能向托管式实例组添加新实例时，基于有状态 Cookie 的亲和性不会受到影响。
当自动扩缩功能从托管式实例组中移除实例时，基于有状态 Cookie 的亲和性不会受到影响，除非移除的是所选实例。
当自动修复功能从托管式实例组中移除实例时，基于有状态 Cookie 的亲和性不会受到影响，除非所选实例被移除。

如需了解详情，请参阅失去会话亲和性。

基于 Cookie 的亲和性 TTL 为零的含义

所有基于 Cookie 的会话亲和性（例如生成的 Cookie 亲和性、HTTP Cookie 亲和性和基于有状态 Cookie 的亲和性）都具有 TTL 属性。

TTL 为零秒表示负载均衡器不会为 Cookie 分配 Expires 属性。在这种情况下，客户端会将该 Cookie 视为会话 Cookie。会话的定义因客户端而异：

某些客户端（例如网络浏览器）会在整个浏览会话期间保留该 Cookie。这意味着，在应用关闭之前，Cookie 会在多个请求中保持不变。
其他客户端将会话视为单个 HTTP 请求，并在之后立即舍弃 Cookie。

失去会话亲和性

所有会话亲和性选项都需要满足以下条件：

所选后端实例或端点必须保持配置为后端。发生以下任一事件时，会话亲和性可能会被破坏：
- 您从所选实例所属的实例组中移除该实例。
- 托管式实例组自动扩缩或自动修复功能会从托管式实例组中移除所选实例。
- 从相应 NEG 中移除所选端点。
- 从后端服务中移除包含所选实例或端点的实例组或 NEG。
所选后端实例或端点必须保持正常运行。如果所选实例或端点未通过健康检查，则会话亲和性可能就会被破坏。

除了基于有状态 Cookie 的会话亲和性之外，所有会话亲和性选项都具有以下额外要求：

包含所选实例或端点的实例组或 NEG 不得处于其目标容量定义的已满状态。（对于区域托管式实例组，包含所选实例的实例组的可用区组件不得已满。）当实例组或 NEG 已满，而其他实例组或 NEG 未满时，会话亲和性可能会被破坏。由于使用 UTILIZATION 均衡模式时，满载情况可能会以不可预测的方式发生变化，因此您应使用 RATE 或 CONNECTION 均衡模式，以尽量减少会话亲和性被破坏的情况。
已配置的后端实例或端点的总数必须保持不变。当发生以下事件中的至少一项时，已配置的后端实例或端点的数量会发生变化，并且会话亲和性可能会被破坏：
- 添加新实例或端点：
  - 将实例添加到后端服务上的现有实例组。
  - 托管式实例组自动扩缩功能会向后端服务上的托管式实例组添加实例。
  - 您可以将端点添加到后端服务中的现有 NEG。
  - 您可以将非空实例组或 NEG 添加到后端服务。
- 移除任何实例或端点，而不仅仅是所选的实例或端点：
  - 您从实例组后端中移除了任何实例。
  - 托管式实例组自动扩缩或自动修复功能会从托管式实例组后端移除任何实例。
  - 您可以从 NEG 后端移除任何端点。
  - 从后端服务中移除所有现有的非空后端实例组或 NEG。
运行状况良好的后端实例或端点的总数必须保持不变。当发生以下事件中的至少一项时，健康状况良好的后端实例或端点的数量会发生变化，并且会话亲和性可能会被破坏：
- 任何实例或端点通过了健康检查，从健康状况不佳转换为健康状况良好。
- 任何实例或端点未通过健康检查，从健康状态转换为不健康状态或超时。

故障切换

如果后端健康状况不佳，则流量会被自动重定向到健康状况良好的后端。

下表介绍了每种模式下的故障切换行为：

负载均衡器模式故障切换行为所有后端运行状况都不正常时的行为

跨区域内部应用负载均衡器

负载均衡器模式	故障切换行为	所有后端运行状况都不正常时的行为
跨区域内部应用负载均衡器	自动故障切换到同一区域或其他区域中的健康后端。根据配置的流量分配将流量分配到多个区域中的健康后端。	返回 HTTP `503`
区域级内部应用负载均衡器	自动故障切换到同一区域内的健康后端。 Envoy 代理会根据配置的流量分配将流量发送到区域中的健康后端。	返回 HTTP `503`

自动故障切换到同一区域或其他区域中的健康后端。

根据配置的流量分配将流量分配到多个区域中的健康后端。

返回 HTTP 503

区域级内部应用负载均衡器

自动故障切换到同一区域内的健康后端。

Envoy 代理会根据配置的流量分配将流量发送到区域中的健康后端。

返回 HTTP 503

高可用性和跨区域故障切换

对于区域级内部应用负载均衡器

如需实现高可用性，请在最支持应用流量的区域中部署多个单独的区域级内部应用负载均衡器。然后，您可以使用 Cloud DNS 地理定位路由政策检测负载均衡器在区域级服务中断期间是否响应。地理定位政策会根据客户端请求的来源，将流量路由到下一个最近的可用区域。健康检查在默认情况下可用于内部应用负载均衡器。

对于跨区域内部应用负载均衡器

您可以在多个区域中设置跨区域内部应用负载均衡器，以获享以下优势：

如果某个区域中的跨区域内部应用负载均衡器发生故障，则 DNS 路由政策会将流量路由到另一个区域中的跨区域内部应用负载均衡器。

高可用性部署示例展示以下内容：
- VPC 网络的 RegionA 和 RegionB 区域中具有前端虚拟 IP 地址 (VIP) 的跨区域内部应用负载均衡器。客户端位于 RegionA 区域。
- 您可以使负载均衡器可通过两个区域中的前端 VIP 访问，并使用 DNS 路由政策向客户端返回最佳 VIP。如果您希望客户端使用地理位置最接近的 VIP，请使用地理定位路由政策。
- 在发生区域级服务中断时，DNS 路由政策可以检测 VIP 地址是否没有响应，并向客户端返回下一个最佳 VIP 地址，从而确保应用在区域级服务中断期间仍然正常运行。
具有高可用性部署的跨区域内部应用负载均衡器（点击可放大）。
如果某个特定区域中的后端发生故障，则跨区域内部应用负载均衡器流量可以安全地故障切换到另一个区域中的后端。

跨区域故障切换部署示例展示以下内容：
- 跨区域内部应用负载均衡器具有您的 VPC 网络的 RegionA 区域中的前端 VIP 地址。您的客户端也位于 RegionA 区域。
- 引用 RegionA 和 RegionB Google Cloud 区域中的后端的全球后端服务。
- 当 RegionA 区域中的后端发生故障时，流量会故障切换到 RegionB 区域。
具有跨区域故障切换部署的跨区域内部应用负载均衡器（点击可放大）。

WebSocket 支持

当您使用 HTTP 或 HTTPS 作为后端协议时，基于Google Cloud HTTP(S) 的负载均衡器支持 WebSocket 协议。负载均衡器不需要进行任何配置即可代理 WebSocket 连接。

WebSocket 协议提供客户端和负载均衡器之间的全双工通信通道。如需了解详情，请参阅 RFC 6455。

WebSocket 协议的工作原理如下：

负载均衡器识别到来自 HTTP 或 HTTPS 客户端的 WebSocket Upgrade 请求。该请求包含 Connection: Upgrade 和 Upgrade: websocket 标头，后跟其他有关的 WebSocket 相关请求标头。
后端发送 WebSocket Upgrade 响应。后端实例发送包含 Connection: Upgrade 和 Upgrade: websocket 标头及其他 WebSocket 相关响应标头的 101 switching protocol 响应。
负载均衡器会在当前连接期间代理双向流量。

如果后端实例返回状态代码 426 或 502，则负载均衡器会关闭连接。

WebSocket 的会话亲和性与其他任何请求的运作方式相同。如需了解详情，请参阅会话亲和性。

HTTP/2 支持

HTTP/2 是 HTTP/1 协议的重大修订版本。HTTP/2 支持有 2 种模式：

基于 TLS 的 HTTP/2
基于 TCP 的明文 HTTP/2

基于 TLS 的 HTTP/2

客户端与外部应用负载均衡器之间的连接以及负载均衡器与其后端之间的连接支持基于 TLS 的 HTTP/2。

在进行 TLS 握手过程中，负载均衡器会通过使用 ALPN TLS 扩展程序与客户端自动协商 HTTP/2。即使负载均衡器配置为使用 HTTPS，新型客户端也会默认使用 HTTP/2。这是在客户端而非负载均衡器上控制的。

如果客户端不支持 HTTP/2，并且负载均衡器配置为在负载均衡器和后端实例之间使用 HTTP/2，则负载均衡器可能仍会协商 HTTPS 连接或接受不安全的 HTTP 请求。然后，负载均衡器会转换这些 HTTPS 或 HTTP 请求，以便通过 HTTP/2 将请求代理到后端实例。

如需使用基于 TLS 的 HTTP/2，您必须在后端启用 TLS，并将后端服务协议设置为 HTTP2。如需了解详情，请参阅从负载均衡器到后端的加密。

HTTP/2 并发流数量上限

HTTP/2 SETTINGS_MAX_CONCURRENT_STREAMS 设置说明了由对等方发起并由端点接受的最大流数。HTTP/2 客户端向Google Cloud 负载均衡器通告的值实际上毫无意义，因为负载均衡器不会向客户端发起流。

如果负载均衡器使用 HTTP/2 与在虚拟机上运行的服务器通信，则负载均衡器遵循服务器所通告的 SETTINGS_MAX_CONCURRENT_STREAMS 值，但最大值为 100。在请求方向（Google Cloud 负载均衡器 → gRPC 服务器），负载均衡器使用来自 gRPC 服务器的初始 SETTINGS 帧来确定每个连接可以同时使用的流数量。如果服务器通告的值高于 100，则负载均衡器会将并发流的数量上限设为 100。如果通告零值，则负载均衡器无法将请求转发给服务器，这可能会导致错误。

HTTP/2 动态标头表大小

HTTP/2 通过多路复用和 HPACK 标头压缩等功能显著改进了 HTTP/1.1。HPACK 使用动态表来增强标头压缩，从而加快所有操作的速度。如需了解 HTTP/2 中动态标头表大小更改的影响、此功能如何提升性能，以及各种 HTTP 客户端库中的特定 bug 如何导致 HPACK 标头压缩出现问题，请参阅社区文章。

HTTP/2 限制

在负载均衡器和实例之间使用 HTTP/2 时，需要与实例之间建立的 TCP 连接数量要比使用 HTTP 或 HTTPS 时多得多。HTTP/2 不支持连接池；连接池是一项优化功能，可通过 HTTP 或 HTTPS 减少这些连接的数量。因此，您可能会看到后端延迟时间较长，因为系统会进行更频繁的后端连接。
在负载均衡器和后端之间使用 HTTP/2 时，不支持通过单个 HTTP/2 连接流 (RFC 8441) 运行 WebSocket 协议。
负载均衡器和后端之间的 HTTP/2 不支持服务器推送。
Google Cloud API 或 Google Cloud 控制台中不会显示 gRPC 错误率和请求量。因此，即便 gRPC 端点返回错误，负载均衡器日志和监控数据仍会报告 200 OK HTTP 状态代码。

基于 TCP 的明文 HTTP/2 (H2C)

基于 TCP 的明文 HTTP/2（也称为 H2C）可让您在不使用 TLS 的情况下使用 HTTP/2。以下两种连接都支持 H2C：

客户端与负载均衡器之间的连接。无需特殊配置。
负载均衡器与其后端之间的连接。

如需为负载均衡器及其后端之间的连接配置 H2C，请将后端服务协议设置为 H2C。

使用 GKE Gateway Controller 和 Cloud Service Mesh 创建的负载均衡器也支持 H2C。

传统应用负载均衡器不支持 H2C。

gRPC 支持

gRPC 是远程过程调用的开源框架。它基于 HTTP/2 标准运行。适合使用 gRPC 的场景如下：

延迟时间短、扩缩能力强的分布式系统
开发与云服务器通信的移动客户端
设计必须准确、高效并且独立于语言的新协议
支持扩展、身份验证和日志记录的分层设计

如需将 gRPC 与您的 Google Cloud 应用搭配使用，您必须通过 HTTP/2 以端到端方式对请求进行代理。为此，您可以使用以下某个配置创建应用负载均衡器：

对于端到端未加密流量（不使用 TLS）：您可以创建 HTTP 负载均衡器（使用目标 HTTP 代理进行配置）。此外，您还可以将后端服务协议设置为 H2C，以便配置负载均衡器将 HTTP/2 用于负载均衡器与其后端之间的未加密连接。
对于端到端加密流量（使用 TLS）：您可以创建 HTTPS 负载均衡器（使用目标 HTTPS 代理和 SSL 证书进行配置）。在进行 SSL 握手过程中，负载均衡器会通过使用 ALPN TLS 扩展程序与客户端协商 HTTP/2。

此外，您还必须确保后端可以处理 TLS 流量，并将后端服务协议设置为 HTTP2，以便配置负载均衡器将 HTTP/2 用于负载均衡器与其后端之间的加密连接。

负载均衡器仍然可以与某些客户端协商 HTTPS，或接受配置为在负载均衡器和后端实例之间使用 HTTP/2 的负载均衡器上的不安全 HTTP 请求。这些 HTTP 或 HTTPS 请求由负载均衡器进行转换，以便通过 HTTP/2 将请求代理到后端实例。

TLS 支持

默认情况下，HTTPS 目标代理在终结客户端 SSL 请求时仅接受 TLS 1.0、1.1、1.2 和 1.3。

当内部应用负载均衡器使用 HTTPS 作为后端服务协议时，它可以与后端协商 TLS 1.2 或 1.3。

双向 TLS 支持

双向 TLS (mTLS) 是一种业界标准协议，用于在客户端和服务器之间进行双向身份验证。mTLS 通过验证客户端和服务器是否都持有受信任的证书授权机构 (CA) 颁发的有效证书，帮助确保客户端和服务器可以相互验证身份。与仅验证服务器身份的标准 TLS 不同，mTLS 要求客户端和服务器都提供证书，以在建立通信之前确认双方的身份。

所有应用负载均衡器都支持 mTLS。如果使用 mTLS，负载均衡器会请求客户端在与负载均衡器进行 TLS 握手期间发送证书以进行身份验证。您可以配置 Certificate Manager 受信任证书存储区，然后负载均衡器会使用它来验证客户端证书的信任链。

如需详细了解 mTLS，请参阅双向 TLS 身份验证。

限制

我们无法保证区域中某可用区的客户端发出的请求会发送到与该客户端位于相同可用区的后端。会话亲和性不会减少可用区之间的通信。
内部应用负载均衡器与以下功能不兼容：
- Cloud CDN
- Compute Engine Google 托管式 SSL 证书（支持 Certificate Manager Google 托管式证书）
如需将 Certificate Manager 证书与内部应用负载均衡器搭配使用，您必须使用 API 或 gcloud CLI。Google Cloud 控制台不支持 Certificate Manager 证书。
内部应用负载均衡器仅支持通过 TLS 使用 HTTP/2。
连接到内部应用负载均衡器的客户端必须使用 HTTP 1.1 版或更高版本。不支持 HTTP 1.0。
如果您的代理专用子网的 IP 地址耗尽，Google Cloud 不会向您发出警告。
内部应用负载均衡器使用的内部转发规则只能有一个端口。
在共享 VPC 环境中将内部应用负载均衡器与 Cloud Run 搭配使用时，服务项目中的独立 VPC 网络可以将流量发送到部署在同一共享 VPC 环境内的任何其他服务项目中的任何其他 Cloud Run 服务。这是一个已知问题。
Google Cloud 不保证底层 TCP 连接在后端服务超时的整个期间保持打开状态。客户端系统必须实现重试逻辑，而不是依赖 TCP 连接长时间保持打开状态。

内部应用负载均衡器不支持 Cloud Functions（第 1 代）和 App Engine。如需了解详情，请参阅无服务器 NEG 概览：支持的负载均衡器。
内部应用负载均衡器不支持 Cloud Trace。

后续步骤

如需在共享 VPC 设置中配置负载均衡，请参阅设置使用共享 VPC 的内部应用负载均衡器。
如需为在 GKE pod 中运行的服务配置负载均衡，请参阅部署 GKE 网关、使用独立 NEG 实现容器原生负载均衡和将内部应用负载均衡器连接到独立 NEG 部分。
如需管理代理专用子网资源，请参阅基于 Envoy 的负载均衡器的代理专用子网。
如需在区域级内部应用负载均衡器上配置后端子集化，请参阅后端子集化。

如需使用 Private Service Connect 配置区域级内部应用负载均衡器，请参阅通过后端访问区域级 Google API。
如需将自定义逻辑插入负载均衡数据路径，请配置 Cloud Load Balancing 扩展程序。