GKE 网络概览

Autopilot Standard

本页面将介绍 Google Kubernetes Engine (GKE) 网络的几个主要方面。

本页面不涵盖常规 Kubernetes 或 GKE 主题。本页面假定您了解以下内容：

Linux 网络管理概念
实用程序，例如路由和 iptables 规则

此外，本页面假定您了解与以下内容相关的基本术语：

传输层
互联网层
应用层
互联网协议 (IP) 套件，包括 HTTP 和 DNS

本页面及本套文档的其余部分适用于为组织设计和架构网络的云架构师和网络专家。如需简要了解所有 GKE 文档集，请参阅探索 GKE 文档。如需详细了解我们在Google Cloud 内容中提及的常见角色和示例任务，请参阅常见的 GKE 用户角色和任务。

利用 Kubernetes，您能以声明方式来定义应用的部署方式、应用与应用之间以及应用与 Kubernetes 控制层面之间的通信方式，还可以定义客户端访问应用的方式。本页面还介绍了 GKE 如何配置与网络相关的 Google Cloud服务。

Kubernetes 网络配置为何不同

在使用 Kubernetes 编排应用时，您必须改变对应用及其主机的网络设计的构思方式。使用 Kubernetes 时，您需要考虑的是 Pod、Service 和外部客户端的通信方式，而不是主机或虚拟机 (VM) 的连接方式。

Kubernetes 的高级软件定义网络 (SDN) 支持在同一区域级集群中的不同地区之间路由和转发 Pod、Service、节点的数据包。Kubernetes 和 Google Cloud 还会在每个节点上动态配置 IP 过滤规则、路由表和防火墙规则，具体取决于 Kubernetes 部署的声明式模型和 Google Cloud上的集群配置。

与 Kubernetes 网络相关的术语

Kubernetes 网络模型在很大程度上依赖于 IP 地址。服务、Pod、容器和节点使用 IP 地址和端口进行通信。Kubernetes 提供不同类型的负载均衡，用于将流量定向到正确的 Pod。本主题的后面部分将更详细地介绍所有这些机制。在阅读本页面中的内容时，请牢记以下与 IP 地址相关的术语：

ClusterIP：分配给服务的 IP 地址。在其他文档中，这可能被称为“集群 IP”。此地址会在 Service 的生命周期内保持不变，如 Service 中所述。
Pod IP 地址：分配给给定 Pod 的 IP 地址。这是临时地址，具体请参阅 Pod。
节点 IP 地址：分配给给定节点的 IP 地址。

集群连接要求

所有集群都需要与 *.googleapis.com、*.gcr.io、*.pkg.dev 和控制平面 IP 地址建立连接。隐式允许出站规则以及由 GKE 自动创建的防火墙规则可满足此要求。

集群内部网络

本部分介绍了 Kubernetes 集群中的网络设置，它与 IP 分配、Pod、Service、DNS 和控制平面相关。

IP 地址分配

Kubernetes 使用各种 IP 范围为节点、Pod 和服务分配 IP 地址。

系统会从集群的 Virtual Private Cloud (VPC) 网络为每个节点分配一个 IP 地址。此节点 IP 地址用于提供从控制组件（如 kube-proxy 和 kubelet）到 Kubernetes API 服务器的连接。此 IP 地址用于提供节点与集群其余组件的连接。
每个节点都有一个 IP 地址池（默认为 /24 CIDR 块），供 GKE 分配在该节点上运行的 Pod。您可以选择在创建集群时指定 IP 地址范围。借助灵活的 Pod CIDR 范围功能，您可以缩小节点池中节点的 Pod IP 地址范围

注意：对于标准集群，您最多可以在一个具有 /23 范围的节点上运行 256 个 Pod，而不是您可能预期的 512 个 Pod。这样可以提供一个缓冲区，以免 Pod 由于给定节点的 Pod IP 地址范围中暂时缺少 IP 地址而无法调度。对于所有范围，系统最多可以调度相当于该范围中 IP 地址数量一半的 Pod。自动启动集群最多可以每个节点运行 32 个 Pod。
每个 Pod 都有从其节点的 Pod CIDR 范围分配的单个 IP 地址。此 IP 地址由 Pod 内运行的所有容器共享，并将它们连接到集群中运行的其他 Pod。
系统会从集群的 VPC 网络为每项服务分配一个 IP 地址（称为 ClusterIP）。您可以选择在创建集群时自定义 VPC 网络。
每个控制平面都有一个公共或内部 IP 地址，具体取决于集群类型、版本和创建日期。如需了解详情，请参阅控制平面说明。

GKE 网络模型不允许在整个网络中重复使用 IP 地址。迁移到 GKE 时，您必须规划 IP 地址分配，以减少 GKE 中的内部 IP 地址用量。

最大传输单元 (MTU)

为 Pod 接口选择的 MTU 取决于集群节点使用的容器网络接口 (CNI) 和底层 VPC MTU 设置。如需了解详情，请参阅 Pod。

Pod 接口 MTU 值为 1460 或从节点的主要接口继承。

CNI	MTU	GKE Standard
kubenet	1460	默认值
kubenet （GKE 1.26.1 版及更高版本）	继承	默认值
Calico	1460	使用 `--enable-network-policy` 启用。如需了解详情，请参阅使用网络政策控制 Pod 与服务之间的通信。
netd	继承	通过以下任一方式启用：节点内可见性适用于 GKE 的工作负载身份联合 IPv4/IPv6 双栈网络
GKE Dataplane V2	继承	使用 `--enable-dataplane-v2` 启用。如需了解详细信息，请参阅使用 GKE Dataplane V2。

如需了解详情，请参阅 VPC 原生集群。

支持的网络插件

如需使用网络插件，您必须自行安装。GKE 提供以下原生支持的网络插件：
- Calico（在 Dataplane V1 中）
- Cilium（在 Dataplane V2 中）
- Istio-CNI（在 GKE Enterprise 的托管式数据平面控制器中）

pod

在 Kubernetes 中，Pod 是可在 Kubernetes 集群中部署的最基本单元。Pod 运行一个或多个容器。节点运行零个或更多 Pod。集群中的每个节点都是节点池的一部分。

在 GKE 中，这些节点是虚拟机，每个节点都作为 Compute Engine 中的一个实例运行。

Pod 还可以连接到外部存储卷和其他自定义资源。下图显示了一个运行两个 Pod 的节点，每个 Pod 都连接到两个卷。

当 Kubernetes 安排 Pod 在某节点上运行时，它会在该节点的 Linux 内核中为 Pod 创建网络命名空间。此网络命名空间使用虚拟网络接口将节点的物理网络接口（如 eth0）与 Pod 连接起来，从而使数据包可以进出 Pod。节点的根网络命名空间中的关联虚拟网络接口连接到 Linux 网桥，可让同一节点上的各 Pod 之间进行通信。Pod 还可以使用同一虚拟接口在节点外部发送数据包。

Kubernetes 会从为节点上的 Pod 预留的一系列地址中，为 Pod 的网络命名空间中的虚拟网络接口分配一个 IP 地址（即 Pod IP 地址）。该地址范围是分配给 Pod 所在集群的 IP 地址范围的子集，可在创建集群时进行配置。

Pod 中运行的容器使用 Pod 的网络命名空间。从容器的角度来看，Pod 是具有一个网络接口的物理机器。Pod 中的所有容器都会看到此同一网络接口。每个容器的 localhost 通过 Pod 连接到节点的物理网络接口（例如 eth0）。

请注意，根据您具体是使用 GKE 的“容器网络接口”(CNI) 还是通过在创建群集时启用网络政策来选择使用 Calico 的实现，该连接会有很大差别。

如果使用 GKE 的 CNI，则虚拟以太网设备 (veth) 对的一端将连接到其命名空间中的 Pod，另一端连接到 Linux 网桥设备cbr0。¹在这种情况下，以下命令会显示连接到 cbr0 的各个 Pod 的 MAC 地址：
```
arp -n
```
在工具箱容器中运行以下命令，显示连接到 cbr0 的各 veth pair 的根命名空间端：
```
brctl show cbr0
```
如果启用了网络政策，则 veth pair 的一端连接到 Pod，另一端连接到 eth0。在这种情况下，以下命令会显示连接到不同 veth 设备的各个 Pod 的 MAC 地址：
```
arp -n
```
在工具箱容器中运行以下命令会显示没有名为 cbr0 的 Linux 网桥设备：
```
brctl show
```

集群内促进转发的 iptables 规则因场景而异。详细排查连接问题时，必须清楚地意识到这一差别。

默认情况下，每个 Pod 对所有集群节点上运行的其他所有 Pod 都具有未经过滤的访问权限，但您可以限制各 Pod 之间的访问。Kubernetes 会定期删除并重新创建 Pod。如果升级节点池、更改 Pod 的声明性配置、更改容器的映像，或节点不可用，就会发生这种情况。因此，Pod 的 IP 地址属于实现细节，您不应该依赖于这些地址。Kubernetes 使用 Service 提供稳定的 IP 地址。

仅当存在设置 hostNetwork: false 的 Pod 时，才会创建虚拟网络网桥 cbr0。↩

服务

在 Kubernetes 中，您可以为任何 Kubernetes 资源分配任意键值对（称为标签）。Kubernetes 使用标签来将多个相关的 Pod 组合成一个逻辑单元（称为服务）。服务具有稳定的 IP 地址和端口，并会在一组 Pod 之间提供负载均衡（前提是这些 Pod 的标签与您在创建服务时于标签选择器中定义的所有标签相匹配）。

下图显示了两项独立的 Service，每项 Service 都由多个 Pod 组成。图中的每个 Pod 都带有 app=demo 标签，但这些 Pod 的其他标签有所不同。“frontend” Service 匹配所有带有 app=demo 和 component=frontend 的 Pod，而“users” Service 匹配所有带有 app=demo 和 component=users 的 Pod。客户端 Pod 与任一 Service 选择器都不完全匹配，因此它不是任一 Service 的一部分。但是，由于客户端 Pod 在同一集群内运行，因此它可与任一服务进行通信。

Kubernetes 会从集群的可用 Service IP 地址池中为每项新创建的 Service 分配一个稳定可靠的 IP 地址（ClusterIP）。Kubernetes 还会通过添加 DNS 条目为 ClusterIP 地址分配主机名。ClusterIP 地址和主机名在集群内是唯一的，并且在 Service 的整个生命周期内不会更改。只有将 Service 从集群的配置中删除时，Kubernetes 才会释放 ClusterIP 地址和主机名。您可以使用服务的 ClusterIP 或主机名访问正常运行应用的 Pod。

乍一看，服务似乎是应用的单点故障。但是，Kubernetes 会尽可能均匀地将流量分布到在多个节点上运行的一系列 Pod，因此集群可以顺利度过影响一个或多个（但不是所有）节点的服务中断情况。

Kube-Proxy

Kubernetes 使用 kube-proxy 组件（该组件通常作为静态 Pod 在每个节点上运行）管理各个 Pod 和各个 Service 之间的连接。

kube-proxy 不是内嵌代理，而是一个基于出站流量的负载均衡控制器。该组件通过为节点的 iptables 子系统添加目标 NAT (DNAT) 规则以及从中移除这些规则，监控 Kubernetes API 服务器并持续将 ClusterIP 地址映射到运行状况良好的 Pod。当 Pod 中运行的容器将数据包发送到 Service 的 ClusterIP 地址时，节点会随机选择一个 Pod 并将流量路由到该 Pod。

在配置 Service 时，您可以选择定义 port 和 targetPort 的值来重新映射其监听端口。

port 是客户端用来访问应用的位置。
targetPort 是应用用来实际侦听 Pod 内流量的端口。

kube-proxy 通过在节点上添加 iptables 规则以及从中移除这些规则来管理此端口重新映射过程。

下图演示了从客户端 Pod 到不同节点上的服务器 Pod 的流量流动。客户端通过 172.16.12.100:80 连接到 Service。Kubernetes API 服务器会维护一个运行应用的 Pod 列表。每个节点上的 kube-proxy 进程都使用此列表创建 iptables 规则，将流量定向到适当的 Pod（例如 10.255.255.202:8080）。客户端 Pod 不需要知道集群的拓扑或者个别 Pod 或其中容器的任何详细信息。

kube-proxy 的部署方式取决于集群的 GKE 版本：

对于 GKE 版本 1.16.0 和 1.16.8-gke.13，kube-proxy 会作为 DaemonSet 部署。
对于高于 1.16.8-gke.13 的 GKE 版本，kube-proxy 会作为静态 Pod 部署到节点。

DNS

GKE 提供以下托管集群 DNS 选项来解析服务名称和外部名称：

kube-dns：默认情况下，所有 GKE 集群中部署的集群插件。如需了解详情，请参阅使用 kube-dns。
Cloud DNS：由云托管集群 DNS 基础架构，用于替换集群中的 kube-dns。如需了解详情，请参阅使用 Cloud DNS for GKE。

GKE 还提供了 NodeLocal DNSCache，作为带有 kube-dns 或 Cloud DNS 的可选插件，用于提高集群 DNS 性能。

如需详细了解 GKE 如何提供 DNS，请参阅服务发现和 DNS。

控制平面

在 Kubernetes 中，控制平面管理控制平面进程，包括 Kubernetes API 服务器。如何访问控制平面取决于您如何配置控制平面网络隔离。

集群外部网络

本部分介绍来自集群外部的流量如何到达 Kubernetes 集群内运行的应用。在设计集群的应用和工作负载时，此信息非常重要。

您已经了解了 Kubernetes 如何使用 Service 为 Pod 中运行的应用提供稳定的 IP 地址。默认情况下，Pod 不会公开外部 IP 地址，因为每个节点上的所有流量均由 kube-proxy 管理。Pod 及其容器可以自由通信，但集群外部的连接无法访问服务。例如，在上图中，集群外部的客户端无法使用其 ClusterIP 访问前端服务。

GKE 提供了三种不同类型的负载均衡器，用于控制访问并尽可能均匀地将传入流量扩散到整个集群中。您可以将一项 Service 配置为同时使用多种类型的负载均衡器。

外部负载均衡器用于管理来自集群外部和 Google CloudVPC 网络外部的流量。它们使用与Google Cloud 网络关联的转发规则来将流量路由到 Kubernetes 节点。
内部负载均衡器用于管理来自同一 VPC 网络的流量。与外部负载均衡器一样，它们使用与 Google Cloud 网络关联的转发规则来将流量路由到 Kubernetes 节点。
应用负载均衡器是专用于处理 HTTP(S) 流量的外部负载均衡器。它们使用网关（推荐）或 Ingress 资源（而不是转发规则）将流量路由到 Kubernetes 节点。

当流量到达 Kubernetes 节点时，无论负载均衡器为何种类型，这些流量都会按照相同方式进行处理。负载均衡器并不清楚集群中的哪些节点正在为其服务运行 Pod。在这种情况下，它会将流量平衡到集群中的所有节点，即使某些节点并没有运行相关 Pod 也是如此。在区域级集群上，负载将扩散到集群所在区域内所有地区中的所有节点上。当流量路由到某节点时，该节点会将流量路由到一个 Pod；该 Pod 可能在同一节点上运行，也可能在不同节点上运行。该节点使用 iptables 规则（由 kube-proxy 在节点上管理）将流量转发到随机选择的 Pod。

在下图中，外部直通式网络负载均衡器将流量定向到中间节点，然后该流量又被重定向到第一个节点上的 Pod。

当负载均衡器将流量发送到节点时，流量可能会被转发到其他节点上的 Pod。这需要额外的网络跃点。如果要避免额外的跃点，您可以指定流量必须转到最初接收流量的节点上的 Pod。

如需指定流量必须转到同一节点上的 Pod，请在 Service 清单中将 externalTrafficPolicy 设置为 Local：

apiVersion: v1
kind: Service
metadata:
  name: my-lb-service
spec:
  type: LoadBalancer
  externalTrafficPolicy: Local
  selector:
    app: demo
    component: users
  ports:
  - protocol: TCP
    port: 80
    targetPort: 8080

将 externalTrafficPolicy 设置为 Local 时，负载均衡器仅将流量发送到具有属于 Service 的正常 Pod 的节点。负载均衡器使用健康检查确定哪些节点具有适当的 Pod。

外部负载均衡器

如果您的 Service 需要能够从集群外部或 VPC 网络外部进行访问，您可以将 Service 配置为 LoadBalancer，方法是在定义 Service 时将其 type 字段设置为 Loadbalancer。然后，GKE 会在该 Service 前面预配一个外部直通式网络负载均衡器。外部直通式网络负载均衡器可识别集群中的所有节点，并使用 Service 的外部 IP 地址配置 VPC 网络的防火墙规则，以允许从 VPC 网络外部连接到 Service。您可以为 Service 分配静态外部 IP 地址。

如需了解详情，请参阅使用静态 IP 地址配置域名。

如要详细了解防火墙规则，请参阅自动创建的防火墙规则。

技术详情

使用外部负载均衡器时，系统最初会使用与 Google Cloud 网络关联的转发规则将到达的流量路由到节点。流量到达节点后，节点会使用其 iptables NAT 表选择 Pod。节点的 iptables 规则由 kube-proxy 管理。

内部负载平衡器

对于需要从集群 VPC 网络内或是从与集群 VPC 网络连接的网络访问集群的流量，您可以将 Service 配置为预配一个内部直通式网络负载均衡器。内部直通式网络负载均衡器会从集群的 VPC 子网中选择一个 IP 地址，而非使用外部 IP 地址。应用或服务（无论是在集群 VPC 网络内还是在连接的网络中）可以使用此 IP 地址与集群内的 Service 进行通信。

技术详情

内部负载均衡由 Google Cloud提供。当流量到达给定节点时，该节点会使用其 iptables NAT 表选择 Pod，即使 Pod 位于其他节点上也是如此。节点的 iptables 规则由 kube-proxy 管理。

如需详细了解内部负载均衡器，请参阅使用内部直通式网络负载均衡器。

应用负载均衡器

许多应用（如 RESTful Web 服务 API）使用 HTTP(S) 进行通信。您可以使用 Kubernetes Gateway API 允许 VPC 网络外部的客户端访问此类型的应用。

GKE Gateway 控制器是 Google 对用于 Cloud Load Balancing 的 Kubernetes Gateway API 的实现。Gateway API 是一个开源项目，旨在标准化服务网格和 Ingress 控制器在 Kubernetes 中公开应用的方式。它旨在成为 Ingress 资源更具表现力、更灵活且更可扩展的后继产品。

GKE Gateway 控制器用于配置第 7 层应用负载均衡器，以将 HTTP(S) 流量公开给在集群中运行的应用。

最佳实践：

使用 Gateway API 实现负载均衡器。

Gateway API 使用以下资源：

网关类：此资源定义了 GKE 实现的负载均衡器类型。GKE 提供可在集群中使用的 GatewayClass。
网关：网关资源定义监听器配置（例如端口、协议和主机名），并充当进入集群的流量的入口点。
HTTPRoute：HTTPRoute 用于指定网关接收的流量如何路由到 Service。HTTPRoutes 可以包含高级功能，例如基于路径的路由、标头匹配、用于 A/B 测试的流量分配，以及对超时和重试的更精细控制。
政策：您可以将政策附加到网关、路由或 Kubernetes Service，以定义底层 Google Cloud 基础设施的运行方式。

如需了解详情，请参阅 Gateway API 简介。

技术详情

当您创建网关对象时，GKE Gateway Controller 会根据网关、HTTPRoute 和 Service 清单中的规则配置应用负载均衡器。客户端会向应用负载均衡器发送请求。负载均衡器是一个实际代理；它用于选择节点并将请求转发到该节点的 NodeIP:NodePort 组合。节点使用其 iptables NAT 表选择 Pod。节点的 iptables 规则由 kube-proxy 管理。

网络安全

为了增强集群的安全性，您可以限制节点之间的连接、Pod 之间的连接以及与负载均衡器的连接。

限制节点之间的连接

在集群中创建针对节点的入站或出站防火墙规则可能会产生不利影响。例如，将出站拒绝规则应用于集群中的节点可能会破坏 NodePort 和 kubectl exec 等功能。

限制与 Pod 和 Service 的连接

默认情况下，在同一集群内运行的所有 Pod 都可以自由通信。但是，您可以根据需要以不同方式限制集群内的连接。

限制 Pod 之间的访问

您可以使用网络政策限制 Pod 之间的访问。通过网络政策定义，您可以根据标签、IP 地址范围和端口号的任意组合来限制 Pod 的入站流量和出站流量。

默认情况下，系统不配置网络政策，因此允许集群中各个 Pod 之间的所有流量。当您在命名空间中创建第一项网络政策后，系统会拒绝其他所有流量。

创建网络政策后，您必须为集群明确启用该政策。如需了解详情，请参阅为应用配置网络政策。

限制对外部负载均衡器的访问

如果您的 Service 使用外部负载均衡器，则默认情况下，来自任何外部 IP 地址的流量都可以访问您的 Service。通过在配置 Service 时配置 loadBalancerSourceRanges 选项，您可以限制哪些 IP 地址范围可以访问集群内的端点。您可以指定多个范围，并且可以随时更新正在运行的 Service 的配置。在每个节点上运行的 kube-proxy 实例会配置该节点的 iptables 规则，以拒绝与指定的 loadBalancerSourceRanges 不匹配的所有流量。此外，当您创建 LoadBalancer Service 时，GKE 会创建一个相应的 VPC 防火墙规则，以便在网络级别强制执行这些限制。

限制对应用负载均衡器的访问

如果您的服务使用应用负载均衡器，则您可以使用 Google Cloud Armor 安全政策限制哪些外部 IP 地址可以访问您的 Service，以及哪些 IP 地址可以访问安全政策拒绝访问时返回的响应。您可以配置 Cloud Logging 以记录这些交互的相关信息。

如果 Cloud Armor 安全政策不够精细，您可以在端点上启用 Identity-Aware Proxy，以便为您的应用实现基于用户的身份验证和授权。如需了解详情，请参阅有关配置 IAP 的详细教程。

已知问题

本部分介绍了已知问题。

已启用容器的节点无法连接到 `172.17/16` 范围

启用了 containerd 的节点虚拟机无法连接到具有 172.17/16 范围内 IP 的主机。如需了解详情，请参阅与 172.17/16 IP 地址范围冲突。

已删除的 GKE 集群（使用 Private Service Connect）中的剩余资源

如果您在 2024 年 5 月 7 日之前使用 Private Service Connect 创建和删除了 GKE 集群，并且在删除集群本身之前删除了包含该集群的项目，则可能会泄露关联的 Private Service Connect 资源。这些资源会保持隐藏状态，并且您无法删除关联的子网。如果遇到此问题，请与 Google Cloud 支持团队联系。

GKE 网络概览 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

Kubernetes 网络配置为何不同

与 Kubernetes 网络相关的术语

集群连接要求

集群内部网络

IP 地址分配

最大传输单元 (MTU)

pod

服务

Kube-Proxy

DNS

控制平面

集群外部网络

外部负载均衡器

技术详情

内部负载平衡器

技术详情

应用负载均衡器

技术详情

网络安全

限制节点之间的连接

限制与 Pod 和 Service 的连接

限制 Pod 之间的访问

限制对外部负载均衡器的访问

限制对应用负载均衡器的访问

已知问题

已启用容器的节点无法连接到 172.17/16 范围

已删除的 GKE 集群（使用 Private Service Connect）中的剩余资源

后续步骤

GKE 网络概览

已启用容器的节点无法连接到 `172.17/16` 范围