GKE 可扩缩性简介

Autopilot Standard

本页面提供在 Google Kubernetes Engine (GKE) 集群上规划、设计、部署、扩缩和运行大型工作负载的相关建议。我们建议您遵循这些建议，以确保扩缩工作负载满足服务等级目标 (SLO)。

可用的可扩缩性建议

在规划和设计 GKE 架构之前，请将特定于工作负载的参数（例如活跃用户数量、预期响应时间、所需的计算资源）与 Kubernetes 使用的资源（例如 Pod、Service，以及“CustomResourceDefinition”）进行映射。映射此信息后，请查看 GKE 可扩缩性建议。

可扩缩性建议按以下规划范围划分：

规划可扩缩性：了解设计工作负载和集群的一般最佳实践，以便在小型集群和大型集群上运行时实现可靠的性能。这些建议对于架构师、平台管理员和 Kubernetes 开发者很有用。如需了解详情，请参阅规划可扩缩性。
规划大型 GKE 集群：了解如何规划运行规模非常大的 GKE 集群。了解 Kubernetes 和 GKE 的已知限制以及避免达到这些限制的方法。这些建议对于架构师和平台管理员非常有用。如需了解详情，请参阅规划大型 GKE 集群。
规划大型工作负载：了解如何规划在 GKE 上运行大型 Kubernetes 工作负载的架构。还提供了在项目和集群之间分配工作负载以及调整这些工作负载所需的配额的建议。这些建议对于架构师和平台管理员非常有用。如需了解详情，请参阅规划大型工作负载。

这些可扩缩性建议是针对 GKE 的一般建议，适用于 GKE Standard 和 GKE Autopilot 模式。GKE Autopilot 会为您预配和管理集群的底层基础架构，因此某些建议不适用。