用于 GKE 集群的存储概览

Autopilot Standard

本文档介绍了 GKE 支持的存储选项，以及选择最符合您业务需求的选项的一些主要考虑因素。如需确定哪个机器家族适合您选择，请参阅机器系列比较。

GKE 支持以下存储类型和集成：

使用 Persistent Disk 的块存储
使用 Google Cloud Hyperdisk 的块存储
使用 Hyperdisk 存储池的块存储
使用本地固态硬盘的临时存储和原始块存储
并行文件系统 (Managed Lustre)
网络文件系统 (Filestore)
使用 Cloud Storage FUSE 的对象存储
代管式数据库
构建工件

块存储（永久性磁盘）

Persistent Disk 卷是由 Compute Engine 管理的持久性网络存储设备，GKE 集群可以像访问桌面设备或服务器中的物理磁盘一样访问它们。如果集群需要额外的存储空间，您可以将更多 Persistent Disk 卷挂接到节点或调整现有 Persistent Disk 卷的大小。您可以让 GKE 动态预配由永久性磁盘提供支持的 PersistentVolume，也可以手动预配磁盘。

GKE Autopilot 和 Standard 集群支持此存储选项。

默认情况下，永久性磁盘卷是可用区级资源（存储在区域内的单个可用区中）。您可以创建区域级 Persistent Disk 卷（保留在同一区域内的两个可用区中）。您还可以将永久性磁盘卷以只读方式同时挂接到多个节点。可用区永久性磁盘卷和区域永久性磁盘卷均支持此功能。

GKE 上的 Persistent Disk 存储是永久性的，也就是说，磁盘上存储的数据会保留，即使使用该数据的 Pod 被终止也是如此。

为何使用 Persistent Disk 存储

如果集群需要访问高性能、高可用性且耐用的块存储，请使用 Persistent Disk 存储。Persistent Disk 卷通常挂接到单个 Pod。此存储选项支持 ReadWriteOnce 访问模式。GKE 支持使用一系列延迟和性能选项配置 Persistent Disk 卷，其中包括：

平衡永久性磁盘：适用于标准企业应用。此选项可在性能和费用之间取得平衡。以固态硬盘 (SSD) 作为支持。这是在运行 GKE 1.24 或更高版本的集群和节点上进行动态卷预配的默认选项。
高性能永久性磁盘：适用于扩容分析、数据库和永久性缓存。此选项非常适合具有较高性能要求的工作负载。以固态硬盘 (SSD) 作为支持。
标准永久性磁盘：适用于大数据、计算密集型工作负载。此选项是最具成本效益的磁盘类型。以标准硬盘 (HDD) 作为支持。
极端永久性磁盘：适用于 SAP HANA 和 Oracle 等企业应用。此选项提供最高的性能，可满足最大的内存中数据库的需求。以固态硬盘 (SSD) 作为支持。对于性能关键型应用，如果 Persistent Disk 无法提供足够的性能，请使用 Hyperdisk Extreme 磁盘。

如需开始使用此存储选项，请参阅以下资源：

如需了解可用的磁盘类型，请参阅 Compute Engine 文档中的存储方案。
Compute Engine Persistent Disk CSI 驱动程序是您将 Persistent Disk 存储与 GKE 结合使用的主要方式。如需查看相关说明，请参阅使用 Compute Engine Persistent Disk CSI 驱动程序。

块存储 (Google Cloud Hyperdisk)

Hyperdisk 卷使用新一代 Google Cloud 块存储。Hyperdisk 卷可让您根据工作负载动态调整块存储的性能。您可以为应用单独配置每秒输入/输出操作数 (IOPS) 和吞吐量，并适应随时间不断变化的性能需求。

GKE Autopilot 和 Standard 集群支持此存储选项。Hyperdisk 卷是可用区级资源，具体取决于区域级可用性。GKE 上的 Hyperdisk 存储是永久性的，也就是说，磁盘上存储的数据会保留，即使使用该数据的 Pod 被终止也是如此。

为何使用 Hyperdisk 存储

如果您需要动态调整 IOPS 或吞吐量，请使用 Hyperdisk 存储。Hyperdisk 卷通常挂接到单个 Pod。此存储选项支持 ReadWriteOnce 访问模式。您可以根据性价比需求从 GKE 的以下 Hyperdisk 存储选项中进行选择：

Hyperdisk Balanced：最适合大多数工作负载。这对于部署大多数企业应用和业务线应用，以及数据库和 Web 服务器来说是一个不错的选择。
Hyperdisk Throughput：针对经济实惠的高吞吐量进行了优化。如果您的应用场景是扩容分析（例如 Hadoop 或 Kafka）、从备份服务器恢复冷数据以及面向吞吐量的费用敏感型工作负载，则这是一个不错的选项。
Hyperdisk Extreme：针对 IOPS 性能进行了优化。如果您要部署高性能工作负载（例如数据库管理系统），则这是一个不错的选项。
Hyperdisk ML：针对需要快速加载模型权重的 AI/机器学习训练和推理工作负载进行了优化。使用此选项可减少因延迟瓶颈导致的 GPU/TPU 资源空闲时间。

GKE Autopilot 和 Standard 集群支持 Hyperdisk 存储选项。

如需开始使用此存储选项，请参阅以下资源：

如需查看概览，请参阅关于 Hyperdisk for GKE。
如需了解每个磁盘的限制（包括最大吞吐量和 IOPS），请参阅 Compute Engine 文档中的每个磁盘的 Hyperdisk 限制。
如需在集群中设置和使用 Hyperdisk Throughput 和 Extreme 存储，请参阅使用 Hyperdisk 调整存储性能。

块存储（Hyperdisk 存储池）

Hyperdisk 存储池是 GKE 集群中的磁盘可以使用的预先预配的存储资源（容量、吞吐量和 IOPS）池。存储资源会在您在存储池中创建的所有 Hyperdisk 之间共享。

GKE Standard 集群允许 Hyperdisk 启动磁盘（用于操作系统）和关联的 Hyperdisk（用于数据存储）成为存储池的一部分。GKE Autopilot 集群仅支持针对存储池挂接的 Hyperdisk。

如需开始使用此存储选项，请参阅以下资源：

如需查看概览，请参阅关于 Hyperdisk 存储池。
如需在 GKE 集群中设置 Hyperdisk 存储池，请参阅使用 Hyperdisk 存储池优化存储性能和成本。

临时和原始块存储（本地固态硬盘）

本地 SSD 磁盘是直接挂接到节点的物理硬盘。这些磁盘可以提供更好的性能，但它们为临时磁盘。每个本地固态硬盘卷都挂接到特定节点。您无法将卷移至其他节点。

GKE Standard 集群支持此存储选项。在运行 GKE 1.27 及更高版本的集群和节点池中，Autopilot 对本地 SSD 的支持在 A2 Ultra A100 机器上目前为预览版。

GKE 上由本地 SSD 存储提供支持的临时存储与 Pod 的生命周期相关联。Pod 终止后，与该 Pod 关联的临时存储也会被删除。

为何使用本地固态硬盘

如果您需要为数据库和实时分析使用热缓存，或者使用提供最低延迟的闪存优化临时存储，则在 GKE 集群中使用本地 SSD 存储是非常适合的。对于 AI/机器学习、批处理、分析和内存中数据库应用场景而言，本地 SSD 存储作为 Cloud Storage 前面的缓存层尤其有效。

如需开始使用此存储选项，请参阅以下资源：

如需查看概览，请参阅适用于 GKE 的本地 SSD 存储简介。
如需在集群中设置和使用本地 SSD 存储作为 emptyDir，请参阅预配和使用基于本地 SSD 的临时存储空间。
如需在集群中设置和使用本地 SSD 存储作为本地 PersistentVolume 资源，请参阅预配和使用基于本地 SSD 的原始块存储。

并行文件系统 (Managed Lustre)

Managed Lustre 是 Google Cloud上的一种全托管式高性能并行文件系统，通过 Managed Lustre CSI 驱动程序与 GKE 集成。它专为需要永久性、可扩缩和高吞吐量存储的要求严苛的工作负载而设计，尤其是在 AI/机器学习和高性能计算 (HPC) 领域。Managed Lustre CSI 驱动程序可自动管理 Managed Lustre 实例的生命周期，让您可以通过 PersistentVolume 和 PersistentVolumeClaim 等标准 Kubernetes 对象来预配和访问这些实例。

运行 Container-Optimized OS 节点的 GKE Autopilot 和 Standard 集群支持此存储选项。GKE 上的 Managed Lustre 存储是永久性的，因此即使使用它的 Pod 终止，数据也会保留。

为何使用 Managed Lustre 存储

对于需要从多个 Pod 同时进行高吞吐量和低延迟文件访问的工作负载，请使用 Managed Lustre 存储。它非常适合以下应用场景：

AI/机器学习：需要访问大型数据集的训练和推理工作负载。
HPC：大规模科学和工程模拟。

如需开始使用此存储选项，请参阅以下资源：

如需大致了解此功能，请参阅 Managed Lustre CSI 驱动程序简介。
如需创建和使用由新的 Managed Lustre 实例提供支持的卷，请参阅使用 Managed Lustre CSI 驱动程序访问 Managed Lustre 实例。
如需连接到现有 Managed Lustre 实例，请参阅使用 Managed Lustre CSI 驱动程序访问现有 Managed Lustre 实例。

网络文件系统 (Filestore)

Filestore 为非结构化数据提供基于云的共享文件系统，并支持网络文件系统 (NFS) 访问。Filestore 实例充当 Google Cloud 上的文件服务器，可为 GKE 集群提供具有 ReadWriteMany 访问权限的持久性存储空间。Filestore 实例与主机分离，所需的手动操作极少。工作负载故障切换是无缝的，因为不需要执行基础架构操作来挂接或分离卷。

GKE Autopilot 和 Standard 集群支持此存储选项。企业服务层级的 Filestore 存储默认为具有区域级可用性，而其他服务层级具有可用区级可用性。GKE 上的 Filestore 存储是永久性的，也就是说，实例中存储的数据会保留，即使使用该数据的 Pod 被终止也是如此。

为何使用 Filestore 存储

如果您的应用需要网络文件系统 (NFS) 访问权限以及多个读取者和写入者，请使用 Filestore 存储。如果您的应用场景涉及内容管理系统、应用迁移、数据分析、渲染和媒体处理，则此存储选项适合。

为了提高成本效益，Filestore Multishares for GKE 可让您与最多 80 个 PersistentVolume 共享 10 GiB 或更大的 Filestore 企业层级实例。

如需开始使用此存储选项，请参阅以下资源：

如需查看概览，请参阅适用于 GKE 的 Filestore 支持简介。
Filestore CSI 驱动程序是您将 Filestore 存储与 GKE 结合使用的主要方式。如需查看相关说明，请参阅使用 Filestore CSI 驱动程序访问 Filestore 实例。
如需查看 Filestore Multishares 说明，请参阅使用 Filestore Multishares for GKE 优化存储。

对象存储 (Cloud Storage FUSE)

Cloud Storage 是一种用于二进制文件和对象数据、blob 以及非结构化数据的对象存储区。Cloud Storage FUSE CSI 驱动程序管理 Cloud Storage FUSE 与 Kubernetes API 的集成，以将现有 Cloud Storage 存储桶用作卷。您可以使用 Cloud Storage FUSE CSI 驱动程序，将存储桶作为文件系统装载到 GKE 节点上。

Cloud Storage FUSE CSI 驱动程序支持 GKE Autopilot 和 Standard 集群中的 ReadWriteMany、ReadOnlyMany 和 ReadWriteOnce 访问模式。Cloud Storage 对象具有区域级可用性。GKE 上的 Cloud Storage 数据是永久性的，也就是说，存储桶中存储的数据会保留，即使使用该数据的 Pod 被终止也是如此。

为什么要使用 Cloud Storage FUSE

如果您需要在 Cloud Storage 前面使用文件语义以实现可移植性，则 Cloud Storage FUSE 选项适合。对于希望作为 Cloud Storage 中的对象存储和访问机器学习 (ML) 训练和模型数据的开发者而言，Cloud Storage FUSE 也是一个常见的选择。

如需开始使用此存储选项，请参阅以下资源：

如需查看概览，请参阅 Cloud Storage FUSE。
如需在集群中使用 Google Cloud 存储桶，请参阅使用 Cloud Storage CSI FUSE 驱动程序访问 Cloud Storage 存储桶。

代管式数据库

Cloud SQL 或 Spanner 等托管式数据库可降低运营开销，并针对 Google Cloud基础设施进行了优化。与直接在 Kubernetes 中部署的数据库相比，代管式数据库需要的维护和运营工作量更少。

为何要使用托管式数据库

借助 Google Cloud 托管式数据库，GKE 上的有状态工作负载可以访问永久性数据，同时可自动执行备份、修补和扩缩等维护任务。您需要创建一个数据库，构建您的应用，并让Google Cloud 为您扩缩应用。但是，这也意味着您可能无权访问数据库的确切版本、扩展程序或您所需的数据库确切变种。

GKE 支持与 Google Cloud 托管式数据库服务建立连接，这些服务包括：

AlloyDB for PostgreSQL：与 PostgreSQL 兼容的全托管式数据库，具有卓越的性能、可用性和扩缩能力，可用于处理事务型和分析型工作负载。请参阅从 Google Kubernetes Engine 连接到 AlloyDB for PostgreSQL。
Cloud SQL：全代管式 MySQL、PostgreSQL 和 SQL Server 数据库。请参阅从 Google Kubernetes Engine 连接。
Spanner：可横向扩容的关系型数据库，具有高度一致性和可用性。请参阅使用 GKE Autopilot 和 Cloud Spanner 部署应用。
Memorystore for Redis：完全托管式内存中数据存储服务。请参阅从 Google Kubernetes Engine 集群连接到 Redis 实例。

如需开始使用此存储选项，请参阅以下资源：

Google Cloud 数据库选项说明。
如需了解使用代管式数据库或 GKE 上托管的容器化数据库的注意事项，请参阅在 GKE 上规划数据库部署。

构建制品 (Artifact Registry)

Artifact Registry 是您构建和部署的容器映像、操作系统软件包和语言软件包的制品库管理器。

为什么要使用 Artifact Registry

Artifact Registry 是一种适合于存储私有容器映像、Helm 图表和其他构建工件的选项。

如需将映像从 Artifact Registry Docker 制品库拉取到 GKE，请参阅 Artifact Registry 文档中的部署到 Google Kubernetes Engine。

后续步骤

阅读 Google Cloud中的存储选项对应关系博文。
为云工作负载设计最佳存储策略。
了解如何在 GKE 中使用 Kubernetes 存储抽象：PersistentVolumes、StatefulSets。
参阅 GKE 上的数据资源页面，了解可与 GKE 集成的数据解决方案。