为云工作负载设计最佳存储策略

Last reviewed 2025-05-09 UTC

本指南可帮助您评估云工作负载的存储要求，了解 Google Cloud中的可用存储选项，并设计提供最佳业务价值的存储策略。

如需以可视化形式大致了解主要设计建议，请参阅决策树图。

如需了解如何为 AI 和机器学习工作负载选择存储服务，请参阅为 Google Cloud中的 AI 和机器学习工作负载设计存储。

设计过程概览

作为云架构师，在规划云工作负载的存储时，您需要首先考虑工作负载的功能特征、安全约束、弹性要求、性能预期以及费用目标。其次，您需要查看Google Cloud中可用的存储服务和功能。然后，根据您的要求和可用选项，选择所需的存储服务和功能。下图展示了此 3 阶段设计过程：

分阶段为云工作负载设计存储的方法。

定义您的要求

使用本部分中的调查问卷来定义要在 Google Cloud中部署的工作负载的关键存储要求。

定义存储要求的指南

回答调查问卷时，请注意以下准则：

精细定义要求

例如，如果您的应用需要基于网络文件系统 (NFS) 的文件存储，请确定所需的 NFS 版本。
考虑未来要求

例如，您当前的部署可能会为亚洲国家/地区的用户提供服务，但您打算将业务扩展到其他大洲。在这种情况下，请考虑新业务地区的任何与存储相关的监管要求。
考虑特定于云的机会和要求
- 充分利用特定于云的机会。
  
  例如，要优化存储在 Cloud Storage 中的数据的存储费用，您可以使用数据保留政策和生命周期配置来控制存储时长。
- 考虑特定于云的要求。
  
  例如，本地数据可能存在于单个数据中心，并且您可能需要在两个Google Cloud 位置之间复制迁移的数据以实现冗余。

调查问卷

以下调查问卷不是用于规划的详尽核对清单。您可从它们入手，系统地分析要部署到 Google Cloud的工作负载的所有存储要求。

评估工作负载的特征

您需要存储哪类数据？
示例
- 静态网站内容
- 用于灾难恢复的备份和归档
- 合规性审计日志
- 用户直接下载的大型数据对象
- 事务型数据
- 非结构化和异构数据
您需要多少容量？考虑您当前和未来的要求。
容量是否应该随使用量自动扩缩？
有哪些访问要求？例如，是否可以从 Google Cloud外部访问数据？
预期的读写格式是什么？
示例
- 频繁写入和读取
- 频繁写入，但偶尔读取
- 偶尔写入和读取
- 偶尔写入，但频繁读取
工作负载是否需要基于文件的访问权限（例如使用 NFS）？
多个客户端是否能够同时读取或写入数据？

识别安全约束

您的数据加密有哪些要求？例如，您是否需要使用自己控制的密钥？
有数据驻留要求吗？

定义数据弹性要求

您的工作负载是否需要低延迟缓存或暂存空间？
您是否需要复制云中的数据以提供冗余？
您是否需要复制数据集的严格读写一致性？

设定性能预期

所需的 I/O 速率是多少？
您的应用需要什么级别的读写吞吐量？
您需要哪些环境的存储空间？对于给定的工作负载，您可能需要生产环境的高性能存储，但可以为非生产环境选择较低性能的选项。

查看存储选项

Google Cloud 提供所有关键存储格式的存储服务：块存储、文件存储和对象存储。查看并评估每种存储格式的可用服务的特征、设计选项和相关优势。

概览

块存储

您存储在块存储中的数据分为多个块，每个块存储为具有唯一地址的独立块。应用通过引用适当的块地址来访问数据。块存储针对高 IOPS 工作负载（例如事务处理）进行了优化。它类似于本地存储区域网络 (SAN) 和直接附加存储 (DAS) 系统。

Google Cloud 中的块存储选项是 Compute Engine 服务的一部分。

选项	概览
Persistent Disk	适用于已部署到 Compute Engine 虚拟机和 Google Kubernetes Engine (GKE) 集群的企业和数据库应用的专用硬盘 (HDD) 和固态硬盘 (SSD)。
Google Cloud Hyperdisk	适用于 Compute Engine 虚拟机和 GKE 集群的快速冗余网络存储，具有可配置的性能和可动态调整大小的卷。
本地 SSD	用于高性能应用的临时本地附加块存储服务。

文件存储

数据整理并表示在文件层次结构中，这些文件存储在文件夹中，类似于本地网络附加存储 (NAS)。您可以使用 NFS 和服务器消息块 (SMB) 等协议将文件系统装载在客户端上。应用使用相关文件名和目录路径访问数据。

Google Cloud 提供一系列全托管式第三方解决方案来存储文件。

解决方案	概览
Filestore	使用适用于 Compute Engine 虚拟机和 Google Kubernetes Engine 集群的 NFS 文件服务器的基于文件的存储。您可以选择适合自己应用场景的服务层级（基本、可用区级或区域级）。
Google Cloud Managed Lustre	适用于 AI、高性能计算 (HPC) 和数据密集型应用的低延迟并行文件系统。
NetApp Volumes	使用 NFS 或 SMB 的基于文件的存储。您可以选择适合自己应用场景的服务等级（Flex、Standard、Premium 或 Extreme）。
更多选项	请参阅文件服务器选项总结。

对象存储

数据以对象形式存储在存储桶的平面层次结构中。每个对象都分配有一个全局唯一 ID。对象可以具有系统分配和用户定义的元数据，以帮助您组织和管理数据。应用使用 REST API 或客户端库通过引用对象 ID 来访问数据。

Cloud Storage 可为各种数据类型提供费用低廉、极为持久的无限制对象存储服务。您可以在 Google Cloud内部和外部的任意位置访问存储在 Cloud Storage 中的数据。（可选）跨区域的冗余可实现最大的可靠性。您可以选择适合数据保留和访问频率要求的存储类别。

比较分析

下表列出了Google Cloud中存储服务的关键功能。

	Persistent Disk	Hyperdisk	本地 SSD	Filestore	Managed Lustre	NetApp Volumes	Cloud Storage
容量	每个磁盘 10 GiB 到 64 TiB 每个虚拟机最多 257 TiB	每个磁盘 4 GiB 到 64 TiB 每个虚拟机最多 512 TiB 每个存储池 10 TiB 到 1 PiB	每个磁盘 375 GiB 每个虚拟机最多 12 TiB Titanium SSD 是一种容量更大的本地固态硬盘选项。	每个实例 1-100 TiB	18 TiB 到 8 PiB	每个存储池 1 TiB 到 10 PiB 每个卷 1 GiB 到 1 PiB	没有下限或上限
扩缩	纵向扩容添加和移除磁盘自动扩缩	纵向扩容	不可扩缩	基本：纵向扩容可用区级和区域级：纵向扩容和纵向缩容	扩缩能力强	扩容和缩容	根据使用情况自动扩缩
共享	支持	支持	不可共享	可在多个 Compute Engine 虚拟机、远程客户端和 GKE 集群上装载	可在多个 Compute Engine 虚拟机和 GKE 集群上装载。	可在多个 Compute Engine 虚拟机和 GKE 集群上装载	可从任意位置读写与 Cloud CDN 和第三方 CDN 集成
加密密钥选项	Google-owned and Google-managed encryption keys 由客户管理由客户提供	Google-owned and Google-managed encryption keys 由客户管理由客户提供	Google-owned and Google-managed encryption keys	Google-owned and Google-managed encryption keys 由客户管理（可用区和区域层级）	Google-owned and Google-managed encryption keys	Google-owned and Google-managed encryption keys 由客户管理	Google-owned and Google-managed encryption keys 由客户管理由客户提供
持久性	磁盘的生命周期	磁盘的生命周期	临时（数据在停止或删除虚拟机时丢失）	Filestore 实例的生命周期	Managed Lustre 实例的生命周期	卷的生命周期	存储桶的生命周期
可用性	Zonal 跨地区复制快照（手动或预定）磁盘克隆	Zonal 磁盘克隆跨地区复制	Zonal	区域或可用区，取决于层级可用区和区域层级的快照备份复制	Zonal	区域 (Flex) 或可用区（所有级别）备份快照跨区域复制	跨可用区的数据冗余跨区域的冗余选项
性能	根据磁盘大小和 CPU 数量线性扩缩	动态扩缩永久性存储	高性能临时存储空间	基本：一致的性能可用区级和区域级：动态扩缩	使用配置容量进行线性扩缩，并提供多种性能层级选项	可扩缩的性能预期取决于服务等级	自动扩缩读写速率和动态负载重新分布 Anywhere Cache
管理	手动格式化和装载	手动格式化和装载	手动格式化、stripe 和装载	全代管式	全代管式	全代管式	全代管式

下表列出了每种 Google Cloud存储选项适用的负载类型：

存储方案	工作负载类型
Persistent Disk	IOPS 密集型或对延迟时间敏感的应用数据库共享只读存储空间快速、持久的虚拟机备份
Hyperdisk	IOPS 密集型或对延迟时间敏感的应用数据库共享只读存储空间快速、持久的虚拟机备份扩容分析
本地 SSD	专为闪存优化的数据库用于分析的热缓存 scratch 磁盘
Filestore	直接原样迁移本地文件系统共享配置文件常用工具和实用程序集中式日志
Managed Lustre	AI 和机器学习工作负载 HPC
NetApp Volumes	直接原样迁移本地文件系统共享配置文件常用工具和实用程序集中式日志 Windows 工作负载
Cloud Storage	流式视频媒体素材资源库高吞吐量数据湖备份和归档长尾内容

选择存储方案

选择存储方案包括两个部分：

确定所需的存储服务。
在给定服务中选择所需的特征和设计选项。
特定于服务的功能和设计选项的示例
Persistent Disk

部署区域和可用区

区域复制

磁盘类型、大小和 IOPS（适用于 Extreme Persistent Disk）

加密密钥：Google 拥有和 Google 管理、客户管理或客户提供

快照时间表
Hyperdisk

部署可用区

磁盘类型、大小、吞吐量（对于 Hyperdisk Throughput）和 IOPS（对于 Hyperdisk Extreme）

加密密钥：Google 拥有和 Google 管理、客户管理或客户提供

快照时间表
Filestore

部署区域和可用区

实例层级

容量

IP 范围：自动分配或自定义

访问权限控制
NetApp Volumes

部署区域

存储池的服务等级

池和卷容量

卷协议

卷导出规则
Cloud Storage

位置：多区域、双区域、单区域

存储类别：Standard、Nearline、Coldline、Archive

访问权限控制：统一或精细

加密密钥：Google 拥有和 Google 管理、客户管理或客户提供

保留政策

存储建议

请将以下建议用作起点，选择满足您的要求的存储服务和功能。如需获取针对 AI 和机器学习工作负载的具体指导，请参阅为 Google Cloud中的 AI 和机器学习工作负载设计存储。

本文档后面部分的决策树也展示了通用存储建议。

对于需要并行文件系统的应用，请使用 Managed Lustre。

对于需要基于文件的访问权限的应用，请根据您对访问协议、可用性和性能的要求选择合适的文件存储服务。

访问协议	建议
NFS	如果您需要区域可用性和随着容量而扩展的高性能，请使用 Filestore Regional。如果可用区级可用性足够，但您需要随着容量扩缩的高性能，请使用 Filestore 可用区级或 NetApp Volumes Premium 或 Extreme。否则，请使用 Filestore Basic 或 NetApp Volumes。如需了解 Filestore 服务层级之间的差异，请参阅服务层级。
SMB	使用 NetApp Volumes。

访问协议

建议

NFS

如果您需要区域可用性和随着容量而扩展的高性能，请使用 Filestore Regional。
如果可用区级可用性足够，但您需要随着容量扩缩的高性能，请使用 Filestore 可用区级或 NetApp Volumes Premium 或 Extreme。
否则，请使用 Filestore Basic 或 NetApp Volumes。

如需了解 Filestore 服务层级之间的差异，请参阅服务层级。

SMB

使用 NetApp Volumes。

对于需要具有高性能的主存储的工作负载，请根据您的要求使用 Hyperdisk、本地固态硬盘或 Persistent Disk。

要求建议

快速 scratch 磁盘或缓存使用本地 SSD 磁盘（临时）。

性能和容量可独立扩缩的块存储

要求	建议
快速 scratch 磁盘或缓存	使用本地 SSD 磁盘（临时）。
性能和容量可独立扩缩的块存储	使用 Hyperdisk。根据您的要求选择适当的磁盘类型：通用工作负载：`hyperdisk-balanced` 高 I/O 工作负载，例如高性能数据库：`hyperdisk-extreme` 横向扩容分析、适用于成本敏感型应用的数据硬盘和冷存储：`hyperdisk-throughput` 需要以只读模式向多个虚拟机提供高吞吐量的机器学习工作负载：只读模式下的 `hyperdisk-ml` 同一区域内的多个虚拟机同时对同一磁盘具有写入访问权限：多写入者模式下的 `hyperdisk-balanced-high-availability` 如需了解详情，请参阅 Google Cloud Hyperdisk 简介。
具有可扩缩容量的块存储	使用 Persistent Disk。根据您的要求选择适当的磁盘类型：依序 IOPS：`pd-standard` IOPS 密集型工作负载：`pd-extreme` 或 `pd-ssd` 平衡性能与费用：`pd-balanced` 如需了解详情，请参阅 Persistent Disk 简介。

使用 Hyperdisk。根据您的要求选择适当的磁盘类型：

通用工作负载：hyperdisk-balanced
高 I/O 工作负载，例如高性能数据库：hyperdisk-extreme
横向扩容分析、适用于成本敏感型应用的数据硬盘和冷存储：hyperdisk-throughput
需要以只读模式向多个虚拟机提供高吞吐量的机器学习工作负载：只读模式下的 hyperdisk-ml
同一区域内的多个虚拟机同时对同一磁盘具有写入访问权限：多写入者模式下的 hyperdisk-balanced-high-availability

如需了解详情，请参阅 Google Cloud Hyperdisk 简介。

具有可扩缩容量的块存储

使用 Persistent Disk。根据您的要求选择适当的磁盘类型：

依序 IOPS：pd-standard
IOPS 密集型工作负载：pd-extreme 或 pd-ssd
平衡性能与费用：pd-balanced

如需了解详情，请参阅 Persistent Disk 简介。

根据您的冗余要求，在可用区磁盘或区域磁盘间进行选择。

要求	建议
区域中单个可用区的冗余	使用 Hyperdisk 或可用区级 Persistent Disk。
同一区域内多个可用区中的冗余	使用 Hyperdisk 高可用性或区域级 Persistent Disk。

对于规模不受限制且全球可用的存储，请使用 Cloud Storage。

根据数据访问频率和存储时长，选择合适的 Cloud Storage 类别。

要求	建议
访问频率不规律，或者数据保留期限未知或不可预测。	使用 Autoclass 功能，根据每个对象的访问模式自动将存储桶中的对象转换为适当的存储类别。
针对频繁访问的数据（包括高吞吐量分析、数据湖、网站、流式视频和移动应用）的存储。	使用 Standard 存储类别。要缓存频繁访问的数据，并从靠近客户端的位置提供这些数据，请使用 Cloud CDN。对于读取密集型工作负载（例如机器学习训练、推理和分析），如果数据更改不频繁但读取频繁，您可以使用 Anywhere Cache 来提升读取性能并降低数据传输费用。
存储至少 30 天的不常访问数据（例如备份和长尾多媒体内容）的低成本存储。	使用 Nearline 存储类别。
存储至少 90 天的不常访问的数据（例如灾难恢复）的低成本存储。	使用 Coldline 存储类别。
存储至少 365 天的不常访问的数据的低成本存储，包括监管归档。	使用 Archive 存储类别。

如需详细的比较分析，请参阅 Cloud Storage 类别。

数据转移选项

选择适当的 Google Cloud 存储服务后，您需要将数据转移到 Google Cloud，以便部署和运行工作负载。您需要转移的数据可能位于本地或其他云平台上。

您可以使用以下方法将数据转移到 Google Cloud：

使用 Storage Transfer Service 在线转移数据：在对象和文件存储系统（包括 Cloud Storage、Amazon S3、Azure 存储服务）与本地数据源之间自动转移大量数据。
使用 Transfer Appliance 离线转移数据：在网络连接和带宽不可用、受限或费用高昂的情况下，将大量数据离线转移并加载到 Google Cloud 。
将数据上传到 Cloud Storage：使用 API 控制台、gcloud CLI、Cloud Storage API 或客户端库将数据在线上传到 Cloud Storage 存储桶。

选择数据传输方法时，考虑数据大小、时间限制、带宽可用性、费用目标以及安全和合规性要求等因素。如需了解如何规划和实现数据转移到 Google Cloud，请参阅迁移到 Google Cloud：转移大型数据集。

存储选项决策树

以下决策树图将指导您完成前面讨论的 Google Cloud存储建议。如需了解针对 AI 和机器学习工作负载的具体指导，请参阅为 Google Cloud中的 AI 和机器学习工作负载设计存储。

查看放大图片

用于选择存储策略的决策树。

后续步骤

使用 Google Cloud 价格计算器估算存储费用。
了解构建在安全性、弹性、费用和性能方面经过优化的云拓扑的最佳做法。
了解何时将 Lustre 等并行文件系统用于 HPC 工作负载。

贡献者

作者： Kumar Dhanagopal | 跨产品解决方案开发者

其他贡献者：

Brennan Doyle | 解决方案架构师
Dean Hildebrand | 首席技术官办公室技术总监
Geoffrey Noer | 组合产品经理
Jack Zhou | 技术文档工程师
Jason Wu | 产品管理总监
Jeff Allen | 解决方案架构师
Samantha He | 技术文档工程师
Sean Derrington | 存储组合产品经理