Parallelstore 概览

Parallelstore 仅限受邀者使用。如果您想在 Google Cloud 项目中申请访问 Parallelstore,请与您的销售代表联系。

Parallelstore 是一种全托管式低延迟分布式文件系统,旨在满足高性能计算 (HPC) 和数据密集型应用的需求。

Parallelstore 非常适合多客户端需要并发访问具有数据完整性的共享文件的用例。

Parallelstore 支持 POSIX 标准,可确保与各种现有应用和工具兼容,从而简化迁移和集成。

Parallelstore 实例可以挂载到 Compute Engine 虚拟机或 Google Kubernetes Engine 集群。借助 Parallelstore CSI 驱动程序,客户可以使用 Kubernetes API 将文件系统作为卷访问有状态工作负载。

您可以通过命令行和 REST API 向 Cloud Storage 中批量传入和从中批量传出数据。

规格

  • Parallelstore 是一个“备用”文件系统:它由本地 SSD 提供支持,并采用 2+1 擦除编码,数据丢失的平均时间 (MTTDL) 介于 2 到 16 个月之间,具体取决于实例容量。如需了解详情,请参阅性能表格。

  • 可用容量可配置为 12 TiB 到 100 TiB 之间的任意值。

  • 多个区域均支持。

性能

Parallelstore 的预期性能如下表所示。

指标 结果
写入吞吐量 0.5 GiBps/TiB
读取吞吐量 1.15 GiBps/TiB
读取 IOPS 每 TiB 3 万 IOPS
写入 IOPS 每 TiB 1 万 IOPS
4K 读取延迟时间 0.3 毫秒
支持的客户端进程数 4000
传输速度(Parallelstore <> Cloud Storage) 最大传输速率为 20 GiBps 或每秒 5,000 个文件
平均数据丢失时间 (MTTDL) 100 TiB 容量:2 个月
48 TiB 容量:4 个月
12 TiB 容量:16 个月

这些数字是通过向单个实例发出 256 个客户端连接来衡量的。延迟时间是从单个客户端测量的。目录和文件剥离设置会针对每个指标进行优化。

使用场景

  • 高性能计算:在 HPC 环境中,多个计算节点需要快速、一致地访问共享数据以进行模拟、建模和分析,Parallelstore 非常适合此类环境。

  • 机器学习:Parallelstore 可以处理机器学习工作负载的大型数据集和高吞吐量要求,从而实现高效的训练和推理。

价格

如需了解详情,请参阅价格页面。