Parallelstore 是一种全托管式低延迟分布式文件系统,旨在满足高性能计算 (HPC) 和数据密集型应用的需求。
Parallelstore 非常适合多客户端需要并发访问具有数据完整性的共享文件的用例。
Parallelstore 支持 POSIX 标准,可确保与各种现有应用和工具兼容,从而简化迁移和集成。
Parallelstore 实例可以挂载到 Compute Engine 虚拟机或 Google Kubernetes Engine 集群。借助 Parallelstore CSI 驱动程序,客户可以使用 Kubernetes API 将文件系统作为卷访问有状态工作负载。
您可以通过命令行和 REST API 向 Cloud Storage 中批量传入和从中批量传出数据。
规格
Parallelstore 是一个“备用”文件系统:它由本地 SSD 提供支持,并采用 2+1 擦除编码,数据丢失的平均时间 (MTTDL) 介于 2 到 16 个月之间,具体取决于实例容量。如需了解详情,请参阅性能表格。
可用容量可配置为 12 TiB 到 100 TiB 之间的任意值。
多个区域均支持。
性能
Parallelstore 的预期性能如下表所示。
指标 | 结果 |
---|---|
写入吞吐量 | 0.5 GiBps/TiB |
读取吞吐量 | 1.15 GiBps/TiB |
读取 IOPS | 每 TiB 3 万 IOPS |
写入 IOPS | 每 TiB 1 万 IOPS |
4K 读取延迟时间 | 0.3 毫秒 |
支持的客户端进程数 | 4000 |
传输速度(Parallelstore <> Cloud Storage) | 最大传输速率为 20 GiBps 或每秒 5,000 个文件 |
平均数据丢失时间 (MTTDL) | 100 TiB 容量:2 个月
48 TiB 容量:4 个月 12 TiB 容量:16 个月 |
这些数字是通过向单个实例发出 256 个客户端连接来衡量的。延迟时间是从单个客户端测量的。目录和文件剥离设置会针对每个指标进行优化。
使用场景
高性能计算:在 HPC 环境中,多个计算节点需要快速、一致地访问共享数据以进行模拟、建模和分析,Parallelstore 非常适合此类环境。
机器学习:Parallelstore 可以处理机器学习工作负载的大型数据集和高吞吐量要求,从而实现高效的训练和推理。
价格
如需了解详情,请参阅价格页面。