Parallelstore の概要

Parallelstore は招待制です。プロジェクトで Parallelstore へのアクセス権をリクエストする場合は、営業担当者にお問い合わせください。 Google Cloud

Parallelstore は、ハイ パフォーマンス コンピューティング(HPC)とデータ集約型アプリケーションの要件を満たすように設計された、フルマネージドで低レイテンシの分散ファイル システムです。

Parallelstore は、複数のクライアントがデータの整合性のある共有ファイルに同時にアクセスする必要があるユースケースに最適です。

Parallelstore は POSIX 標準をサポートしているため、さまざまな既存のアプリケーションやツールとの互換性が確保され、移行と統合が簡素化されます。

Parallelstore インスタンスは、Compute Engine VM または Google Kubernetes Engine クラスタにマウントできます。Parallelstore CSI ドライバを使用すると、Kubernetes API を使用して、ステートフル ワークロードのボリュームとしてファイル システムにアクセスできます。

Cloud Storage との間でのバッチデータ転送は、コマンドラインと REST API から使用できます。

仕様

  • Parallelstore は「スクラッチ」ファイル システムです。2+1 消失訂正符号を使用するローカル SSD を基盤としており、平均データ損失時間(MTTDL)はインスタンスの容量に応じて 2 ~ 16 か月です。詳細については、パフォーマンスの表をご覧ください。

  • 使用可能な容量は 12 TiB ~ 100 TiB の範囲で構成できます。

  • 複数のリージョンでサポートされています。

パフォーマンス

Parallelstore の予想パフォーマンスを次の表に示します。

指標 結果
書き込みスループット 1 TiB あたり 0.5 GiBps
読み取りスループット 1 TiB あたり 1.15 GiBps
読み取り IOPS 1 TiB あたり 3 万 IOPS
書き込み IOPS 1 TiB あたり 1 万 IOPS
4K 読み取りレイテンシ 0.3 ミリ秒
サポートされるクライアント プロセスの数 4000
転送速度(Parallelstore <> Cloud Storage) 最大転送速度 20 GiBps、または 1 秒あたり 5,000 ファイル
データ損失までの平均時間(MTTDL) 100 TiB の容量: 2 か月
48 TiB の容量: 4 か月
12 TiB の容量: 16 か月

これらの数値は、単一インスタンスへの 256 個のクライアント接続を使用して測定されます。レイテンシは 1 つのクライアントから測定されます。ディレクトリとファイルのストライプ設定は、指標ごとに最適化されます。

ユースケース

  • ハイ パフォーマンス コンピューティング: Parallelstore は、シミュレーション、モデリング、分析のために複数のコンピューティング ノードが共有データに高速で一貫したアクセスを必要とする HPC 環境に適しています。

  • ML: Parallelstore は、ML ワークロードの大規模なデータセットと高スループット要件を処理できるため、効率的なトレーニングと推論が可能になります。

料金

詳細については、料金のページをご覧ください。