コンテンツに移動
Containers & Kubernetes

Filestore の新機能: GKE 上でステートフル ワークロードを強化する

2024年1月10日
Google Cloud Japan Team

Try Gemini 1.5 Pro

Google's most advanced multimodal model in Vertex AI

Try it

※この投稿は米国時間 2023 年 12 月 1 日に、Google Cloud blog に投稿されたものの抄訳です。

多くのお客様が、Google Kubernetes Engine(GKE)上でステートフル アプリケーションを実行するために Filestore を利用しています。この 2 つを併用する利点の背景については、こちらのブログ投稿をご覧ください。

Google Cloud のフルマネージド ファイル ストレージ サービスである Filestore は、コンピューティング VM から分離されたマルチリーダー / マルチライター ソリューションであるため、VM の変更や障害に対して高い耐性が備わっています。

Filestore の Enterprise ティアとゾーン(旧称: 高スケール)ティアは、パフォーマンス、可用性、耐久性のために一から設計された、スケールアウト アーキテクチャを利用する Filestore の最新のプラットフォームに基づいて構築されています。ゾーンティアでは、高い耐久性を確保するために顧客データをゾーン内で 2 回保存し、99.9% の可用性 SLA を実現します。一方、リージョン サービスである Enterprise ティアでは、リージョン内の 3 つのゾーンで同期しながらデータを複製し、99.99% の可用性を実現します。さらに、10 月には Enterprise、ゾーン、基本 HDD の各ティアで Filestore の料金を最大 25% 引き下げました(基本 SSD の料金に変更はありません)。値下げになった新しい料金は自動的に適用されます。何も対応する必要はありません。

Filestore は GKE の CSI ドライバに統合されたフルマネージド サービスで、新機能の追加や GKE との統合により継続的に進化しています。ここでは、最近一般提供が開始された 3 つの新機能をご紹介します。

1. CSI ドライバで Filestore の「ゾーン、高容量」(100 TiB)をサポート

新しい CSI ドライバの大容量対応により、GKE を使用したゾーンティアでは、インスタンスあたり 10 TiB から 100 TiB まで、大容量と高パフォーマンスに対するニーズに合わせて容量とパフォーマンスをスケールできます。Filestore ゾーンティアの高いスループット(最大 26 GiB/秒)は、ファイル インターフェースを想定した PyTorch / TensorFlow のような大規模な AI / ML トレーニング フレームワークに有効です。しかも、中断を伴わないアップグレードや 10 TiB あたり 1,000 件の NFS 接続も可能です。つまり、最大 10,000 件の NFS 同時接続が可能であるため、大規模な GKE のデプロイや要求の厳しいマルチライターの AI / ML ワークロードにも対応できます。

Filestore ゾーンティア用の CSI ドライバを追加したことにより、これまでの Filestore Enterprise ティアと Filestore 基本ティアが補完されます。これにより、パフォーマンス、容量、データ保護(スナップショットやバックアップなど)のニーズに応じて適切な Filestore ティアを選択できるようになりました。なお、Filestore Enterprise ティアは中断のないアップグレードに対応していますが、Filestore 基本ティアは対応していません。

2. バックアップ

このたび、Filestore Enterprise 向けに CSI 統合バックアップがリリースされました。

これまでも Filestore 基本ティアのボリュームでVolume Snapshots API を使用してデータを保護することができましたが、今回、同じ方法で Filestore Enterprise ティアのボリュームを保護できるようになりました。VolumeSnapshot API という名前は少し誤解を招きやすいため注意が必要です。この API は、実際にはデータをバックアップするための手段であり、その名前が示すようなローカル ファイル システムのスナップショットではありません。この API を使用してバックアップを呼び出すプロセスは、Filestore 基本ティアと Filestore Enterprise ティアで同じです。

既存の Enterprise ティア ボリュームのバックアップを取り、データソースとしてスナップショットを使用して新しいボリュームを作成できるようになりました。この新機能により、CSI ドライバから直接、インスタンスのバックアップや復元が可能になります。この機能は、シングルシェア構成の Enterprise ティアで使用できます。現時点では、Enterprise ティアのマルチシェア構成は、Volume Snapshots API に対応していません。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Filestore.max-1700x1700.png

CSI ドライバから直接バックアップを作成して復元する

3. 小容量の Filestore Enterprise マルチシェア

GKE と Filestore Enterprise のお客様は、昨年リリースされたマルチシェア インスタンスの高い効率性を享受し、1 TiB のインスタンスを複数の 100 GiB の永続ボリュームに分割して、ストレージ使用率を向上させることができます。

このたび Google は、GKE CSI ドライバを使用した、次の段階のマルチシェア機能をリリースしました。この新機能は、Enterprise ティアでのみ利用できます。マルチシェアでは、Enterprise インスタンスを最大 80 個の共有(以前の 10 個から増加)に細分化できます。また、最小共有容量(永続ボリューム)は 10 GiB(以前の 100 GiB から引き下げ)から利用できます。

Enterprise のマルチシェアを使用すると、GKE ステートフル ワークロード用の永続ストレージで高い耐久性(99.99% の SLA)と高パフォーマンスを実現できるだけでなく、インスタンスあたり最大 80 個の共有でインスタンスを包括的に使用できるため、高い効率性ももたらされます。向上したマルチシェア機能を利用して GKE ストレージの有効性を高める方法の詳細については、こちらをご覧ください。

Filestore によるステートフル ワークロードへの対応方法

Filestore は、フルマネージドの GKE 統合 NFS ストレージ サービスです。ilestore ゾーンティア用の CSI 統合、Filestore Enterprise 用のボリューム スナップショット API の利用、Filestore Enterprise マルチシェアの永続ボリュームのさらに詳細なサポートを追加した Google は、今後も AI / ML トレーニングのような大規模で要求の厳しい GKE ステートフル ワークロードのサポートに尽力していきます。GKE で Filestore と CSI ドライバを使用する方法については、こちらをご覧ください。

-Google、シニア プロダクト マネージャー Barak Shein

-Google Cloud、ソフトウェア エンジニア Harry Sadoyan

投稿先