Containers & Kubernetes

Kubernetes API を使用して GKE で Cloud Storage オブジェクトを使用する - パート 1

2024年2月8日

Google Cloud Japan Team

※この投稿は米国時間 2024 年 2 月 2 日に、Google Cloud blog に投稿されたものの抄訳です。

Filesystem in Userspace（FUSE）は、ファイルシステムを Linux カーネルにエクスポートするために使用されるインターフェースです。Cloud Storage FUSE を使用すると、Cloud Storage バケットをファイルシステムとしてマウントできます。これにより、アプリケーションはクラウド固有の API を使用せずに、一般的なファイル IO オペレーション（オープン、読み取り、書き込みなど）を使用してバケット内のオブジェクトにアクセスできます。Cloud Storage FUSE は一般提供されています。

Google Kubernetes Engine (GKE) は、Cloud Storage FUSE CSI ドライバを使用することで Cloud Storage FUSE とすぐに統合できます。CSI ドライバを使用すると、Kubernetes API を使用して既存の Cloud Storage バケットを永続ボリュームとして使用できます。アプリケーションでは、Cloud Storage FUSE ファイルシステムセマンティクスを使用して、オブジェクトのアップロードとダウンロードを行うことができます。Cloud Storage FUSE CSI ドライバは、オープンソースの Google Cloud Storage FUSE CSI ドライバを利用したフルマネージドのエクスペリエンスを提供します。ポータビリティ、信頼性、パフォーマンスが向上し、すぐに GKE と統合できます。

データポータビリティで AI ワークロードを強化する

Cloud Storage は、ほぼ無制限のスケール、シンプルさ、経済性、パフォーマンスという点から AI / ML ワークロードによく使用されています。とはいえ、AI / ML フレームワークの中には、ネイティブのオブジェクトストレージ API を直接サポートするライブラリを使用するものもあれば、ファイルシステムセマンティクスを必要とするものもあります。さらに言えば、環境全体にわたって一貫性のあるエクスペリエンスを確保するために、ファイルシステムセマンティクスを標準化することが望ましいとされています。Cloud Storage FUSE CSI ドライバを使用すれば、GKE ワークロードは Kubernetes API を使用してローカルファイルシステムとしてマウントされた Cloud Storage バケットにアクセスでき、さまざまな環境間でデータポータビリティが実現します。

以下に、GKE 上の Job ワークロードで一般的なファイルシステムセマンティクスを使用して Cloud Storage オブジェクトにアクセスする方法を示します。

読み込んでいます...

以下のリンク先では、CSI ドライバを使用して Cloud Storage バケットのオブジェクトを使用する AI / ML ワークロードの例をさらにご覧いただけます。

Cloud Storage FUSE CSI ドライバを使用すれば、Cloud Storage バケットとサービスアカウントを指定するだけで、残りは GKE が処理します。続いては、より詳細な管理方法と基礎となる設計について詳しく見ていきましょう。

簡単なことは簡単なままに、困難なことを可能に

Cloud Storage バケットは、Pod の仕様でインラインの CSI エフェメラルボリュームを使用することで簡単に指定できます。別途 PersistentVolume（PV）オブジェクトや PersistentVolumeClaim（PVC）オブジェクトを維持する必要はありません。互換性や認証の要件から従来の PV / PVC のアプローチが好ましい場合も、CSI ドライバは標準的な静的プロビジョニングアプローチに対応します。このアプローチは、ReadWriteMany アクセスモードによって、複数のアプリケーションが単一の PV / PVC を使用してデータを使用できるようにします。

CSI ドライバは、Pod の仕様にサイドカーコンテナを自動で追加します。そのため、ユーザーはアプリケーションコードに注力でき、Cloud Storage FUSE ランタイムの管理について心配する必要がありません。さらに、不要になったサイドカーコンテナは自動で終了するよう設計されています。これにより、サイドカーコンテナによって Kubernetes Job ワークロードの終了がブロックされることを防げます。

サイドカーコンテナが追加されると、ほとんどの軽量ワークロードで適切に機能するデフォルトのリソース割り当てとマウントオプションが設定されます。また、Cloud Storage FUSE ランタイムのマウントオプションとリソース割り当てのファインチューニングも柔軟に行えます。

厳しい制約の克服が革新的な設計につながる

Kubernetes で FUSE ドライバを実行するにはいくつかの制約があり、これらは導入の妨げになりかねません。Google は、カーネルのクロスプロセスファイルディスクリプタ転送機能を利用して権限、認証、ワークロードのライフサイクル、リソースの使用量を明確に分離することで、これらの制約を克服する、サイドカーベースの新しいソリューションを開発しました。

従来の FUSE CSI ドライバは、CSI ドライバコンテナ内のすべての FUSE インスタンスを実行するので、単一障害点が生じます。ノードの基盤となる仮想マシン（VM）上で FUSE インスタンスが直接実行される場合もありますが、その場合は予約済みのシステムリソースが消費される可能性があります。GKE のソリューションは異なります。Cloud Storage FUSE は、ワークロードコンテナと並行して、サイドカーコンテナ内で実行されます。この Pod 単位のモデルによって、Cloud Storage FUSE のライフサイクルをワークロードのライフサイクルに関連付けます。Cloud Storage FUSE はワークロードの一部として実行されるので、Workload Identity を使用して認証することができます。すなわち、サービスアカウントの認証情報を手動で管理する必要がなく、Pod レベルのきめ細かな IAM アクセス制御を使用できるということです。さらに、Cloud Storage FUSE が使用するリソースは Pod によって処理されるので、パフォーマンスをファインチューニングすることが可能になります。

FUSE ドライバをサイドカーコンテナで実行するうえでのもう一つの大きな課題に、FUSE ランタイムに高度なコンテナ権限が必要なことが挙げられます。この制約により、GKE Autopilot ではサイドカーに基づいたソリューションがほぼ不可能となります。なぜなら、Autopilot クラスタでは特権コンテナが許可されないからです。GKE のソリューションは、権限がなくても FUSE サイドカーコンテナを実行できる 2 段階の FUSE マウントテクニックを導入しており、特権コンテナにする必要があるのは CSI ドライバコンテナのみとなります。以下の図に、2 段階の FUSE マウントプロセスの仕組みを示します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Consuming_Cloud_Storage.max-2000x2000.jpg

段階 1: CSI ドライバがノード VM で「/dev/fuse」デバイスを開き、ファイルディスクリプタを取得します。その後、そのファイルディスクリプタを使用して Linux コマンド mount.fuse3 を呼び出し、マウントポイントを作成します。最終的に、CSI ドライバは Linux の sendmsg コマンドを呼び出し、emptyDir の Unix Domain Socket（UDS）経由でファイルディスクリプタをサイドカーコンテナに送信します。
段階 2: サイドカーコンテナで、ランチャープロセスが UDS に接続し、Linux の recvmsg コマンドを呼び出してファイルディスクリプタを受信します。その後、受信したファイルディスクリプタを使用して FUSE インスタンスを起動し、FUSE マウントポイントを提供します。

まとめ

Cloud Storage FUSE CSI ドライバは、Kubernetes API を使用してアプリケーションの既存の Cloud Storage バケットを使用できるようにする GKE のフルマネージドソリューションです。サイドカーをベースとする革新的な設計により、特権や認証、リソース割り当て、FUSE ライフサイクル管理に関する問題を解決します。詳細については、GKE のドキュメント「Cloud Storage FUSE CSI ドライバを使用して Cloud Storage バケットにアクセスする」をご覧ください。また、GitHub リポジトリで問題を送信してください。

-ソフトウェア エンジニア Jiaxun Song

投稿先