Dataflow での GPU のサポート

このページでは、前提条件やサポートされている GPU タイプなど、GPU と Dataflow の連携に関する背景情報について説明します。

Dataflow ジョブで GPU を使用すると、一部のデータ処理タスクを高速化できます。GPU では特定の計算を CPU よりも迅速に実行できます。通常、これらの計算は数値または線形代数であり、画像処理や ML のユースケースでよく使用されます。パフォーマンス向上の程度は、ユースケース、計算のタイプ、処理されるデータの量によって異なります。

Dataflow で GPU を使用するための前提条件

Dataflow ジョブで GPU を使用するには、Runner v2 を使用する必要があります。
Dataflow は、Docker コンテナ内のワーカー VM でユーザーコードを実行します。これらのワーカー VM は Container-Optimized OS を実行します。Dataflow ジョブで GPU を使用するには、次の前提条件を満たす必要があります。
- GPU ドライバがワーカー VM にインストールされ、Docker コンテナにアクセスできる。詳細については、GPU ドライバをインストールするをご覧ください。
- パイプラインに必要な GPU ライブラリ（NVIDIA CUDA-X ライブラリ、NVIDIA CUDA ツールキットなど）がカスタムコンテナイメージにインストールされている。詳細については、コンテナイメージを構成するをご覧ください。
通常、GPU コンテナは大きいため、ディスク容量が不足しないように、デフォルトのブートディスクサイズを 50 GB 以上に増やします。

料金

GPU を使用するジョブでは、Dataflow の料金ページで定められた料金が発生します。

対象

Dataflow では、次の GPU タイプがサポートされています。

GPU のタイプ	`worker_accelerator` 文字列
NVIDIA® L4	`nvidia-l4`
NVIDIA® A100 40 GB	`nvidia-tesla-a100`
NVIDIA® A100 80 GB	`nvidia-a100-80gb`
NVIDIA® Tesla® T4	`nvidia-tesla-t4`
NVIDIA® Tesla® P4	`nvidia-tesla-p4`
NVIDIA® Tesla® V100	`nvidia-tesla-v100`
NVIDIA® Tesla® P100	`nvidia-tesla-p100`

パフォーマンスデータなど、各 GPU タイプの詳細については、Compute Engine GPU プラットフォームをご覧ください。

GPU で使用可能なリージョンとゾーンについては、Compute Engine ドキュメントの GPU のリージョンとゾーンの可用性をご覧ください。

推奨されるワークロード

次の表に、さまざまなワークロードに対して推奨される GPU の種類を示します。表の例はあくまでも提案です。ワークロードに適した GPU タイプを判断するには、使用する環境でテストする必要があります。

GPU メモリサイズ、機能の可用性、各種 GPU モデルの理想的なワークロードタイプについて詳しくは、GPU プラットフォームページの一般的な比較表をご覧ください。

ワークロード	A100	L4	T4
モデルの微調整	推奨
大規模モデルの推論	推奨	推奨
中規模モデルの推論		推奨	推奨
小規模モデルの推論		推奨	推奨

次のステップ

GPU を使用するパイプラインをビルドするためのデベロッパーワークフローの例を確認する。
GPU を使用して Dataflow で Apache Beam パイプラインを実行する方法を確認する。
GPU を使用した Landsat 衛星画像の処理に取り組む。