フレームワークとプロセッサの組み合わせに合わせて、特定の Deep Learning VM イメージを利用できます。現在は、TensorFlow、PyTorch、汎用の高性能コンピューティングをサポートするイメージがあり、それぞれに CPU のみと GPU 対応のワークフロー バージョンがあります。次の表を参照して、必要なイメージを見つけてください。
イメージ ファミリーの決定
どの Deep Learning VM イメージ ファミリーを使用するかは、ニーズによって決まります。次の表には、イメージ ファミリーの最新バージョンがフレームワーク タイプ別に示されています。名前に latest
が含まれているイメージ ファミリーを指定してインスタンスを作成すると、そのイメージの最新バージョンを常に取得できます。特定のフレームワーク バージョンが必要な場合は、利用可能なすべてのバージョンのリストにスキップしてください。
フレームワーク | プロセッサ | イメージ ファミリー名 |
---|---|---|
基本 | GPU | common-cu110 common-cu101 common-cu100 common-cu92 common-cu91 common-cu90
|
CPU | common-cpu |
|
TensorFlow Enterprise 2.x | GPU | tf2-ent-latest-gpu |
CPU | tf2-ent-latest-cpu |
|
TensorFlow Enterprise 1.x | GPU | tf-ent-latest-gpu |
CPU | tf-ent-latest-cpu |
|
TensorFlow 2.x | GPU | tf2-2-4-cu110
|
CPU | tf2-2-4-cpu |
|
TensorFlow 1.x | GPU | tf-latest-gpu |
CPU | tf-latest-cpu |
|
PyTorch | GPU | pytorch-latest-gpu |
CPU | pytorch-latest-cpu | |
PyTorch XLA | TPU / GPU / CPU(試験運用版) | pytorch-latest-xla |
R | CPU(試験運用版) | r-latest-cpu-experimental |
RAPIDS | GPU(試験運用版) | rapids-latest-gpu-experimental |
Chainer | GPU(試験運用版) | chainer-latest-gpu-experimental |
CPU(試験運用版) | chainer-latest-cpu-experimental | |
XGBoost | GPU(試験運用版) | xgboost-latest-gpu-experimental |
CPU(試験運用版) | xgboost-latest-cpu-experimental | |
MXNet | GPU(試験運用版) | mxnet-latest-gpu-experimental |
CPU(試験運用版) | mxnet-latest-cpu-experimental |
|
CNTK | GPU(試験運用版) | cntk-latest-gpu-experimental |
CPU(試験運用版) | cntk-latest-cpu-experimental |
|
Caffe | GPU(試験運用版) | caffe1-latest-gpu-experimental |
CPU(試験運用版) | caffe1-latest-cpu-experimental |
オペレーティング システムの選択
ほとんどのフレームワークで、Debian 10 がデフォルトの OS です。Debian 9 および Ubuntu 18.04 イメージは、一部のフレームワークで使用できます。これらは、イメージ ファミリー名の -debian-9
接頭辞と -ubuntu-1804
接頭辞示されます(すべての利用可能なバージョンのリストをご覧ください)。次のフレームワークでは、Debian 9 がデフォルトであり、Debian 10 は使用できません。
- Chainer
- Rapids
- Caffe with GPU
PyTorch 1.6 Cuda 11(pytorch-1-6-cu110
およびすべての TensorFlow Enterprise(tf-ent
および tf2-ent
)イメージ ファミリーは A100 GPU アクセラレータをサポートしています。
TensorFlow Enterprise イメージ
TensorFlow Enterprise イメージ ファミリーは、長期的なバージョン サポート付きの Google Cloud に最適化された TensorFlow 配布を提供します。TensorFlow Enterprise の詳細については、TensorFlow Enterprise の概要をご覧ください。
次の表に使用可能な TensorFlow イメージを示します。この表を参考にして、必要な TensorFlow または TensorFlow Enterprise のバージョンを含むイメージを選択してください。
TensorFlow または TensorFlow Enterprise のバージョン | プロセッサ | イメージ ファミリー名 |
---|---|---|
TensorFlow 2.4 | GPU | tf2-2-4-cu110
|
CPU | tf2-2-4-cpu |
|
TensorFlow Enterprise 2.3 | GPU | tf2-2-3-cu110
|
CPU | tf2-2-3-cpu |
|
TensorFlow 2.2 | GPU | tf2-2-2-cu101
|
CPU | tf2-2-2-cpu
|
|
TensorFlow Enterprise 2.1 | GPU | tf2-2-1-cu110
|
CPU | tf2-2-1-cpu |
|
TensorFlow 2.0 | GPU | tf2-2-0-cu100
|
CPU | tf2-2-0-cpu |
|
TensorFlow Enterprise 1.15 | GPU | tf-1-15-cu110
|
CPU | tf-1-15-cpu |
|
TensorFlow 1.14 | GPU | tf-1-14-cu100
|
CPU | tf-1-14-cpu |
|
TensorFlow 1.13 | GPU | tf-1-13-cu100
|
CPU | tf-1-13-cpu |
|
TensorFlow 1.11 | GPU | tf-1-11-cu100
|
CPU | tf-1-11-cpu |
|
TensorFlow 1.10 | GPU | tf-1-10-cu100
|
CPU | tf-1-10-cpu |
試験運用版イメージ
イメージ ファミリーの表に示されているように、Deep Learning VM イメージ ファミリーの中には試験運用版のものがあります。試験運用版のイメージはベスト エフォート ベースでサポートされます。また、フレームワークのリリースに合わせてアップデートされない場合があります。
イメージ バージョンの指定
最新のイメージが存在する場合でも、同じイメージを再利用できます。たとえば、クラスタを作成するときに、新しいインスタンスの作成で同じイメージが常に使用されるようにする場合、この機能は非常に便利です。この状況では、イメージ ファミリーの名前を使用しないでください。最新のイメージが更新されると、クラスタ内の一部のインスタンスに異なるイメージが作成されます。
代わりに、イメージの正確な名前を特定してバージョン番号を組み込み、そのイメージを使用してクラスタ内に新しいインスタンスを生成できます。
最新のイメージの正確な名前を確認するには、希望するターミナルの gcloud
コマンドライン ツールか Cloud Shell で次のコマンドを使用します。image-family は、最新のバージョン番号を確認するイメージ ファミリー名に置き換えます。
gcloud compute images describe-from-family image-family \ --project deeplearning-platform-release
出力で name
フィールドを探します。新しいインスタンスを作成するときに、このフィールドのイメージ名を使用します。
利用可能なすべてのバージョンのリスト
特定のフレームワークまたは CUDA バージョンが必要な場合は、使用可能なイメージの完全なリストを検索します。使用可能な Deep Learning VM イメージをすべて表示するには、次の gcloud
ツールコマンドを実行します。
gcloud compute images list \ --project deeplearning-platform-release \ --no-standard-images
イメージ ファミリーの形式は FRAMEWORK-VERSION-CUDA_VERSION(-experimental)
のようになります。FRAMEWORK
はターゲット ライブラリ、VERSION
はフレームワーク バージョン、CUDA_VERSION
は CUDA スタックのバージョン(存在する場合)です。
たとえば、ファミリー tf2-ent-2-3-cu110
からのイメージには TensorFlow 2.3 と CUDA 11.0 があります。ファミリー pytorch-1-7-cpu
のイメージには PyTorch 1.7 がありますが、CUDA スタックはありません。
次のステップ
Cloud Marketplace またはコマンドラインを使用して、新しい Deep Learning VM インスタンスを作成する。