イメージを選択する

フレームワークとプロセッサの組み合わせに合わせて、特定の Deep Learning VM イメージを利用できます。現在は、TensorFlow、PyTorch、汎用の高性能コンピューティングをサポートするイメージがあり、それぞれに CPU のみと GPU 対応のワークフロー バージョンがあります。次の表を参照して、必要なイメージを見つけてください。

イメージ ファミリーの決定

どの Deep Learning VM イメージ ファミリーを使用するかは、ニーズによって決まります。次の表には、イメージ ファミリーの最新バージョンがフレームワーク タイプ別に示されています。名前に latest が含まれているイメージ ファミリーを指定してインスタンスを作成すると、そのイメージの最新バージョンを常に取得できます。特定のフレームワーク バージョンが必要な場合は、利用可能なすべてのバージョンのリストにスキップしてください。

フレームワーク プロセッサ イメージ ファミリー名
基本 GPU common-cu113
common-cu110
CPU common-cpu
TensorFlow Enterprise 2.x GPU tf-ent-latest-gpu
CPU tf-ent-latest-cpu
TensorFlow Enterprise 1.x GPU tf-ent-1-15-cu110
CPU tf-ent-1-15-cpu
PyTorch GPU pytorch-latest-gpu
CPU pytorch-latest-cpu
R CPU(試験運用版) r-latest-cpu-experimental
RAPIDS GPU(試験運用版) rapids-latest-gpu-experimental
Chainer GPU(試験運用版) chainer-latest-gpu-experimental
CPU(試験運用版) chainer-latest-cpu-experimental
XGBoost GPU(試験運用版) xgboost-latest-gpu-experimental
CPU(試験運用版) xgboost-latest-cpu-experimental
MXNet GPU(試験運用版) mxnet-latest-gpu-experimental
CPU(試験運用版) mxnet-latest-cpu-experimental
CNTK GPU(試験運用版) cntk-latest-gpu-experimental
CPU(試験運用版) cntk-latest-cpu-experimental
Caffe GPU(試験運用版) caffe1-latest-gpu-experimental
CPU(試験運用版) caffe1-latest-cpu-experimental

オペレーティング システムの選択

ほとんどのフレームワークで、Debian 10 がデフォルトの OS です。Ubuntu 20.04 イメージは、一部のフレームワークで使用できます。これらは、イメージ ファミリー名の -ubuntu-2004 接尾辞で示されます(すべての利用可能なバージョンのリストをご覧ください)。Debian 9 イメージはサポートが終了しました。

PyTorch と TensorFlow Enterprise のイメージ ファミリーは、A100 GPU アクセラレータをサポートしています。

含まれる依存関係

各リリースに含まれる Python 依存関係のリストは、Cloud Storage の次の場所で提供されています。

 gs://deeplearning-platform-release/installed-dependencies/images/RELEASE_MILESTONE

RELEASE_MILESTONE は、リリース マイルストーン(m88 など)に置き換えます。たとえば、M88 リリースのリストは gs://deeplearning-platform-release/installed-dependencies/images/m88/ にあります。

TensorFlow Enterprise イメージ

TensorFlow Enterprise イメージ ファミリーは、Google Cloud 向けに最適化された TensorFlow ディストリビューションを提供します。TensorFlow Enterprise ディストリビューションの特定のバージョンには長期的なバージョン サポートも含まれています。TensorFlow Enterprise の詳細については、TensorFlow Enterprise の概要をご覧ください。

次の表に使用可能な TensorFlow イメージを示します。この表を参考にして、必要な TensorFlow または TensorFlow Enterprise のバージョンを含むイメージを選択してください。

TensorFlow または TensorFlow Enterprise のバージョン プロセッサ イメージ ファミリー名 長期的なバージョン サポート
TensorFlow Enterprise 2.9 GPU tf-ent-2-9-cu113 含まれていません
CPU tf-ent-2-9-cpu 含まれていません
TensorFlow Enterprise 2.8 GPU tf-ent-2-8-cu113 含まれています
CPU tf-ent-2-8-cpu 含まれています
TensorFlow Enterprise 2.7 GPU tf-ent-2-7-cu113 含まれていません
CPU tf-ent-2-7-cpu 含まれていません
TensorFlow Enterprise 2.6 GPU tf-ent-2-6-cu110 含まれています
CPU tf-ent-2-6-cpu 含まれています
TensorFlow Enterprise 2.5 GPU tf-ent-2-5-cu110 含まれていません
CPU tf-ent-2-5-cpu 含まれていません
TensorFlow 2.4 GPU tf-2-4-cu110 含まれていません
CPU tf-2-4-cpu 含まれていません
TensorFlow Enterprise 2.3 GPU tf-ent-2-3-cu110 含まれています
CPU tf-ent-2-3-cpu 含まれています
TensorFlow 2.2 GPU tf2-2-2-cu101 含まれていません
CPU tf2-2-2-cpu 含まれていません
TensorFlow Enterprise 2.1 GPU tf-ent-2-1-cu110 含まれています
CPU tf-ent-2-1-cpu 含まれています
TensorFlow 2.0 GPU tf2-2-0-cu100 含まれていません
CPU tf2-2-0-cpu 含まれていません
TensorFlow Enterprise 1.15 GPU tf-ent-1-15-cu110 含まれています
CPU tf-ent-1-15-cpu 含まれています
TensorFlow 1.14 GPU tf-1-14-cu100 含まれていません
CPU tf-1-14-cpu 含まれていません
TensorFlow 1.13 GPU tf-1-13-cu100 含まれていません
CPU tf-1-13-cpu 含まれていません
TensorFlow 1.11 GPU tf-1-11-cu100 含まれていません
CPU tf-1-11-cpu 含まれていません
TensorFlow 1.10 GPU tf-1-10-cu100 含まれていません
CPU tf-1-10-cpu 含まれていません

試験運用版イメージ

イメージ ファミリーの表に示されているように、Deep Learning VM イメージ ファミリーの中には試験運用版のものがあります。試験運用版のイメージはベスト エフォート ベースでサポートされます。また、フレームワークのリリースに合わせてアップデートされない場合があります。

イメージ バージョンの指定

最新のイメージが存在する場合でも、同じイメージを再利用できます。たとえば、クラスタを作成するときに、新しいインスタンスの作成で同じイメージが常に使用されるようにする場合、この機能は非常に便利です。この状況では、イメージ ファミリーの名前を使用しないでください。最新のイメージが更新されると、クラスタ内の一部のインスタンスに異なるイメージが作成されます。

代わりに、イメージの正確な名前を特定してバージョン番号を組み込み、そのイメージを使用してクラスタ内に新しいインスタンスを生成できます。

最新のイメージの正確な名前を確認するには、任意のターミナルで Google Cloud CLI を使用するか、Cloud Shell で次のコマンドを使用します。IMAGE_FAMILY は、最新のバージョン番号を確認するイメージ ファミリー名に置き換えます。

gcloud compute images describe-from-family IMAGE_FAMILY \
        --project deeplearning-platform-release

出力で name フィールドを探します。新しいインスタンスを作成するときに、このフィールドのイメージ名を使用します。

利用可能なすべてのバージョンのリスト

特定のフレームワークまたは CUDA バージョンが必要な場合は、使用可能なイメージの完全なリストを検索します。使用可能な Deep Learning VM イメージをすべて表示するには、次の gcloud CLI コマンドを実行します。

gcloud compute images list \
        --project deeplearning-platform-release \
        --no-standard-images

イメージ ファミリーの名前は FRAMEWORK-VERSION-CUDA_VERSION(-experimental) の形式になります。FRAMEWORK はターゲット ライブラリ、VERSION はフレームワーク バージョン、CUDA_VERSION は CUDA スタックのバージョン(存在する場合)です。

たとえば、ファミリー tf-ent-2-8-cu113 からのイメージには TensorFlow Enterprise 2.8 と CUDA 11.3 があります。

次のステップ

Cloud Marketplace またはコマンドラインを使用して、新しい Deep Learning VM インスタンスを作成する。