Google Cloud Platform

Compute Engine と Cloud Machine Learning で GPU が利用可能に

Google Cloud Platform(GCP)のパフォーマンスは、期待されていた NVIDIA Tesla K80 GPU の登場(パブリック ベータ)で加速します。NVIDIA GPU ベースの VM を gcloud コマンドを使って立ち上げられるのは現在、us-east1、asia-east1、europe-west1 の 3 つの GCP リージョンです。Cloud Console からの GPU VM の作成も直ぐにサポートする予定です。

ディープ ラーニングに大量のコンピューティング パワーが必要なら、最大 8 個の GPU(4 つの K80 ボード)を Google Compute Engine のカスタム VM に取り付けられます。GPU は、ビデオや画像のトランスコーディング、地震解析、分子モデリング、ゲノミクス、金融工学、シミュレーション、ハイパフォーマンス データ分析、計算化学、流体力学、ビジュアライゼーションなど、さまざまなタイプの計算、分析処理を高速化します。

ASLNOg4FAFe37_Lk2T8Aql70w5Nd-FzWgeQDd9UZU047s-TCM0h6fkaaaRKjkxEkR3MG3EWKbOAUCcs2N7menpjUOoeYNHRPSGJQZGFB1duGX7DYEghFUQgDZZguskae0Zp2LZEk9sno.PNG
NVIDIA K80 GPU アクセラレータ ボード

これまで、このコンピューティング パワーを手に入れるためには、たとえば自社のデータセンターに GPU クラスタを構築する必要がありましたが、GCP では VM に GPU を追加するだけです。Google Compute Engine の GPU は VM と直接繋がり(パススルー)ベアメタルの最大のパフォーマンスを発揮します。K80 に搭載されている NVIDIA GPU は、1 GPU あたり 12 GB の GDDR5 メモリと 2,496 基のストリーム プロセッサを搭載しています。最適なパフォーマンスを持つインスタンスを構成できるように、1、2、4、8 基の中から必要な数の NVIDIA GPU を繋げられます。

qN7Ks7BvFCZABy_5zlPpK2ZRAJcmh8MaRdP8RrR7HXZU0fD8lSmqSOOXNKI_BQtPhBYwLhAbsyznOcrlNrj01NXIc2TWIije_V3o-j-7-xB4u7wO7PtGgn_lafaaEKiZLeiI-891h49o.GIF
Google Cloud はカスタム VM に最大 8 GPU の接続をサポート。アプリケーションのパフォーマンスを最適化できます。

GPU を搭載したインスタンスは、TensorFlow、Theano、Torch、MXNet、Caffe といった機械学習、深層学習 フレームワークのサポートに加えて、GPU アクセラレーションを使うアプリケーションの構築や実行に NVIDIA の CUDA をサポートしています。

料金

GCP の他のサービスと同様に GPU も低価格に設定されています。課金は分単位(最低 10 分)。US で VM に接続した K80 GPU 1 基の 1 時間辺りの料金は 0.700 ドル、アジアとヨーロッパでは同じ条件で 0.770 ドルです。そして同様に、支払いは使った分だけです。深層学習や機械学習のトレーニングを高速に行うための大規模 GPU クラスタを、これで設備投資なく使えるようになります。

Jj9CGqSavGI_Uwh6J-6adLvxoghEkJQCGPCY0kOHOgceMcazSItNrHNMR9IbPm6x4O9rOI1z2T1kQ_hAQRPAcTuT13PNEK778p55lBjYqbulpb2J_mI1uwA9NVLxhvB0RW6B6pWP9shw.PNG

機械学習を加速

新しい Google Cloud の GPU は、Google Cloud Machine Learning(Cloud ML)にも統合され、TensorFlow フレームワークを使う大規模な機械学習モデルのトレーニングにかかる時間を大幅に削減しています。1 台のマシンで大量の画像のデータセットを使い、画像のクラシファイアをトレーニングするために数日かけるよりも、Cloud ML を使い複数の GPU ワーカーで分散してトレーニングすることで、モデルの開発サイクルを飛躍的に短縮し、短期間のイテレーションを可能にします。

Cloud ML は、Google Cloud DataflowGoogle BigQueryGoogle Cloud StorageGoogle Cloud Datalab と連動し、トレーニングや予測を進めるワークフローを構成できるフルマネージド サービスです。

最初は小規模に小数のデータセットを使い、ローカルで TensorFlow モデルをトレーニングします。それから全てのデータセットを対象に、Google Cloud GPU のスケールとパフォーマンスを活用した大規模な Cloud ML のトレーニング ジョブを開始します。Cloud ML を使い始めるにはクイックスタート ガイドを、モデルをトレーニングするために GPU を使うにはこのドキュメントを見てください。

次のステップ

Google Cloud Next '17 に参加登録し、Cloud ML ブートキャンプに申し込み、クラウドの GPU を使いパフォーマンスを加速させましょう。すぐにでもコマンドラインから gcloud で VM を立ち上げ、TensorFlow を加速させた機械学習で実験を始められます。詳しいドキュメントはウェブサイトに掲載してあります。

* この投稿は米国時間 2 月 21 日、Product Manager である John Barrus によって投稿されたもの(投稿はこちら)の抄訳です。

- By John Barrus, Product Manager