TPU のバージョンの選択

は、

一般的な比較

Cloud TPU v2、Cloud TPU v2 Pod(アルファ版)、Cloud TPU v3 は、モデルのトレーニングと評価を行うために同じ TensorFlow ソフトウェアを実行します。1 つの TPU バージョンで実行されるモデルは、コードの変更なしで別のバージョンで実行できます。Cloud TPU のバージョン間の主な違いは、パフォーマンスとメモリ容量です。

1 つの Cloud TPU デバイスは、8 つのコア(チップあたり 2 つのコア、デバイスあたり 4 つのチップ)で構成されています。バージョン番号に続く数字は、コア数を示します(例: v2-8)。1 つの Cloud TPU v2 Pod(アルファ版)は、256 個の TPU チップ(512 コア)を含む 64 個の TPU デバイスで構成されています。

使用する Cloud TPU のバージョンを指定する方法については、アクセラレータ タイプを指定するをご覧ください。

パフォーマンスの比較

Cloud TPU v3 ハードウェアは、コアあたりの FLOPS と HBM メモリ容量を増加させることによって、Cloud TPU v2 からの改善が行われています。モデルの高速化に影響を与える一次効果は、メモリとステップ時間です。

  • v3 ハードウェアを使用する計算依存型のモデルは、v2 を使用するモデルに比べてパフォーマンス上の大きなメリットがあります。著しくメモリに依存するモデルでは、メリットがほとんどありません。
  • トレーニング ステップで入力を待機するために Cloud TPU v2 でほとんど入力(「インフィード」)依存型だったモデルは、Cloud TPU v3 でインフィード依存型になる可能性があります。パイプライン パフォーマンス ガイドは、インフィードの問題を解決するのに役立ちます。

Cloud TPU v3 のその他のパフォーマンスへの影響:

  • 多くのモデルでは、使用できる HBM を追加することでパフォーマンスが向上し、データがメモリに収まらない場合に中間値を再計算する(再実体化)必要性が減少します。

  • Cloud TPU v3 では、深い ResNets や RetinaNet での大きなイメージなど、Cloud TPU v2 では収まらなかったバッチサイズの新しいモデルを実行できます。

アクセラレータ タイプを指定する

アクセラレータ タイプは、次の方法で指定できます。

ctpu ユーティリティ

  1. Cloud TPU プロビジョニング ユーティリティctpu)の実行時に、次のように指定します。

gcloud コマンド

  1. gcloud compute tpus create コマンドを使用して新しい Cloud TPU リソースを作成するときに、サポートされる TPU バージョンから使用するアクセラレータ タイプを指定します。次に例を示します。

    $ gcloud compute tpus create [TPU name] \
     --zone us-central1-b \
     --range '10.240.0.0' \
     --accelerator-type 'v2-8' \
     --network my-tf-network \
     --version '1.13'
    

    ここで

    • TPU name は、作成する TPU を識別するための名前です。
    • --zone は Compute Engine のコンピューティング / ゾーンです。要求されるアクセラレータ タイプが、リージョンでサポートされていることを確認してください。
    • --range は、作成した Cloud TPU リソースのアドレスを指定します。任意の値を 10.240.*.* の形式で指定できます。
    • --accelerator-type は、使用するアクセラレータのタイプとコア数です。たとえば v2-32(32 コア)になります。
    • --network は、Compute Engine VM インスタンスが使用するネットワークの名前を指定します。SSH 経由でこのネットワーク上のインスタンスに接続できる必要があります。ほとんどの場合、Google Cloud Platform プロジェクトが自動的に作成したデフォルトのネットワークを使用できます。ただし、デフォルト ネットワークがレガシー ネットワークの場合、エラーが発生します。
    • --version は、TPU で使用する TensorFlow バージョンを指定します。

Cloud Console

  1. 左側のナビゲーション メニューから、[Compute Engine] > [TPU] を選択します。
  2. TPU 画面で、[TPU ノードを作成] をクリックします。TPU の構成ページが表示されます。
  3. [TPU タイプ] で、サポートされている TPU バージョンのいずれかを選択します。
  4. [作成] ボタンをクリックします。

次のステップ

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...