CPU プラットフォーム


Compute Engine で仮想マシン(VM)を作成するときに、VM のマシンシリーズとマシンタイプを指定します。各マシンシリーズは 1 つ以上の CPU プラットフォームに関連付けられています。マシンタイプで使用可能な CPU プラットフォームが複数ある場合は、VM に最小 CPU プラットフォームを選択できます。

CPU プラットフォームは複数の物理プロセッサを備えており、これらのプロセッサのそれぞれをコアと呼びます。Compute Engine で利用可能なすべてのプロセッサでは、同時マルチスレッド化(SMT)を通じて、1 つの CPU コアを複数のハードウェア マルチスレッドとして実行できます。これはインテル プロセッサではインテル ハイパー スレッディング テクノロジーとして知られています。Compute Engine では、各ハードウェア マルチスレッドは仮想 CPU(vCPU)と呼ばれます。vCPU が異なる仮想コアを占有しているとして VM に報告されると、Compute Engine はこれらの vCPU が同じ物理コアを共有しないようにします。

VM のマシンタイプでは、vCPU の数が指定され、そのマシンシリーズのコアレーシオあたりのデフォルトの vCPU を使用する物理 CPU コアの数を推定できます。

  • Tau T2D、Tau T2A、H3 マシンシリーズの場合、VM には常にコアあたり 1 つの vCPU があります。
  • 他のすべてのマシンシリーズでは、VM にはデフォルトで 1 コアあたり 2 つの vCPU があります。

必要に応じて、コアあたり 2 つの vCPU ではなく、コアあたり 1 つの vCPU を使用するように VM を設定できます。これにより、一部のワークロードにメリットがある場合があります。重要なこととして、この操作を行うと、VM のマシンタイプに正しい数の vCPU が反映されません。代わりに、料金と物理 CPU コアの数は、コアあたりのデフォルトの 2 つの vCPU と同じままで、vCPU の数は、マシンタイプで示される値の半分です。

Arm プロセッサ

Arm プロセッサの場合、Compute Engine は 1 コアあたり 1 つのスレッドを使用します。各 vCPU は、SMT のない物理コアにマッピングされます。

次の表に、Compute Engine VM で使用できる Arm プロセッサを示します。

CPU プロセッサ プロセッサ SKU サポートされているマシンシリーズとマシンタイプ 全コア持続周波数(GHz)
Ampere Altra Q64-30 3.0

x86 プロセッサ

ほとんどの x86 プロセッサでは、各 vCPU は単一のハードウェア スレッドとして実装されます。Tau T2D マシンシリーズは例外で、1 つの vCPU が 1 つの物理コアを表します。

Intel プロセッサ

インテル Xeon プロセッサでは、インテル ハイパー スレッディング テクノロジーにより、各コアで同時に実行される複数のスレッドがサポートされます。vCPU の数は、VM インスタンスの具体的なサイズと形状によって決まります。

CPU プロセッサ プロセッサ SKU サポートされているマシンシリーズとマシンタイプ 基本周波数(GHz) 全コアターボ周波数(GHz) シングルコア最大ターボ周波数(GHz)
インテル Xeon スケーラブル プロセッサ
(Sapphire Rapids)
第 4 世代
インテル® Xeon® プラチナ 8481C プロセッサ 1.9 3.0 3.3
インテル Xeon スケーラブル プロセッサ(Ice Lake)
第 3 世代
インテル® Xeon® プラチナ
8373C プロセッサ
2.6 3.4 3.5
Intel Xeon スケーラブル プロセッサ(Cascade Lake)
第 2 世代
インテル® Xeon® ゴールド 6268CL プロセッサ 2.8 3.4 3.9
インテル® Xeon® ゴールド 6253CL プロセッサ 3.1 3.8 3.9
インテル® Xeon® プラチナ 8280L プロセッサ 2.5 3.4 4.0
インテル® Xeon® プラチナ 8273CL プロセッサ 2.2 2.9 3.7
Intel Xeon スケーラブル プロセッサ(Skylake)
第 1 世代
インテル® Xeon® スケーラブル プラチナ 8173M プロセッサ 2.0 2.7 3.5
インテル Xeon E7(Broadwell E7) インテル® Xeon® E7-8880V4 プロセッサ 2.2 2.6 3.3
インテル Xeon E5 v4(Broadwell E5) インテル® Xeon® E5-2696V4 プロセッサ 2.2 2.8 3.7
インテル Xeon E5 v3(Haswell) インテル® Xeon® E5-2696V3 プロセッサ 2.3 2.8 3.8
インテル Xeon E5 v2(Ivy Bridge) インテル® Xeon® E5-2696V2 プロセッサ 2.5 3.1 3.5
インテル Xeon E5(Sandy Bridge) インテル® Xeon® E5-2689 プロセッサ 2.6 3.2 3.6

*96 個以上の vCPU を備えた N2 マシンタイプには Intel Ice Lake CPU が必要です。

AMD プロセッサ

AMD プロセッサは、SMT を使用してパフォーマンスとスケーラビリティを最適化します。ほとんどの場合、Compute Engine はコアあたり 2 つのスレッドを使用し、各 vCPU は 1 スレッドです。Tau T2D は例外で、Compute Engine がコアごとに 1 つのスレッドを使用し、各 vCPU が物理コアにマッピングされます。vCPU の数は、VM インスタンスの具体的なサイズと形状によって決まります。

CPU プロセッサ プロセッサ SKU サポートされているマシンシリーズ 基本周波数(GHz) 有効周波数(GHz) 最大ブースト周波数(GHz)
AMD EPYC Genoa
第 4 世代
AMD EPYC™ 9B14 2.6 3.3 3.7
AMD EPYC Milan
第 3 世代
AMD EPYC™ 7B13 2.45 2.8 3.5
AMD EPYC Rome
第 2 世代
AMD EPYC™ 7B12 2.25 2.7 3.3

周波数特性

上記の表では、Compute Engine で使用可能な CPU のハードウェア仕様について説明していますが、次の点に注意してください。

  • 周波数: PC の周波数(クロック速度)は、CPU が 1 秒間に実行するサイクル数を GHz(ギガヘルツ)で測定したものです。一般に、周波数が高いほどパフォーマンスが高いことを示します。ただし、CPU の設計によって命令の処理が異なるため、新しいアーキテクチャでは命令が効率的に処理され、クロック速度が高い古い CPU のほうが新しいクロック速度で処理できることがあります。

    CPU クロック サイクルとパフォーマンスの詳細については、クロックレートとシステム パフォーマンスをご覧ください。

  • 基本周波数: システムがアイドル状態または負荷が小さい場合に CPU が実行している周波数。基本周波数で実行すると、CPU では、電力消費は減少し、発熱が抑えられます。

    VM のゲスト環境では、VM の実際の動作周波数に関係なく、基本周波数が反映されています。

  • 全コアターボ周波数: ソケット内のすべてのコアが同時にアクティブである場合の、各 CPU の一般的な動作周波数。ワークロードが異なれば、システムの CPU に対する要求も異なります。Boost テクノロジーは、この違いに対応し、CPU の周波数を上げて、プロセスがワークロードの需要に適応できるようにします。

    • ゲスト環境には基本周波数しかアドバタイズされない状態でも、ほとんどの VM は全コアターボ時の周波数を取得します。
    • Arm プロセッサの周波数は常に全コアターボ周波数であるため、Ampere Altra Arm プロセッサではパフォーマンスが予測しやすくなります。
  • 最大ターボ周波数: ビデオゲームやデザイン モデリング アプリケーションなど、要求の厳しいアプリケーションによって負荷がかけられる CPU のターゲット周波数。これは、オーバークロックなしで CPU が達成する最大シングルコア周波数です。

  • プロセッサの電力管理技術: インテルのプロセッサは、複数のテクノロジーをサポートして、電力消費を最適化します。これらのテクノロジーは 2 つのカテゴリまたは状態に分類されます。

    • C-State は、CPU が選択された機能を削減または無効にしたときの状態です。
    • P-State では、CPU の電力消費を低減するために、プロセッサが動作する周波数と電圧を調整する方法が提供されます。

    特定の C2(30、60 vCPU)、C2D(56、112 vCPU)、M2(208、416 vCPU)マシンタイプでは、MWAIT 命令によりインスタンスが提供する C-State のヒントがサポートされます。

    Google Cloud VM には、お客様が P-State を制御するための機能はありません。

CPU 機能

半導体メーカーは、製造する CPU に計算、グラフィック、仮想化、メモリ管理のための高度なテクノロジーを追加します。Google Cloud では、これらの高度な機能のいくつかを Compute Engine で使用できます。

Advanced Matrix Extensions(AMX)

Intel AMX は、人工知能(AI)ワークロードと機械学習(ML)ワークロードを高速化するように設計された新しい命令セット アーキテクチャ(ISA)です。AMX では、AI と ML で最もよく使用される 2 つの行列乗算と畳み込み演算に使用できる新しい命令が導入されています。

AMX は、第 4 世代インテル Xeon プロセッサ(Sapphire Rapids というコード)でサポートされています。このプロセッサは、A3 アクセラレータ最適化 VM と C3 汎用 VM のシリーズを基盤としています。すべての C3 VM マシンタイプは、AMX 命令セットをサポートしています。

AMX では、アクセラレータがオペレーションを実行できるように、タイルと呼ばれる 2 次元のレジスタが導入されています。AMX は拡張可能なアーキテクチャを前提としています。最初に実装されるアクセラレータは、タイル マトリックス乗算ユニット(TMUL)と呼ばれます。Sapphire Rapids プロセッサの各 CPU コアには、独立した AMX TMUL ユニットがあります。

インテル AMX に関する技術的な詳細については、5.16 のインテル AMX サポートをご覧ください。 インテルでは、コードサンプル: Intel® Advanced Matrix Extensions(Intel® AMX)- Intrinsics Functions で AMX に関するチュートリアルを提供しています。

AMX を使用するための要件

インテル AMX 命令には、次のような最小ソフトウェア要件があります。

  • カスタム イメージの場合、AMX は Linux カーネル バージョン 5.16 以降でサポートされています。
  • Google Cloud では、次の公開イメージで AMX をサポートしています。
    • CentOS Stream 8 以降
    • Container-Optimized OS 109 LTS(またはそれ以降)
    • RHEL 8(最新ビルド)以降
    • Rocky Linux 8(最新ビルド)以降
    • Ubuntu 22.04 以降
    • Windows Server 2022 以降
  • Tensorflow 2.9.1 以降
  • PyTorch のインテル® 最適化用のインテル拡張機能

C3 VM を利用できるリージョンについては、使用可能なリージョンとゾーンをご覧ください。C3 マシンタイプのみが表示されるようにテーブルをフィルタします。

Confidential Computing

使用中のデータを保護するため、Confidential VM インスタンスで AMD EPYC 第 3 世代 CPU(Milan という名前のコード)を使用できます。これらは、次の証明書とメモリ暗号化技術をサポートしています。

詳細については、Confidential Computing のコンセプトをご覧ください。

次のステップ

使ってみる

Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオで Compute Engine のパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。

Compute Engine の無料トライアル