コンピューティング

C3 VM の一般提供を開始: 第 4 世代インテル Xeon を搭載し、業界屈指のコストパフォーマンスを実現

2023年5月30日

Google Cloud Japan Team

※この投稿は米国時間 2023 年 5 月 23 日に、Google Cloud blog に投稿されたものの抄訳です。

本日は、C3 マシンシリーズの一般提供の開始についてお知らせします。これにより、Google Compute Engine（GCE）と Google Kubernetes Engine（GKE）のお客様が、第 4 世代インテル Xeon スケーラブルプロセッサ（コードネームは Sapphire Rapids）が備えるエンタープライズグレードのパフォーマンスと信頼性を獲得できます。しかも、コストパフォーマンスは業界屈指です。

C3 マシンシリーズは、コンピューティング、ネットワーキング、ストレージの最新のイノベーションを 1 つのプラットフォームに統合した汎用 VM です。このため、C3 では幅広いワークロードのコストパフォーマンスを改善できます。Google のベンチマークでは、前世代の C2 と比較して、NGINX などのウェブサービスアプリケーションでは最大 88%、Postgres や MySQL などのリレーショナルデータベースでは最大 40%、Redis などのインメモリデータベースでは最大 39%、Hadoop などのデータ分析では最大 18% のコストパフォーマンス向上が見られました。他のクラウドプロバイダが提供する競合ソリューションと比較したベンチマークでは、C3 が平均して最大 25% 優れたコストパフォーマンスを記録しました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/20230530ja01.max-1200x1200.png

最新の第 4 世代インテル Xeon と DDR5 をベースに構築された C3 VM のシェイプは、基盤となる NUMA アーキテクチャ向けに最適化されており、安定したパフォーマンスを実現するとともに最大 176 個の vCPU までスケールアップできます。C3 VM が使用する DDR5 メモリは、DDR4 と比べて 50% 高速です。現時点では、C3 は highcpu（vCPU あたり 2 GB）のメモリ構成で提供されます。standard（vCPU あたり 4 GB）および highmem（vCPU あたり 8 GB）の構成とローカル SSD（最大 12 TB）については、今後数か月以内の提供を予定しています。

新しい C3 マシンファミリーは、Google の専用インフラストラクチャソリューションを次のように飛躍的に進化させます。

最新の Infrastructure Processing Unit（IPU）を使用した、ネットワーキング負荷の軽減
Hyperdisk による高性能ブロックストレージの実現
インテル AMX による ML トレーニングと推論の高速化

以降で、C3 ファミリーが実現するイノベーションについて詳しく見ていきます。

IPU による最新世代のネットワーキング

Google Cloud Next ‘22 で、C3 と今後の新しいマシンシリーズを支える Google のカスタム Infrastructure Processing Unit（IPU）を発表しました。Google の IPU には、オフロードされた Andromeda 仮想ネットワークスタックと、ネットワーキングのパフォーマンス、分離、セキュリティをより高いレベルで実現するプログラム可能なパケット処理エンジンが搭載されています。ネットワーキングのオフロードにより CPU が解放されるため、C3 はより大きな VM シェイプで、ネットワーキング I/O からお客様のワークロードやアプリケーションへの干渉を減らせるようになります。また、C3 VM は最大 200 Gbps の低レイテンシネットワーキングも提供できます。これは Google の前世代の VM と比べて 2 倍の速度で、密結合の分散型コンピューティング、ハイパフォーマンスコンピューティング（HPC）、ネットワーク使用率の高いワークロードに理想的です。

Hyperdisk による最新世代のストレージ

Hyperdisk は Google Cloud の最新世代のブロックストレージサービスです。Hyperdisk は Google の IPU テクノロジーを利用してストレージ処理を仮想マシンから切り離すことで、パフォーマンス、柔軟性、効率性を大幅に向上させます。Hyperdisk を使用することで、ストレージのパフォーマンスと容量を個別かつ動的にスケールし、データ分析やデータベースといった多くのデータを使用するワークロードのストレージ I/O のニーズを効率的に満たすことができます。ストレージのパフォーマンスを向上させるためだけに、価格の高い大型のコンピューティングインスタンスを選ぶ必要はもうありません。C3 の Hyperdisk ブロックストレージは、前世代の C2 VM と比べて最大 4 倍のストレージスループットと 10 倍の IOPS を実現します。

AI / ML のためのインテル AMX

第 4 世代インテル Xeon プロセッサにはインテル Advanced Matrix Extensions（AMX）が内蔵されています。AMX は、CPU でのディープラーニングのトレーニングと推論のパフォーマンスを大幅に改善する組み込みのアクセラレータです。たとえば、AMX を有効にした場合、bfloat16 形式を使用した BERT（自然言語処理のための ML フレームワーク）の行列乗算のスループットが、AVX512 を使用して同じ演算を実行した場合と比べて最大 12 倍に向上しました。INT8 形式を使用した同様の規模の行列のスループットは、AVX512 と比べて最大 2 倍に向上しました。AMX 命令は最新の PyTorch フレームワークと TensorFlow フレームワークに統合されているため、お客様はこの組み込みアクセラレータの機能を簡単に利用できます。

「現代の企業は、現在と未来のコンピューティング需要を満たすために、パフォーマンス、生産性、効率性を考慮して独自の観点から策定された、これまで以上に総合的な AI 戦略を必要としています。Google Cloud とインテルは 2016 年から連携してイノベーションの実現に取り組んでおり、業界全体でニーズが拡大している「AI の大衆化」への対応に焦点を当て続けてきました。第 4 世代インテル Xeon スケーラブルプロセッサで当社が提供する組み込みの機能により、コードを変更することなく、AI の貴重なワットあたりのパフォーマンスを強化し、ワークロードを高速化できます。」– Intel Corporation、Data Center, AI, Cloud & Enterprise Strategy（DACES）担当 VP 兼 GM Kavitha Prasad 氏

メンテナンスの利便性の向上

C3 はシームレスなメンテナンスの基準を引き上げ続けます。Google は C3 でさまざまなテクノロジーを活用して、お客様のワークロードを中断することなくソフトウェアとファームウェアをアップデートする一方で、インフラストラクチャを最新の安全な状態に維持しています。これらの機能を備える C3 は、非常に条件の厳しいビジネスクリティカルなワークロードの実行に理想的なソリューションです。

お客様の声

https://storage.googleapis.com/gweb-cloudblog-publish/images/paloalto_NfovbTY.max-2000x2000.jpg

「Palo Alto Networks では、お客様のネットワークトラフィックでインラインの脅威検出を行うためのディープラーニングモデルを開発し、デプロイしています。当社の AI ワークロードにとって推論のレイテンシは極めて重要です。インテルの Sapphire Rapids と AI 向けの新しい AMX 命令セットを搭載した C3 VM を導入することで、インラインモデルの一部のパフォーマンスが、前世代の N2 Ice Lake VM と比べて 2 倍になりました。」 - Palo Alto Networks、シニア上級エンジニア Suiqiang Deng 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/gunpowder_djutsXr.max-2000x2000.jpg

「新しい C3 マシンシリーズを導入したことでアーティストたちのパフォーマンスが 30% 向上し、その創造的なビジョンをより簡単かつ迅速に現実のものとできるようになりました。当社のすべてのお客様の 3D と 2D のレンダリングが大幅に改善されており、C3 のパフォーマンスレベルは VFX 業界のリーダーたちにとって不可欠となっています。」- Gunpowder Tech LLC、創業者 Tom Taylor 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/cadence.max-2000x2000.jpg

「Cadence で実施した最初のテストで、C3 と C2 で実行した Clarity のワークロードを比較し、コアあたりのシミュレーション実行時間が 15% 短縮したことが明らかになりました。Google Cloud Platform での実行時間がこのように大幅に短縮されることで、共通のお客様のエンジニアリングの生産性が向上するでしょう。」 - Cadence、研究開発担当バイスプレジデント Ben Gu 氏

C3 を今すぐ使ってみる

C3 VM は現在、us-central1（アイオワ）、us-east1（サウスカロライナ）、us-east4（北バージニア）、europe-west1（ベルギー）、europe-west4（オランダ）、asia-southeast1（シンガポール）の各リージョンでご利用いただけます。C3 インスタンスの使用を開始するには、Cloud コンソールで新しい VM または GKE ノードプールを作成するときに、汎用マシンファミリーとして C3 を選択します。利用可能なリージョンの最新情報については、リージョンとゾーンのページをご覧になるか、Google Cloud の営業担当者にお問い合わせください。

- Google Compute Engine プロダクト管理担当ディレクター Salil Suri
- Google Compute Engine プロダクトマネージャー Foster Casterline

投稿先