Google Cloud のワークロードに最適化されたインフラストラクチャ最新情報
Google Cloud Japan Team
※この投稿は米国時間 2023 年 8 月 30 日に、Google Cloud blog に投稿されたものの抄訳です。
カスタマイズした 3 層アプリなどの従来の企業ワークロードから、SAP などのビジネス クリティカルなワークロード、ハイ パフォーマンス コンピューティング(HPC)にいたるまで、ほとんどのワークロードで性能と信頼性への要求が飛躍的に高まっています。ここに生成 AI が加わり、クラウド インフラストラクチャのパフォーマンス要件はめまいのするような数に上ります。ハードウェアの進化に頼っているだけでは不十分です。特に今はムーアの法則の効果が失速しているため、なおさらです。現在の急増するコンピューティングの要求に応えるには、インフラストラクチャに対して新しい、意識的な方法でアプローチする必要があります。
Google ではこの新しい状況に向けて、目的に特化したインフラストラクチャ、規範的なアーキテクチャ、オープンなエコシステムを組み合わせて、ワークロードに最適化されたインフラストラクチャを準備してきました。その結果、コンピューティング負荷が特に高いワークロードでも、より優れたパフォーマンス、信頼性、セキュリティが実現できました。
今回の Google Cloud Next ではすでに、Google のワークロードに最適化されたインフラストラクチャのポートフォリオに対する追加や拡張をいくつか発表しました。これらにより、お客様のワークロードが Google Cloud 上で最大限の能力を発揮できるようになります。
第 3 世代の Compute Engine インスタンスと Google の次世代 Hyperdisk ブロック ストレージにより、Titanium システムによる幅広いワークロード処理のパフォーマンスが大幅に向上します。
新しい H3 VM と Parallelstore マネージド並列ファイル サービスは HPC ワークロード向けに設計されています。C2 と比較して、インスタンスあたりのパフォーマンスを 3 倍まで、コスト パフォーマンスを 2 倍まで引き上げられます。
VM の稼働率の SLA を追加および改善し、メモリ最適化 VM の稼働率の SLA を 99.95% としました。メモリ最適化 VM は通常、SAP HANA などのミッション クリティカルなデータベースに使用されます。このサービスレベルは主要な 3 つのクラウド ハイパースケーラーの中で最高です。
SAP 向けの新しい Workload Manager 機能は、SAP ワークロードの保護に役立つほか、ガイド付きデプロイを可能にします。
VMware Engine の新しい形態により、より幅広い vSphere ベースのワークロードがサポートされます。
新しい将来の予約機能により、お客様の容量確保が改善できます。
第 3 世代 C インスタンス ファミリー
Google の第 3 世代仮想マシン インスタンスは、パフォーマンスを大きく向上できます。Google のオフロード システムである Titanium を搭載し、ここには Google のカスタム Infrastructure Processing Unit も含まれています。新しいインスタンスはすべて Google Kubernetes Engine(GKE)を最初からサポートしており、一貫性のあるパフォーマンスのために最適化されています。C インスタンス ファミリーは、ウェブ、アプリ、広告の各サーバーやデータベース、キャッシュ、ゲームサーバー、分析、メディア ストリーミング、ネットワーク アプライアンスなどのワークロードに最適な選択となり得ます。
パフォーマンスの向上した C3 VM
今年、第 4 世代の Intel Xeon Processors 搭載の C3 VM が一般提供となりました。これまでの Intel C2 VM と比べて、C3 ではコスト パフォーマンスが平均で 35% 向上しました(パフォーマンスのベンチマーク詳細は、C3 一般提供についてのブログ投稿をご覧ください)。C3 では新しい Intel AMX アクセラレータを、ディープ ラーニング CPU 推論の低レイテンシ分散型ワークロードに利用できます。この結果、前世代の AVX-512 と比較して、推論のパフォーマンスを 12 倍まで向上できました。さらに、Hyperdisk Extreme をサポートする C3 VM が現在プレビュー中です。これは主要なクラウド ハイパースケーラーで最速となる 500K IOPS に対応しています。
「C3 は N2 VM と比べて最大 2.5 倍のストレージ スループットを実現します。また、同じワークロードに対する CPU 負荷を最大で 40% も低減できます。これだけのパフォーマンスがありますから、当社のお客様はより大規模で高スループットのデータベースをスケールアップでき、より少ない、コスト効率の高いリソースで、現在と同じ高パフォーマンスのワークロードを実行できます。C3 のパフォーマンスの信頼性は、当社のお客様の特にビジネス クリティカルなワークロードにとって重要です。」- Silk、チーフ R&D オフィサー Adik Sokolovski 氏
第 4 世代 AMD EPYC™ Processor をベースにした C3D VM
Google では、C3D VM のプレビュー版を 9 月に発表する予定です。C3D は利用できるインスタンスのサイズが Google の汎用ポートフォリオ中で最も大きく、vCPU は最大 360、DDR5 メモリは最大 2.8 TB です。N2D(AMD を搭載した前世代の Compute Engine VM)と比較すると、C3D のパフォーマンスは平均して 45% 向上していました。これは測定した業界標準のベンチマーク、ウェブサーバー(Nginx)、リレーショナル データベース(MySQL)、インメモリ データベース(Redis)、データ分析(Spark SQL)、開発ワークフロー(コードのコンパイル)の全体での平均です。
「C3D をテストしたところ、N2D と比較して、当社の広告サーバーでの同じリクエスト量に対する CPU 使用率が 44% 減少しました。API ワークロードの処理効率が向上することで、広告処理のレイテンシを低くできます。これはリアルタイム ビッダーの業界ではとても重要です。このようにパフォーマンスが改善されたことで、全体的にコストを削減できました。実行するノードがより効率的になり、ノード数を減らせたためです。」- Verve Group、テクノロジー オペレーション担当バイスプレジデント Ken Snider 氏
AmpereOne プロセッサを搭載した C3A
お客様がいっそうコストとパフォーマンスの最適化を重視するようになるにつれ、Arm はそのシングルスレッド パフォーマンスが評価され存在感を増してきました。Google は、AmpereOne プロセッサを搭載した新しい Arm ベースの C3A(これ自体も 9 月にプレビュー版発表予定)のプレビュー版を 9 月に発表できる予定です。この新しい Arm ベースの VM は、Google の同等品となる現行の x86 ベースの VM よりも、コスト パフォーマンスが最大 40% 優れています*。
C3A インスタンスは、1~80 個の vCPU を備えた事前定義されたマシンを提供します。DDR5 メモリ、ローカル SSD、最大 100 Gbps のネットワークも備えており、幅広い ISV からサポートされます。
また、C3A インスタンスはすでに多数の Google Cloud サービスと統合されています。この中には GKE や Dataflow、Cloud Batch、Dataproc も含まれているため、Google Cloud でアプリケーションを構築しているデベロッパーは、C3A VM をすでに使用しているサービスで使うことができます。
「T2A を使用すると、より低いコストでパフォーマンスが 20% 向上し、線形のスケーリングも向上しました。C3A のテストでコスト パフォーマンスがさらに上がることを期待しています。」- Dailymotion、DevOps アーキテクト Cyril Corbon 氏
包括的な HPC ソリューション
C ファミリーに加えて、Google は最近新しい H3 VM についても発表しました。ハイ パフォーマンス コンピューティングに特化した設計で、密結合性や高度なネットワーキング機能を犠牲にすることなく、完全なコア パフォーマンスを提供できます。
H3 VM の目立った特徴の一つは、最大 200 Gbps の低レイテンシ ネットワーキングを提供できることです。これはコンピューティング負荷の高いタスクで驚くほど高いパフォーマンスを発揮する、最新の第 4 世代 Intel Xeon プラットフォームのおかげです。H3 VM は、Google のオフロード システムの Titanium からも恩恵を受けています。
H3 は前世代の C2 インスタンスと比較して、ノードあたりのパフォーマンスを 3 倍まで向上でき、ジョブ当たりで 2 倍もコストを低減できます。また、マルチノード ワークロードのためにスケーラビリティも強化されています。
HPC ワークロードへの現在の対応としては、Google の最近の発表で Parallelstore のプレビュー版をお知らせしました。これは Google の HPC ワークロード向けフルマネージド並列ファイル システムで、Intel DAOS を基盤にしています。
VM 稼働率 SLA の追加と改善
Google は、提供しているプラットフォームの信頼性に責任を持っています。今日を開始日として、Google は新しい、また改善されたシングル インスタンス VM の稼働率の SLA を発表します。今後 Google は、提供しているメモリ最適化 VM の稼働率の SLA を 99.95% とします。これは主要なクラウド プロバイダ 3 社の中でも最高の数字です。その他のすべての VM ファミリーに対しては、稼働率の SLA を 99.5% から 99.9% に引き上げました。ストレージのタイプに条件がなければ、これもハイパースケーラーの中でも最高です。
Hyperdisk で可能になる突出したパフォーマンスと節減
昨年 Google は Hyperdisk を発表しました。これは Hyperdisk Extreme をはじめとする次世代ブロック ストレージです。そして今回、C3 VM が Hyperdisk Extreme 対応となったことを発表します。C3 VM と Hyperdisk Extreme を組み合わせることで、インスタンスあたり 500K IOPS で処理できるようになります。これは 3 大クラウド ハイパースケーラーの中でも最速の IOPS です。Hyperdisk Extreme は要求の厳しい、扱うデータ量の多いワークロード(たとえば SAP HANA など)に理想的です。
また、SSD ベースの Hyperdisk Balanced も今日新たにプレビュー版のリリースとなります。前世代の Persistent Disk SSD と比較して 2 倍までパフォーマンスが向上し、一般的なワークロードの場合、Hyperdisk Balanced は AWS よりも(ボリューム当たりの IOPS で)10 倍も優れたパフォーマンスを発揮し、幅広い汎用ワークロードに対応できます。
また、最近 Hyperdisk Throughput が一般提供となりました。スケールアウト データ分析のためにコスト効率が高く使いやすいブロック ストレージを提供するもので、前世代の Persistent Disk Standard と比べて 7 倍までパフォーマンスが向上します。
最後に、ハイパースケーラーの中で初登場の Hyperdisk Storage Pools のプレビュー版を発表します。これは集約プール内で容量とパフォーマンスをプロビジョニングして、その後 Hyperdisk のボリュームをそのプールからシン プロビジョニングできるようにします。圧縮や重複除去など組み込み式のデータ削減と組み合わせることで、Hyperdisk Storage Pools は、主要なハイパースケーラーのデータベース ワークロードと比較して、ストレージの総所有コスト(TCO)を最大で 40% も低減*できます。
SAP ワークロードの信頼性とセキュリティの向上
SAP ワークロードをより簡単に、高い信頼性で Google Cloud で実行できるようにするために、C3 が SAP 認証を受けたことを発表します。ハイパースケーラー間でも初となる、SAP 認証を受けた Intel 第 4 世代 CPU の VM ファミリーです。
また、メモリ最適化された VM の新しい稼働率 SLA を 99.95% としたことも、これらの VM で実行することの多い SAP ワークロードに直接的なメリットをもたらします。
さらに、SAP ワークロードの保護とデプロイ向けに、Workload Manager の新機能もプレビュー版でリリースしました。このリリースには、HANA のセキュリティに関するベスト プラクティスのチェックに役立つ新しいセキュリティ ルールや、SAP デプロイの構成で細かい作業を減らせる、新しいガイド付きのコンソール内デプロイ自動化も含まれています。また、SAP アプリケーションのセキュリティをベスト プラクティスに照らして検証する場合にも役立ちます。
VMware Engine でより多くのワークロードに対応するための新オプション
Google Cloud VMware Engine は、VMware ワークロードにとって最適な場所をクラウド内で提供しています。Google Cloud ネットワーキングと Google Cloud コンソール内に緊密にインテグレーションされており、お客様は基盤となる vSphere プラットフォームの管理を Google に任せながら、自社の VMware ワークロードを Google Cloud で実行できます。
さらに 10 月までに、2 TB RAM の新しいノードと、64~128 個の vCPU および最大 50 TB のストレージのオプションがプレビューとなる予定です。これらの新しい形態によって、より多くのワークロードのタイプを Google Cloud で実行できるようになります。
同じく 10 月までに、VMware Engine が新たに 3 つのストレージ オプションのサポートを始めます。NetApp Volumes、Filestore、Storage-only(VSAN)ノードです。これらの新しいストレージ オプションによって、ワークロードのクラウドへの移行がより簡単になり、オンプレミスで使用しているストレージの機能を失うこともありません。
将来の予約のプレビュー版
将来の予約は Compute Engine の新しい機能で、将来の日付でコンピューティング容量を予約できるというものです。大規模な小売イベントなど、リソースのスケールアップが必要なイベントが予定されている場合に役立ちます。将来の予約を使って事前に要求を伝えておくことで、必要な容量が必要なときにあるという、求めている安心感が得られます。
ワークロードに最適化されたインフラストラクチャのメリット
ご紹介した新しいプロダクトと機能によって、さらに多くのワークロードを Google Cloud で最適に実行するための能力を直接、増強できます。Google の VM ファミリーの詳細を確認して、Google Cloud でのワークロード実行を始めましょう。
SPTL 202 What’s next for architects and IT professionals(アーキテクトと IT プロフェッショナルの次のステップ)
ARC 216 Compute instances optimized to boost your workloads(ワークロードの促進に最適化されたコンピューティング インスタンス)
* 2023 年 8 月の時点、正規価格、50~150 TiB、IOPS のピークは 25K~75K、圧縮率 25%
- コンピューティング プロダクト マネージメント担当シニアディレクター Nirav Mehta