クラウド業界初、NVIDIA L4 GPU 搭載の G2 VM のご紹介
Google Cloud Japan Team
※この投稿は米国時間 2023 年 3 月 22 日に、Google Cloud blog に投稿されたものの抄訳です。
さまざまな業界の企業が、生成 AI の最新の進化を活用して、膨大なデータをインテリジェンスに変換する AI に注目しています。しかし、最新のモデルを導入するには、トレーニングやサービスに費用がかかる可能性があるため、多くの企業にとって高いハードルとなっています。AI の力を活用したい企業の参入費用を下げるには、新しいクラスのクラウド GPU が必要です。
そこでこのたび、Google Cloud の Compute Engine GPU ファミリーに新たに加わることになった G2 をご紹介します。G2 は、新たに発表された NVIDIA L4 Tensor Core GPU を搭載した業界初のクラウド VM で、生成 AI などの大規模な推論 AI ワークロードに特化して設計されています。G2 は、クラウド上の GPU で実行される AI 推論ワークロードに対し、最先端の費用対効果を実現します。NVIDIA A10G GPU から L4 GPU を搭載した G2 インスタンスに切り替えることで、企業は本番環境のインフラストラクチャにかかる費用を最大 40% 削減することができます。また、NVIDIA T4 GPU から L4 GPU に切り替えることで、パフォーマンスが 2~4 倍向上することが確認されています。汎用 GPU として、G2 インスタンスは、他のワークロードの高速化にも貢献し、HPC、グラフィック、動画のコード変換のパフォーマンスも大幅に向上させます。現在、限定公開プレビューで提供されている G2 VM は、強力かつ柔軟で、GPU を 1 個から最大 8 個まで簡単にスケールできます。
企業は現在、新たな時代に向けて、AI や HPC イニシアチブの将来を見据えた、エンドツーエンドのエンタープライズ対応のインフラストラクチャを必要としています。G2 は Vertex AI、GKE、GCE にデプロイできる予定であり、お客様はパフォーマンス要件と予算を満たすために独自のカスタム ソフトウェア スタックを自由に設計できるようになります。G2 VM 用に最適化された Vertex AI サポートにより、AI ユーザーは最新の生成 AI モデルやテクノロジーを活用できます。使いやすい UI と自動化されたワークフローによって、お客様は手動で最適化する手間をかけずに、動画、テキスト、画像、音声の最新モデルにアクセスし、調整して提供することができます。これらのサービスと G2 の能力を組み合わせることで、お客様は複雑な機械モデルの機能をビジネスに活用できるようになります。
Ada Lovelace アーキテクチャを採用した NVIDIA L4 GPU
G2 マシン ファミリーは、ML を活用するお客様が、言語モデル、画像分類、オブジェクト検出、自動音声認識、翻訳などのさまざまなアプリケーションに対応するために、本番環境のインフラストラクチャをクラウドで実行できるようにします。第 4 世代の Tensor コアを搭載した Ada Lovelace アーキテクチャで構築された NVIDIA L4 GPU は、FP32 で最大 30 TFLOPS、FP16 で最大 242 TFLOPS のパフォーマンスを提供します。既存の INT8、BFLOAT16、TF32 機能に加え、新たに追加された FP8 サポートにより、L4 は ML 推論に最適なものとなっています。
また、最新の第 3 世代 RT コアと DLSS 3.0 テクノロジーを備えた G2 インスタンスは、NVIDIA RTX 仮想ワークステーションと組み合わせると、レンダリングやリモート ワークステーションなど、グラフィックを多用するワークロードに最適です。NVIDIA L4 は、動画のエンコードとデコードで 3 倍のパフォーマンスを提供し、新しい AV1 ハードウェア エンコード機能を追加します。たとえば、G2 により、Unreal や Unity のようなゲームエンジンを最新のグラフィックス カードで実行しているゲーム業界のお客様は、リアルタイム アプリケーションを実行できます。同様に、L4 により、GPU 対応の仮想ワークステーションを必要とするメディアおよびエンターテインメント業界のお客様は、Autodesk Maya や 3D Studio Max などのアプリケーションを使って、映画、ゲーム、AR / VR 体験用の写真のようにリアルな高解像度 3D コンテンツを作成できます。
お客様の声
少数のお客様が早期に G2 をテストし、実際のアプリケーションで素晴らしい結果を確認しています。NVIDIA L4 GPU を搭載した G2 がもたらすメリットについて、その一部をご紹介します。
AppLovin
AppLovin は、市場をリードするテクノロジーで開発者とマーケティング担当者の成長を実現します。企業は AppLovin を利用して、ユーザー獲得、ユーザー維持、収益化、測定などの優れたフルスタック ソリューションによってミッション クリティカルなビジネス機能に対応しています。AppLovin でオペレーション担当バイス プレジデントを務める Omer Hasan 氏は、次のように述べています。「AppLovin では、1 日に何十億もの AI を活用した推奨事項を提供しているため、スケーラビリティと価値は当社のビジネスにとって不可欠といえます。Google Cloud の G2 により、NVIDIA L4 GPU がビジネスのスケーラビリティを大幅に向上させ、これまで以上に速く成長できるようになったと感じています。」
Wombo AI
WOMBO は、AI という魔法によって、すべての人の創造性を解き放ち、コンテンツの作成、使用、配信の方法を変革することを目指しています。
WOMBO の共同創設者で CEO の Ben-Zion Benkhin 氏は、次のように述べています。「WOMBO は、没入型のデジタル アートワークを作成するために最新の AI 技術を利用しており、ユーザーの要求により、アイデアだけで、あらゆるスタイルの高品質でリアルなアートを作成できるようにしています。NVIDIA の L4 GPU を搭載した Google Cloud の G2 インスタンスにより、独自のアートワークを作成して共有したいユーザーに、より効率的で優れた画像生成体験を提供できます。」
Descript
Descript の AI を活用した機能と直感的なインターフェースは、YouTube や TikTok のチャンネル、人気のポッドキャストに加え、マーケティング、セールス、社内トレーニングやコラボレーションに動画を使用する企業の成長を促します。同社は、ドキュメントやスライドとともに、動画がすべてのコミュニケーターのツールキットの定番となることを目指しています。Descript の AI 部門責任者である Kundan Kumar 氏は、次のように述べています。「L4 の AI 動画機能を備えた G2 のおかげで、自然言語処理と生成 AI で強化された新機能をデプロイし、優れたパフォーマンスとエネルギー効率でスタジオ品質のメディアを作成することができます。」
Workspot
Workspot は、エンタープライズ デスクトップを提供するうえで Software as a Service(SaaS)モデルが最も安全で利用しやすく、費用対効果に優れた方法であると確信しており、現在の企業のデジタル トランスフォーメーションを加速するために中枢に据えるべきであると考えています。
Workspot の最高製品責任者である Jimmy Chang 氏は、次のように述べています。「Workspot のチームは、Google Cloud および NVIDIA とのパートナーシップを引き続き発展させていくことを楽しみにしています。また、私たちのお客様は、NVIDIA の T4 GPU を活用することで、優れたパフォーマンスを発揮しています。Workspot のリモート クラウド PC ワークステーションで実行する L4 GPU 搭載の新しい G2 インスタンスは、1,280 x 711 以上の解像度で 2 倍以上のフレームレートを実現しています。」
料金と可用性
G2 インスタンスは現在、us-central1、asia-southeast1、europe-west4 のリージョンで限定公開プレビューが提供されています。限定公開プレビューへの参加、または公開プレビューが開始される際に通知を希望される場合は、こちらからリクエストを送信してください。Google Kubernetes Engine(GKE)、Vertex AI、その他の Google Cloud サービスもサポートされる予定です。G2 の一般公開と料金の情報については、年内にお知らせできる予定です。
- Cloud GPU、プロダクト マネージャー Miguel Holguin