AI & 機械学習

Meta の Llama 3.1 が Google Cloud で利用可能に

2024年7月29日

Warren Barkley

Senior Director, Product Management, Google Cloud

※この投稿は米国時間 2024 年 7 月 24 日に、Google Cloud blog に投稿されたものの抄訳です。

本日は、Meta のこれまでで最もパワフルで汎用性に優れた Llama 3.1 モデルシリーズが、新しい 405B モデルも含めて Vertex AI Model Garden に追加されたことをお知らせいたします。今回の追加は、お客様が最もニーズに合ったソリューションを構築できるよう、オープンで柔軟な AI エコシステムを提供するという Google Cloud の継続的な取り組みの一環です。

Vertex AI には、Google 製モデル、オープンソースモデル、そしてサードパーティ製モデルの厳選されたコレクションが用意されています。その多くは、Llama の新しいモデルも含め、フルマネージドの Model as a Service（MaaS）ソリューションとして提供可能です。MaaS では、お客様の要件に合う基盤モデルを選択したら、API 経由で容易にアクセスし、強力な開発ツールでカスタマイズし、Google Cloud のフルマネージドインフラストラクチャにデプロイできます。請求は一括で行い、インフラストラクチャ管理の手間もかかりません。

Meta の Llama 3.1 は、オープンウェイトモデルにパラダイムシフトをもたらすもので、このクラスでは比類のないパフォーマンスと汎用性を実現可能です。今回のリリースは、多様な用途向けにカスタマイズされたモデルシリーズを特徴とします。

Llama 3.1 405B: 一般公開されている基盤モデルとして現時点で最大のもので、オープンモデルにおける柔軟性、管理性、革新性の新たな基準を打ち立てています。このモデルはさまざまな新しい可能性を切り開き、合成データの生成や複雑な推論タスクの実行ができるほか、最低限のファインチューニングで直接的推論シナリオに難なく対応できます。
Llama 3.1 8B と 70B: この Llama 3 モデルの新バージョンは、言語のニュアンスの理解、文脈の把握、複雑なタスクの実行（翻訳や会話の生成など）に長けています。

新しい 405B モデルには、プレビュー版の MaaS としてこちらからアクセスできます。セットアップやインフラストラクチャ管理の手間はかかりません。一般提供は数週間後に開始予定です。8B と 70B の各モデルも、数週間程度で MaaS として提供開始する予定です。3 つのモデルはいずれもこのたび Vertex AI Model Garden でセルフサービスで利用可能になりましたので、適切なインフラストラクチャを柔軟に選択できます。

これらのモデルは、特定のニーズに対応できるよう事前トレーニングと指示チューニングが完了したバージョンとして提供されます。トークン 128,000 個の拡張コンテキストが含まれ、旧世代よりも長く複雑なテキストのより深い読解が可能になっています。Llama 3.1 の各モデルは 8 言語にわたる多言語サポートも提供し、そのリーチと応用の可能性をさらに広げています。

Google Cloud で Llama 3.1 を使用する

Google Cloud の Vertex AI は、Llama 3.1 のような基盤モデルの試験運用、カスタマイズ、デプロイ、モニタリングに適した包括的な AI プラットフォームです。Vertex AI Model Garden では、厳選された 150 以上のエンタープライズ向けモデルがすでに利用可能です。ここに Llama 3.1 が加わることで選択の幅が広がり、柔軟性が高まります。お客様はニーズと予算に最も適したモデルを選び、急速に発展するイノベーションに対応できるようになります。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Metas_Llama_3.1.max-900x900.png

Vertex AI における Llama 3.1 のモデルカード

Vertex AI で Llama 3.1 を使用することで、以下のことが可能です。

自信を持って試験運用: 直感的に使える環境で、シンプルな API 呼び出しや包括的な比較評価を通じて Llama 3.1 の機能を試せます。複雑なデプロイプロセスを心配する必要はありません。
ニーズに合わせて Llama 3.1 をカスタマイズ: お客様のデータでモデルをファインチューニングし、固有のニーズに合った独自のソリューションを構築できます。Vertex AI Model Garden でセルフサービスで 8B モデルや 70B モデルにアクセスする場合は、すぐにファインチューニングを開始できます。405B モデルをファインチューニングする機能は、数週間程度で利用可能になる予定です。
AI を正しい情報にグラウンディング: Vertex AI に用意されている複数のグラウンディングと RAG のオプションを使用して、AI の出力の確実性、関連性、信頼性を確保できます。たとえば、モデルを企業システムに接続して Vertex AI Search で企業情報を検索し、Llama 3.1 を使用して生成を行うことなどが可能です。
インテリジェントなエージェントを作成: LangChain on Vertex AI を含む Vertex AI の包括的なツールセットを使用して、Llama 3.1 を活用したエージェントを作成、オーケストレートできます。Genkit の Vertex AI プラグインを使用すれば、Llama 3.1 を AI のエクスペリエンスに統合できます。
オーバーヘッドなしでデプロイ: 柔軟な自動スケーリングと従量課金制の料金により、405B モデルでさえもデプロイとスケールの複雑さが解消されます。そしてもちろん、AI ワークロードに特化した世界最高水準のインフラストラクチャを活用できます。
ガードレール内で Llama 3.1 を使用: Meta の Llama Guard だけでなく、Google Cloud に組み込まれたセキュリティ、プライバシー、コンプライアンスの対策により、自信を持ってデプロイできます。

Google Cloud で Llama 3.1 を使ってみる

AI モデルの新たなイノベーションが起こるたびに、エンタープライズ向け AI エコシステムの多様化が進みます。Google Cloud と Meta のパートナーシップは、両社がオープンでアクセスしやすい AI エコシステムを基盤に世界最高水準のイノベーションを提供できるよう尽力していることを示しています。Google Cloud は今後も Meta や他のパートナーと緊密に連携し、お客様に最先端の AI 機能を提供していきます。

Llama 3.1 を利用するには、Model Garden にアクセスしてください。Llama 3.1 の詳細については、Meta からの発表をご覧ください。