AI & 機械学習

Google Cloud Vertex AI で Meta Llama 3 が使用可能に

2024年5月2日

Google Cloud Japan Team

※この投稿は米国時間 2024 年 4 月 19 日に、Google Cloud blog に投稿されたものの抄訳です。

このたび、Meta Llama 3 が Vertex AI Model Garden で利用可能になりました。これまでのバージョンと同様に、Llama 3 は研究および多くの商用アプリケーションに対して無償でライセンス付与されます。Llama 3 には、8B と 70B の 2 つのサイズがあり、事前トレーニング済みかつ指示用にファインチューニング済みのモデルとして使用できます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image_4_Apqkg6R.max-2200x2200.png

Vertex AI で Meta Llama 3 をチューニング、抽出、評価する

Llama 3 のような一般的な LLM を独自のデータでチューニングすることで、特定のビジネスやユースケースに合わせたパワフルなモデルに変換できます。デベロッパーは Vertex AI から Llama 3 にアクセスすると、Colab Enterprise を通じて利用可能なさまざまな最先端のチューニングオプションを使用できるようになります。これには、教師ありチューニング（LoRA）、人間からのフィードバックを使用する強化学習（RLHF）、抽出用に事前構成されたノートブックが含まれます。

また、Vertex AI により、デベロッパーは、事前構成されたノートブックを Model Garden で直接使用するか、Vertex AI のペアワイズモデルベースの評価ツールである Auto SxS を使用して、チューニングされた Llama モデルを簡単に評価できます。この使いやすいインターフェースにより、デベロッパーは運用の詳細に時間をかけずに、ユースケースに合わせた Llama 3 の最適化とデプロイをすぐに開始できます。

最先端のハードウェアとソフトウェアで効率的なチューニングとサービングを実施

Vertex AI は、TPU と GPU の両方を備えたアクセラレータにより、優れた柔軟性と選択肢を提供します。先週開催された Next ‘24 では、Vertex AI のオンライン予測用に Cloud TPU v5e が一般提供されるようになったことを発表しました。つまり、デベロッパーは、Google の最先端の最新世代 TPU から、チューニング済み Llama 3 モデルをサービングできます。また、PyTorch ユーザーは、Optimum-TPU パッケージを使用して、TPU 上で Llama 3 をトレーニングしてサービングできるようになりました。

そして、Model Registry などの堅牢な機能を備えた Vertex AI により、モデルバリエーションとエンドポイントを容易に管理、モニタリングし、ニーズに合わせて適切にスケールできます。

企業のモデルビルダー向けの活発でオープンなエコシステム

130 を超えるファーストパーティモデル、サードパーティモデル、オープンモデルを含む Vertex AI Model Garden は、企業のデベロッパーがモデルを 1 か所で発見、チューニング、管理できるようにまとめられたサービスです。Llama 3 のような最新の最先端モデルだけでなく、これらのモデル上で実際の生成 AI エージェントを構築するための最適なインフラストラクチャとツールをデベロッパーの皆様に提供できることを大変嬉しく思います。Llama 3 の使用を開始するにはこちらをクリックしてください。また、5 月 14 日に開催される I/O に参加して、Vertex Model Garden に関するエキサイティングな最新情報を入手してください。

-Vertex AI、プロダクト管理担当ディレクター Nenshad Bardoliwalla

投稿先