Google Cloud の Vertex AI 上の Llama モデル
Vertex AI に Llama モデル(テクノロジー企業 Meta のモデル)をデプロイして、プロダクション レディな AI エージェントとアプリケーションを構築します。さまざまなモデルサイズと機能が用意されているため、軽量で効率的なモデルからマルチモーダル バージョンまで、特定のユースケースに最適な Llama モデルを選択できます。これらのモデルにはサーバーレス API としてアクセスでき、ネイティブのマルチモーダル機能と多言語機能を活用して、テキストとビジュアルのインテリジェンスを効率的に高めることができます。
Llama のオープンソースの大規模言語モデル(LLM)は、イノベーションに必要な透明性と柔軟性を開発者に提供し、簡単なデプロイ、費用対効果、スケーラブルなパフォーマンスを実現します。Vertex AI で Llama を使用して構築すると、最先端のオープンモデルの利点と、Google Cloud の包括的な AI プラットフォームのエンタープライズ グレードのセキュリティ、拡張性、管理ツールを組み合わせることができます。
スケーラビリティを重視して構築された、誰でも自由にアクセス可能な LLM
170 億のアクティブ パラメータを持つ Llama 4 Maverick は、128 人のエキスパートによってトレーニングされたマルチモーダル モデルで、インテリジェンス、コスト、速度の最適なバランスを実現します。Llama 4 Maverick は画像とテキストを理解できるため、言語の壁を乗り越える高度な AI アプリケーションを開発を可能にします。Llama 4 モデルは、コーディング、推論、画像処理の機能を備え、ニューラル ネットワークの Mixture of Experts(MoE)アーキテクチャを採用しています。
主なユースケースには、言語翻訳、複数ドキュメントの要約、コンテンツ作成などがあります。また、個人向け支援の提供、教育と学習のサポート、研究の補助、膨大なコードベースの推論なども対応可能です。
Llama 4 Scout: クラス最高のネイティブ マルチモーダル モデル
Llama 4 Scout は非常に複雑なタスクでも優れたパフォーマンスを発揮する強力なマルチモーダル AI モデルです。自由形式のプロンプトや未知のシナリオを、きわめて流暢にナビゲートできます。
主なユースケースには、テキストと画像でチャットボットを構築するなどのマルチモーダル アシスタント アプリ、コード生成タスクのデバッグ、長いコンテキストのアプリケーション、マルチエージェント ワークフロー、データドリブンな意思決定などがあります。
Llama 3.3 70B: オープンソース AI モデル
Llama 3.3 70B は、Vertex AI プラットフォームを通じてデプロイ可能なテキストのみのモデルで、幅広い言語ベースのタスクを処理する際のパフォーマンスと効率性が高度に最適化されています。これにより、開発者は費用を削減できる軽量なアプリケーションを利用できます。
主なユースケースには、カスタマー サービスでのデプロイ、コードの生成とデバッグ、トレーニング データなどがあります。
Llama 3.2 90B: 軽量のマルチモーダル モデル
Llama 3.2 90B は、高解像度画像を理解できるマルチモーダルで効率的かつ柔軟なモデルです。
主なユースケースとしては、画像を使用して商品を検索するビジュアル検索機能(e コマース、医療スキャン、複雑なドキュメントのデータ分析、コンテンツ生成など)があり、コンテキストを認識できます。
スケーラビリティを重視して構築された、誰でも自由にアクセス可能な LLM
170 億のアクティブ パラメータを持つ Llama 4 Maverick は、128 人のエキスパートによってトレーニングされたマルチモーダル モデルで、インテリジェンス、コスト、速度の最適なバランスを実現します。Llama 4 Maverick は画像とテキストを理解できるため、言語の壁を乗り越える高度な AI アプリケーションを開発を可能にします。Llama 4 モデルは、コーディング、推論、画像処理の機能を備え、ニューラル ネットワークの Mixture of Experts(MoE)アーキテクチャを採用しています。
主なユースケースには、言語翻訳、複数ドキュメントの要約、コンテンツ作成などがあります。また、個人向け支援の提供、教育と学習のサポート、研究の補助、膨大なコードベースの推論なども対応可能です。
Llama 4 Scout: クラス最高のネイティブ マルチモーダル モデル
Llama 4 Scout は非常に複雑なタスクでも優れたパフォーマンスを発揮する強力なマルチモーダル AI モデルです。自由形式のプロンプトや未知のシナリオを、きわめて流暢にナビゲートできます。
主なユースケースには、テキストと画像でチャットボットを構築するなどのマルチモーダル アシスタント アプリ、コード生成タスクのデバッグ、長いコンテキストのアプリケーション、マルチエージェント ワークフロー、データドリブンな意思決定などがあります。
Llama 3.3 70B: オープンソース AI モデル
Llama 3.3 70B は、Vertex AI プラットフォームを通じてデプロイ可能なテキストのみのモデルで、幅広い言語ベースのタスクを処理する際のパフォーマンスと効率性が高度に最適化されています。これにより、開発者は費用を削減できる軽量なアプリケーションを利用できます。
主なユースケースには、カスタマー サービスでのデプロイ、コードの生成とデバッグ、トレーニング データなどがあります。
Llama 3.2 90B: 軽量のマルチモーダル モデル
Llama 3.2 90B は、高解像度画像を理解できるマルチモーダルで効率的かつ柔軟なモデルです。
主なユースケースとしては、画像を使用して商品を検索するビジュアル検索機能(e コマース、医療スキャン、複雑なドキュメントのデータ分析、コンテンツ生成など)があり、コンテキストを認識できます。
Vertex AI は、Llama 対応アプリケーションを迅速かつ大規模に評価、デプロイ、管理する統合環境を提供します。
AI ワークロード向けに設計されたフルマネージド インフラストラクチャと、専用エンドポイントや従量課金制など柔軟な料金モデルから選択できるオプションにより、Llama モデルのデプロイとスケーリングが簡素化されます。
Vertex AI のツールと Llama モデルの高度な機能を使用してエージェントを開発します。
エンタープライズ レベルの基準に準拠するようカスタマイズされた、Google Cloud の組み込みのセキュリティ、プライバシー、データ ガバナンス、コンプライアンスの機能を活用します。
BigQuery のようなツールを活用することで、エンタープライズ データを Llama の高度な機能と統合し、重要な分析情報を引き出して情報に基づいた意思決定を促します。
Llama モデルは、複雑な推論、画像解析、コード生成、多言語処理において高度な能力を発揮します。これらのモデルは、複雑な指示に従い、ニュアンスに富んだ包括的な出力を生成できます。