このページは Cloud Translation API によって翻訳されました。

MaaS 用の Vertex AI オープンモデル

Vertex AI は、オープンモデルのキュレーションリストをマネージドモデルとしてサポートしています。これらのオープンモデルは、Vertex AI で Model as a Service（MaaS）として使用でき、マネージド API として提供されます。マネージドオープンモデルを使用する場合、リクエストは引き続き Vertex AI エンドポイントに送信されます。マネージドオープンモデルはサーバーレスであるため、インフラストラクチャのプロビジョニングや管理は必要ありません。

マネージドオープンモデルは Model Garden で見つけることができます。Model Garden を使用してモデルをデプロイすることもできます。詳細については、Model Garden で AI モデルを確認するをご覧ください。

オープンモデルを使用する前に、オープンモデルへのユーザーアクセス権を付与する必要があります。

オープンモデル

Vertex AI Model Garden（MaaS）では次のオープンモデルがマネージド API として提供されます。

モデル名	モダリティ	説明	クイックスタート
gpt-oss 120B	言語	推論タスクで高いパフォーマンスを発揮する 120B モデル。	モデルカード
gpt-oss 20B	言語	消費者やエッジ用ハードウェア上での効率とデプロイに最適化された 20B モデル。	モデルカード
Qwen3-Next-80B の思考	言語、コード	複雑な問題解決と深い推論に特化した Qwen3-Next モデルファミリーのモデル。	モデルカード
Qwen3-Next-80B Instruct	言語、コード	特定のコマンドに従うことに特化した Qwen3-Next ファミリーのモデル。	モデルカード
Qwen3 Coder	言語、コード	高度なソフトウェア開発タスク用に開発されたオープンウェイトモデル。	モデルカード
Qwen3 235B	言語	体系的な推論と迅速な会話を切り替える「ハイブリッド思考」機能を備えたオープンウェイトモデル。	モデルカード
DeepSeek-V3.1	言語	思考モードと非思考モードの両方をサポートする DeepSeek のハイブリッドモデル。	モデルカード
DeepSeek R1（0528）	言語	DeepSeek の DeepSeek R1 モデルの最新バージョン。	モデルカード
Llama 4 Maverick 17B-128E	言語、ビジョン	コーディング、推論、画像処理の機能を備えた、最大かつ最高性能の Llama 4 モデル。Llama 4 Maverick 17B-128E は、Mixture of Experts（MoE）アーキテクチャと早期融合を使用するマルチモーダルモデルです。	モデルカード
Llama 4 Scout 17B-16E	言語、ビジョン	Llama 4 Scout 17B-16E は、そのサイズクラスで最先端の結果を提供し、複数のベンチマークで以前の Llama 世代や他のオープンモデルや独自のモデルを上回っています。Llama 4 Scout 17B-16E は、Mixture-of-Experts（MoE）アーキテクチャと早期融合を使用するマルチモーダルモデルです。	モデルカード
Llama 3.3	言語	Llama 3.3 は、テキストのみの 70B 指示用にチューニングされたモデルです。テキストのみのアプリケーションに使用すると、Llama 3.1 70B と Llama 3.2 90B と比較してパフォーマンスが向上します。また、一部のアプリケーションでは、Llama 3.3 70B のパフォーマンスが Llama 3.1 405B に近づきます。	モデルカード
Llama 3.2（プレビュー）	言語、ビジョン	チャートやグラフの分析、画像キャプションなど、画像推論をサポートできる中規模の 90B マルチモーダルモデル。	モデルカード
Llama 3.1	言語	多言語の会話のユースケース用に最適化された多言語 LLM のコレクション。一般的な業界ベンチマークでは、利用可能なオープンソースチャットモデルやクローズドチャットモデルの多くを上回るパフォーマンスを発揮します。 Llama 3.1 405B は一般提供（GA）されています。 Llama 3.1 8B と Llama 3.1 70B はプレビュー版です。	モデルカード

Vertex AI Model Garden（MaaS）では次のオープンエンベディングモデルがマネージド API として提供されます。

モデル名	説明	出力のディメンション	シーケンスの最大長	サポートされているテキスト言語	クイックスタート
multilingual-e5-small	E5 ファミリーのテキストエンベディングモデルの一部。Small バリアントには 12 個のレイヤが含まれています。	最大 384	512 トークン	サポートされている言語	モデルカード
multilingual-e5-large	E5 ファミリーのテキストエンベディングモデルの一部。Large バリアントには 24 レイヤが含まれています。	最大 1,024	512 トークン	サポートされている言語	モデルカード

オープンモデルの規制遵守

Vertex AI を使用してオープンモデルをマネージド API として使用する場合も、Vertex AI の生成 AI の認定は引き続き適用されます。モデル自体について詳しくお知りになりたい場合は、それぞれのモデルカードで詳細情報を確認するか、それぞれのモデルのパブリッシャーにお問い合わせください。

データは、Vertex AI のオープンモデル用に選択されたリージョンまたはマルチリージョン内に保存されますが、データ処理のリージョン化は異なる場合があります。オープンモデルのデータ処理に関するコミットメントの詳細なリストについては、オープンモデルのデータ所在地をご覧ください。

オープンモデルを含む Vertex AI API を使用する場合、お客様のプロンプトとモデルのレスポンスは第三者と共有されません。Google は、お客様の指示に従ってのみお客様データを処理します。詳細については、Cloud のデータ処理に関する追加条項をご覧ください。

次のステップ

オープンモデルを使用する前に、ユーザーにオープンモデルへのアクセス権を付与します。
オープンモデル API を呼び出す方法を確認する。