選択肢の拡大と管理の強化: Vertex AI を使用して VPC に独自のモデルを自己デプロイ

Prateek Gera
Group Product Manager, Google Cloud
Anusheel Pareek
Senior Product Manager, Vertex AI
※この投稿は米国時間 2025 年 10 月 7 日に、Google Cloud blog に投稿されたものの抄訳です。
最高の AI アプリケーションを構築するには、直面するタスクに最も適した強力で専門的なモデルを自由に選択できることと、それらすべてを処理できるプラットフォームの両方が必要です。この柔軟性は、Vertex AI プラットフォームの中心となっています。本日のリリースでは、比類のない選択肢と制御をお客様に提供するという Google のコミットメントを大きく前進させます。
AI21 Labs、CAMB.AI、CSM、Mistral AI、Qodo、Virtue AI などの業界パートナーの主要なプロプライエタリ モデルを、増え続ける選択肢の中から安全にデプロイできるようになりました。Contextual AI と WRITER のモデルも近日中に利用可能になる予定です。これらのモデル(クローズドソース モデルや商用ライセンスが制限されているモデルを含む)を、自社の Virtual Private Cloud(VPC)に直接デプロイできます。
これらのモデルはすべて、Google の汎用性の高い Gemini ファミリー、主要なオープンモデル、サードパーティ モデルなど、200 以上の基盤モデルへの中心的なゲートウェイである Vertex AI Model Garden にあります。厳選された単一のカタログから、自社のアプリケーションに最適なモデルを見つけてテストし、デプロイできます。
VPC で独自のモデルを自己デプロイ可能に
データとインフラストラクチャを最大限に制御する必要がある組織では、主要な AI モデル ビルダーからの強力な自社専用モデルを VPC 内に直接自己デプロイできるようになりました。この新機能により、Google Cloud Marketplace を介して商用ライセンスを取得し、自社の環境内で安全にモデルをデプロイできます。そのすべてが、Google Cloud のセキュリティとコンプライアンスに関する高い基準を満たしています。Google Cloud で独自のモデルを自己デプロイすると、次のようなメリットがあります。
- VPC-SC ポリシーを完全に遵守して VPC 内にモデルをデプロイすることで、独自のビジネスデータが環境外に漏洩しないことを最大限に保証します。信頼できるプラットフォームでサードパーティ モデルを評価して本番環境にデプロイできます。
- 利用可能なさまざまなマシンタイプから選択することで、パフォーマンスまたはコストを最適化できます。ワークロードの需要に合わせてレプリカ数を手動でスケールアップまたはスケールダウンするか、自動スケーリング ポリシーを設定してハンズフリーで管理できます。ターゲット市場のデータ コンプライアンスを達成するために、選択した具体的な Google Cloud リージョンにデプロイしたり、顧客への低レイテンシ配信のためにロケーションを選択したりできます。
- 業界をリードするプロバイダの厳選された独自モデルを、1 か所で発見、ライセンス取得、デプロイできます。このプログラムは、AI21 Labs、CAMB.AI、Contextual AI、CSM、Mistral AI、Qodo、Virtue AI、WRITER の 8 社のパートナーのモデルから開始されます。これらのモデルは、幅広いユースケースと専門分野をカバーしています。これはほんの始まりにすぎず、Google は最新の生成 AI モデルでカタログを拡大し続けます。
- モデルの発見から本番環境への移行を簡単に実現Model Garden コンソールから直接数回クリックするだけで、商用ライセンスを取得してモデルをデプロイできます。Google のフルマネージド AI 推論サービスが、基盤となるインフラストラクチャを処理するため、お客様はアプリケーションの構築に専念できます。
- シンプルな従量課金制で、使用した分だけお支払いいただけます。デプロイをニーズに合わせてスケーリングすることで費用を管理でき、人工的な制限や割り当て上限に対処する必要はありません。既存の Google Cloud の確約利用割引(CUD)または予約を適用することで、費用をさらに最適化できます。
発売モデルのご紹介
VPC で自己デプロイできる新しいモデルを今すぐお試しください。


- AI21 Labs - Jamba Large 1.6: 優れたモデル品質を高速で実現し、企業内でのプライベートなデプロイに最適です。
- CAMB.AI - MARS7: オプションの音声クローン作成と細かな感情制御機能を備えた、超リアルな多言語テキスト読み上げ(TTS)出力を特徴とする、本番環境で使用できる音声アプリケーションをリリースできます。
- (近日提供予定)Contextual AI - Reranker: 検索拡張生成(RAG)システムの関連性と品質を大幅に向上させるように設計されています。
- CSM - Cube: 2D 画像を驚くほどの精度と効率で詳細な 3D モデルに変換する生成 AI モデル。
- Mistral AI - Codestral(25.01): コード生成タスクに明確に照準を合わせて設計されており、開発者は共有された指示を通じてコードの生成と操作が可能になります。
- Qodo - Embed-1: 大規模なコード エンベディング モデルのスイート。効率的なコードとテキストの検索を可能にすることで、RAG の検索精度を高めます。
- Virtue AI - VirtueGuard: 企業向け AI ガードレール モデル。生成 AI システムの多言語サポートにより、リアルタイムのコンテンツ セキュリティ、ポリシーの適用、規制へのコンプライアンスを実現します。
- (近日提供予定)WRITER - Palmyra X4: 128K トークンのコンテキスト ウィンドウと、高度な推論、ツール呼び出し、LLM 委任、組み込みの RAG、コード生成、構造化された出力、マルチモダリティ、多言語などの一連の機能を組み合わせたエンタープライズ グレードの LLM
導入方法
これらの新しいモデルは、次の 3 つの簡単なステップでデプロイできます。
- Vertex AI Model Garden にアクセスします。左側のナビゲーション タブの [モデル コレクション] で、[パートナーのモデルをセルフデプロイする] を選択します。
- デプロイするパートナーのモデルを選択します。選択したモデルを使用するには、[有効にする] をクリックしてライセンスを購入します。
- ライセンスは数秒で有効になります。Model Garden のワンクリック デプロイ ワークフローを使用して、[デプロイ] をクリックするだけで、VPC 内のモデル エンドポイントを設定してデプロイできます。
Google は、最もオープンで柔軟なエンタープライズ向け AI プラットフォームを提供することに取り組んでいます。選択肢がさらに広がり、自社の環境をきめ細かく制御してセキュリティを確保できるため、責任を持ってイノベーションを進めるために必要なものがすべて揃っています。Model Garden で新しいモデルを今すぐ確認して、今すぐ構築を始めましょう。
-Google Cloud、グループ プロダクト マネージャー、Prateek Gera
-Vertex AI、シニア プロダクト マネージャー、Anusheel Pareek