柔軟性を高めて構築: Vertex AI Model Garden に新しいオープンモデルが登場
Ivan Nardini
Developer Relations Engineer
Abhishek Bhagwat
ML Engineer, Applied AI
【Next Tokyo ’25】
【Next Tokyo】120 以上のセッションをアーカイブ公開中。話題の Gemini、生成 AI、AI エージェントなどの Google Cloud のアップデートや顧客事例をチェックしましょう。
視聴はこちら※この投稿は米国時間 2025 年 7 月 17 日に、Google Cloud blog に投稿されたものの抄訳です。
Google は、革新的な AI アプリケーションを構築するために必要な柔軟性と選択肢を企業に提供する継続的な取り組みに基づいて、Vertex AI Model Garden で Model-as-a-Service(MaaS)サービスとして利用できるオープンモデルのカタログを拡大しています。今年初めに Llama 4 モデルが追加されたのに続き、DeepSeek R1 が Model-as-a-Service(MaaS)サービスを通じてすべてのお客様にご利用いただけるようになりました。この拡大は、オープンな AI エコシステムに対する Google の取り組みを強化するものであり、お客様がさまざまな強力なモデルにアクセスして、特定のユースケースに最適なモデルを見つけられるようにします。
昨今の大規模モデルのデプロイと管理には、運用面と財務面で課題があります。たとえば、DeepSeek R1 のような大規模モデルでは、推論を実行するために 8 つの高度な H200 GPU のインフラストラクチャが必要になる場合があります。多くの組織にとって、このようなリソースの調達と管理は、アプリケーションのコア開発から注意をそらす可能性のある大きな取り組みです。
Vertex AI の MaaS サービスは、この複雑さを解消するように設計されています。これらのモデルをフルマネージドのサーバーレス API として提供することで、お客様は基盤となるインフラストラクチャをプロビジョニングまたは管理する必要がなくなります。これにより、チームは GPU 管理の複雑さを回避し、構築とイノベーションに直接集中できます。Vertex AI では、組み込みのデータ プライバシーとコンプライアンスを備えた安全なエンタープライズ グレードのプラットフォームを利用できます。すべて、ニーズに合わせてスケーリングする柔軟な従量課金制の料金モデルの下で提供されます。
ご利用にあたって
以下に、MaaS で利用できるオープンモデルを使用する手順を説明します。ここでは、例として Vertex AI 上の DeepSeek R1 を使用しました。モデルは UI と API の両方からアクセスできます。
1. DeepSeek API サービスを有効にする
Vertex AI Model Garden から DeepSeek API サービスに移動し、タイトルをクリックしてモデルカードを開きます。次に、DeepSeek API サービスへのアクセスを有効にします。有効化後、権限が反映されるまでに数分かかる場合があります。


Vertex AI Model Garden の DeepSeek API サービス
2. UI を使用してモデルを試す
Vertex AI Model Garden から DeepSeek API サービスに移動し、タイルをクリックしてモデルカードを開きます。サイドバーの UI を使用してサービスをテストできます。


サービスをテストするための UI サイドバーを備えた DeepSeek API サービス
3. Vertex AI API を使用してモデルを試す
DeepSeek R1 をアプリケーションに統合するには、REST API または OpenAI Python API クライアント ライブラリを使用できます。注: データのセキュリティを確保するため、DeepSeek MaaS エンドポイントにはインターネットへのアウトバウンド アクセスがありません。
REST API を介して予測を取得する
API リクエストは、gcloud 認証情報が構成された Cloud Shell またはマシンから curl を使用して行うことができます。プレースホルダを次のコードに置き換えてください。
OpenAI Python API クライアント ライブラリを使用して予測を取得する
OpenAI Python API ライブラリをインストールします。
クライアントを初期化し、エンドポイント URL を構成します。API キーとして使用するアクセス トークンを取得する方法については、こちらをご覧ください。ローカルマシンから実行する場合は、GOOGLE_APPLICATION_CREDENTIALS でリクエストが認証されます。
クライアント経由で補完リクエストを行う:
次のステップ
Vertex AI Model Garden は、最先端の基盤モデルを必要とするアプリケーションを構築する新たな可能性を切り開きます。次に進めるステップをいくつかご紹介します。
-
DeepSeek R1 MaaS のドキュメント ガイドはこちら、Llama MaaS のドキュメント ガイドはこちらで確認する
-
両方のモデルの料金をこちらで確認する
-
Model Garden を探索: マネージド サービスとして利用できるその他のモデルを確認する
-
概念実証を構築: 小規模なプロジェクトから始めて、モデルの機能を理解する
-
コミュニティに参加: Google Cloud AI コミュニティで経験を共有し、他のユーザーから学ぶ
-デベロッパー リレーションズ エンジニア、Ivan Nardini
-ML エンジニア、Applied AI、Abhishek Bhagwat