Vertex AI の OpenAI モデルは、API としてフルマネージド モデルとサーバーレス モデルを提供します。Vertex AI で OpenAI モデルを使用するには、Vertex AI API エンドポイントにリクエストを直接送信します。OpenAI モデルはマネージド API を使用します。インフラストラクチャをプロビジョニングしたり、管理したりする必要はありません。
レスポンスをストリーミングして、エンドユーザーのレイテンシを軽減できます。回答をストリーミングする際には、サーバー送信イベント(SSE)を使用して回答を段階的にストリーミングします。
利用可能な OpenAI モデル
Vertex AI で使用できる OpenAI のモデルは次のとおりです。OpenAI モデルにアクセスするには、Model Garden のモデルカードに移動します。
gpt-oss 120B
OpenAI gpt-oss 120B は、Apache 2.0 ライセンスでリリースされた 120B のオープンウェイト言語モデルです。推論と関数呼び出しのユースケースに適しています。このモデルは、一般消費者向けハードウェアでのデプロイ用に最適化されています。
120B モデルは、単一の 80 GB GPU で実行しながら、コア推論ベンチマークで OpenAI o4-mini とほぼ同等の性能を実現しています。
gpt-oss 20B
OpenAI gpt-oss 20B は、Apache 2.0 ライセンスでリリースされた 20B のオープンウェイト言語モデルです。推論と関数呼び出しのユースケースに適しています。このモデルは、一般消費者向けハードウェアでのデプロイ用に最適化されています。
20B モデルは、一般的なベンチマークで OpenAI の o3-mini と同等の結果を出しつつ、16GB のメモリを備えたエッジデバイス上でも動作します。そのため、デバイス上で直接実行するユースケース、ローカルでの推論、高額なインフラを使わずすばやくイテレーションする用途に最適です。
始める前に
Vertex AI で OpenAI モデルを使用するには、次の操作を行う必要があります。Vertex AI を使用するには、Vertex AI API(aiplatform.googleapis.com)を有効にする必要があります。既存のプロジェクトで Vertex AI API が有効になっている場合は、新しいプロジェクトを作成する代わりに、そのプロジェクトを使用できます。
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. - 次のいずれかの Model Garden モデルカードに移動し、[有効にする] をクリックします。