OpenAI モデル

Vertex AI の OpenAI モデルは、API としてフルマネージド モデルとサーバーレス モデルを提供します。Vertex AI で OpenAI モデルを使用するには、Vertex AI API エンドポイントにリクエストを直接送信します。OpenAI モデルはマネージド API を使用します。インフラストラクチャをプロビジョニングしたり、管理する必要はありません。

レスポンスをストリーミングして、エンドユーザーのレイテンシを軽減できます。ストリーミング レスポンスでは、サーバー送信イベント(SSE)を使用してレスポンスを段階的にストリーミングします。

利用可能な OpenAI モデル

Vertex AI で使用できる OpenAI のモデルは次のとおりです。OpenAI モデルにアクセスするには、Model Garden のモデルカードに移動します。

gpt-oss 120B

OpenAI gpt-oss 120B は、Apache 2.0 ライセンスでリリースされた 120B のオープンウェイト言語モデルです。推論と関数呼び出しのユースケースに適しています。このモデルは、一般消費者向けハードウェアでのデプロイ用に最適化されています。

120B モデルは、単一の 80 GB GPU で実行されながら、コア推論ベンチマークで OpenAI o4-mini とほぼ同等の結果を達成しています。

gpt-oss 120B モデルカードに移動

gpt-oss 20B

OpenAI gpt-oss 20B は、Apache 2.0 ライセンスでリリースされた 20B のオープン ウェイト言語モデルです。推論と関数呼び出しのユースケースに適しています。このモデルは、一般消費者向けハードウェアでのデプロイ用に最適化されています。

20B モデルは、一般的なベンチマークで OpenAI o3-mini と同様の結果が得られ、16 GB のメモリを搭載したエッジ デバイスで実行できるため、オンデバイスのユースケース、ローカル推論、高価なインフラストラクチャを必要としない迅速なイテレーションに最適です。

gpt-oss 20B モデルカードに移動

始める前に

Vertex AI で OpenAI モデルを使用するには、次の操作を行う必要があります。Vertex AI を使用するには、Vertex AI API(aiplatform.googleapis.com)を有効にする必要があります。既存のプロジェクトで Vertex AI API が有効になっている場合は、新しいプロジェクトを作成する代わりに、そのプロジェクトを使用できます。

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Enable the API

  8. 次のいずれかの Model Garden モデルカードに移動し、[有効にする] をクリックします。