OpenAI-Modelle

OpenAI-Modelle in Vertex AI bieten vollständig verwaltete und serverlose Modelle als APIs. Wenn Sie ein OpenAI-Modell für Vertex AI verwenden möchten, senden Sie eine Anfrage direkt an den API-Endpunkt von Vertex AI. Da OpenAI-Modelle eine verwaltete API verwenden, muss keine Infrastruktur bereitgestellt oder verwaltet werden.

Sie können Ihre Antworten streamen, um die vom Endnutzer wahrgenommene Latenz zu reduzieren. Eine gestreamte Antwort verwendet vom Server gesendete Ereignisse (SSE, Server-Sent Events), um die Antwort schrittweise zu streamen.

Verfügbare OpenAI-Modelle

Die folgenden Modelle sind von OpenAI zur Verwendung in Vertex AI verfügbar. Rufen Sie die zugehörige Model Garden-Modellkarte auf, um auf ein OpenAI-Modell zuzugreifen.

gpt-oss 120B

OpenAI gpt-oss 120B ist ein Sprachmodell mit 120 Milliarden Parametern, das unter der Apache-Lizenz 2.0 veröffentlicht wurde. Es eignet sich gut für Anwendungsfälle mit Reasoning und Funktionsaufrufen. Das Modell ist für die Bereitstellung auf Consumer-Hardware optimiert.

Das 120B-Modell erreicht bei wichtigen Benchmarks für das logische Denken eine ähnliche Leistung wie OpenAI o4-mini und wird auf einer einzelnen 80‑GB-GPU ausgeführt.

Zur Modellkarte für gpt-oss 120B

gpt-oss 20B

OpenAI gpt-oss 20B ist ein Sprachmodell mit 20 Milliarden Parametern, das unter der Apache-Lizenz 2.0 veröffentlicht wurde. Es eignet sich gut für Anwendungsfälle mit Reasoning und Funktionsaufrufen. Das Modell ist für die Bereitstellung auf Consumer-Hardware optimiert.

Das 20B-Modell liefert bei gängigen Benchmarks ähnliche Ergebnisse wie OpenAI o3-mini und kann auf Edge-Geräten mit 16 GB Arbeitsspeicher ausgeführt werden. Es eignet sich daher ideal für Anwendungsfälle auf dem Gerät, lokale Inferenz oder schnelle Iterationen ohne kostspielige Infrastruktur.

Zur Modellkarte für gpt-oss 20B

Hinweise

Führen Sie die folgenden Schritte aus, um OpenAI-Modelle mit Vertex AI zu verwenden. Die Vertex AI API (aiplatform.googleapis.com) muss aktiviert sein, um Vertex AI verwenden zu können. Wenn Sie bereits ein Projekt mit aktivierter Vertex AI API haben, können Sie dieses Projekt verwenden, anstatt ein neues Projekt zu erstellen.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Enable the API

  8. Rufen Sie eine der folgenden Model Garden-Modellkarten auf und klicken Sie auf Aktivieren.