Los modelos de OpenAI en Vertex AI ofrecen modelos totalmente gestionados y sin servidor como APIs. Para usar un modelo de OpenAI en Vertex AI, envía una solicitud directamente al endpoint de la API de Vertex AI. Como los modelos de OpenAI usan una API gestionada, no es necesario aprovisionar ni gestionar ninguna infraestructura.
Puedes transmitir tus respuestas para reducir la latencia que perciben los usuarios finales. Una respuesta en streaming usa eventos enviados por el servidor (SSE) para enviar la respuesta de forma incremental.
Modelos de OpenAI disponibles
OpenAI ofrece los siguientes modelos para usarlos en Vertex AI. Para acceder a un modelo de OpenAI, ve a su tarjeta de modelo de Model Garden.
gpt-oss 120B
OpenAI gpt-oss 120B es un modelo de lenguaje de 120.000 millones de parámetros de software libre publicado bajo la licencia Apache 2.0. Es adecuada para casos prácticos de razonamiento y llamadas a funciones. El modelo está optimizado para implementarse en hardware de consumo.
El modelo de 120.000 millones consigue una paridad casi total con o4-mini de OpenAI en las pruebas de razonamiento básicas, y todo ello con una sola GPU de 80 GB.
Ir a la tarjeta del modelo gpt-oss 120B
gpt-oss 20B
OpenAI gpt-oss 20B es un modelo de lenguaje de 20.000 millones de parámetros de código abierto publicado bajo la licencia Apache 2.0. Es adecuada para casos prácticos de razonamiento y llamadas a funciones. El modelo está optimizado para implementarse en hardware de consumo.
El modelo de 20.000 millones de parámetros ofrece resultados similares a los de o3-mini de OpenAI en las comparativas habituales y se puede ejecutar en dispositivos periféricos con 16 GB de memoria, lo que lo convierte en la opción ideal para casos prácticos en el dispositivo, inferencias locales o iteraciones rápidas sin necesidad de una infraestructura costosa.
Ir a la tarjeta del modelo gpt-oss 20B
Antes de empezar
Para usar modelos de OpenAI con Vertex AI, debes seguir estos pasos. La API de Vertex AI
(aiplatform.googleapis.com) debe estar habilitada para usar
Vertex AI. Si ya tienes un proyecto con la API Vertex AI habilitada, puedes usarlo en lugar de crear uno nuevo.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. - Ve a una de las siguientes tarjetas de modelo de Model Garden y haz clic en Habilitar.