Os modelos da OpenAI na Vertex AI oferecem modelos totalmente gerenciados e sem servidor modelos como APIs. Para usar um modelo da OpenAI na Vertex AI, envie uma solicitação diretamente para o endpoint de API Vertex AI. Devido ao Os modelos da OpenAI usam uma API gerenciada. Não é necessário provisionar nem gerenciar a infraestrutura.
É possível transmitir as respostas para reduzir a percepção de latência do usuário final. Uma resposta transmitida usa eventos enviados pelo servidor (SSE) para transmitir a resposta de forma incremental.
Modelos da OpenAI disponíveis
Os modelos a seguir estão disponíveis na OpenAI para uso na Vertex AI. Para acessar um modelo da OpenAI, acesse o card de modelo do Model Garden.
gpt-oss 120B
O OpenAI gpt-oss 120B é um modelo de linguagem de 120 bilhões de parâmetros de código aberto lançado sob a licença Apache 2.0. Ele é adequado para casos de uso de raciocínio e chamada de função. O modelo é otimizado para implantação em hardware de consumo.
O modelo de 120 bilhões de parâmetros alcança quase a paridade com o o4-mini da OpenAI em comparativos de mercado de raciocínio principais, enquanto é executado em uma única GPU de 80 GB.
Acessar o card do modelo gpt-oss 120B
gpt-oss 20B
O OpenAI gpt-oss 20B é um modelo de linguagem de 20 bilhões de parâmetros de código aberto lançado sob a licença Apache 2.0. Ele é adequado para casos de uso de raciocínio e chamada de função. O modelo é otimizado para implantação em hardware de consumo.
O modelo de 20 bilhões oferece resultados semelhantes ao o3-mini da OpenAI em comparativos comuns e pode ser executado em dispositivos de borda com 16 GB de memória, o que o torna ideal para casos de uso no dispositivo, inferência local ou iteração rápida sem infraestrutura cara.
Acessar o card do modelo gpt-oss 20B
Antes de começar
Para usar modelos da OpenAI com a Vertex AI, faça o
etapas a seguir. A API Vertex AI (aiplatform.googleapis.com) precisa
estar ativada para usar a Vertex AI. Se você já tiver um projeto existente com
a API do Vertex AI ativada, poderá usar esse projeto em vez de
criar um novo.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. - Acesse um dos seguintes cards de modelo do Model Garden e clique em Ativar.