Os modelos da OpenAI na Vertex AI oferecem modelos totalmente geridos e sem servidor como APIs. Para usar um modelo da OpenAI no Vertex AI, envie um pedido diretamente para o ponto final da API Vertex AI. Uma vez que os modelos da OpenAI usam uma API gerida, não é necessário aprovisionar nem gerir a infraestrutura.
Pode transmitir as suas respostas para reduzir a perceção de latência do utilizador final. Uma resposta em stream usa eventos enviados pelo servidor (SSE) para transmitir a resposta de forma incremental.
Modelos da OpenAI disponíveis
Os seguintes modelos estão disponíveis na OpenAI para utilização no Vertex AI. Para aceder a um modelo da OpenAI, aceda ao respetivo cartão do modelo do Model Garden.
gpt-oss 120B
O gpt-oss 120B da OpenAI é um modelo de linguagem de peso aberto de 120 mil milhões de parâmetros lançado ao abrigo da licença Apache 2.0. É adequado para exemplos de utilização de raciocínio e chamadas de funções. O modelo está otimizado para implementação em hardware de consumo.
O modelo de 120 B alcança uma paridade quase total com o o4-mini da OpenAI em benchmarks de raciocínio essenciais, enquanto é executado numa única GPU de 80 GB.
Aceda ao cartão do modelo gpt-oss 120B
gpt-oss 20B
O gpt-oss 20B da OpenAI é um modelo de linguagem de peso aberto de 20 mil milhões de parâmetros lançado sob a licença Apache 2.0. É adequado para exemplos de utilização de raciocínio e chamadas de funções. O modelo está otimizado para implementação em hardware de consumo.
O modelo 20B oferece resultados semelhantes ao o3-mini da OpenAI em referências comuns e pode ser executado em dispositivos periféricos com 16 GB de memória, o que o torna ideal para utilizações no dispositivo, inferência local ou iteração rápida sem infraestrutura dispendiosa.
Aceda ao cartão do modelo gpt-oss 20B
Antes de começar
Para usar os modelos da OpenAI com o Vertex AI, tem de realizar os seguintes passos. A API Vertex AI (aiplatform.googleapis.com) tem de estar ativada para usar a Vertex AI. Se já tiver um projeto com a API Vertex AI ativada, pode usá-lo em vez de criar um novo projeto.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. - Aceda a um dos seguintes cartões de modelos do Model Garden e, de seguida, clique em Ativar.