Modelos da OpenAI

Os modelos da OpenAI na Vertex AI oferecem modelos totalmente geridos e sem servidor como APIs. Para usar um modelo da OpenAI no Vertex AI, envie um pedido diretamente para o ponto final da API Vertex AI. Uma vez que os modelos da OpenAI usam uma API gerida, não é necessário aprovisionar nem gerir a infraestrutura.

Pode transmitir as suas respostas para reduzir a perceção de latência do utilizador final. Uma resposta em stream usa eventos enviados pelo servidor (SSE) para transmitir a resposta de forma incremental.

Modelos da OpenAI disponíveis

Os seguintes modelos estão disponíveis na OpenAI para utilização no Vertex AI. Para aceder a um modelo da OpenAI, aceda ao respetivo cartão do modelo do Model Garden.

gpt-oss 120B

O gpt-oss 120B da OpenAI é um modelo de linguagem de peso aberto de 120 mil milhões de parâmetros lançado ao abrigo da licença Apache 2.0. É adequado para exemplos de utilização de raciocínio e chamadas de funções. O modelo está otimizado para implementação em hardware de consumo.

O modelo de 120 B alcança uma paridade quase total com o o4-mini da OpenAI em benchmarks de raciocínio essenciais, enquanto é executado numa única GPU de 80 GB.

Aceda ao cartão do modelo gpt-oss 120B

gpt-oss 20B

O gpt-oss 20B da OpenAI é um modelo de linguagem de peso aberto de 20 mil milhões de parâmetros lançado sob a licença Apache 2.0. É adequado para exemplos de utilização de raciocínio e chamadas de funções. O modelo está otimizado para implementação em hardware de consumo.

O modelo 20B oferece resultados semelhantes ao o3-mini da OpenAI em referências comuns e pode ser executado em dispositivos periféricos com 16 GB de memória, o que o torna ideal para utilizações no dispositivo, inferência local ou iteração rápida sem infraestrutura dispendiosa.

Aceda ao cartão do modelo gpt-oss 20B

Antes de começar

Para usar os modelos da OpenAI com o Vertex AI, tem de realizar os seguintes passos. A API Vertex AI (aiplatform.googleapis.com) tem de estar ativada para usar a Vertex AI. Se já tiver um projeto com a API Vertex AI ativada, pode usá-lo em vez de criar um novo projeto.

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  2. Verify that billing is enabled for your Google Cloud project.

  3. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  4. Aceda a um dos seguintes cartões de modelos do Model Garden e, de seguida, clique em Ativar.