Modelos da OpenAI

Os modelos da OpenAI na Vertex AI oferecem modelos totalmente gerenciados e sem servidor modelos como APIs. Para usar um modelo da OpenAI na Vertex AI, envie uma solicitação diretamente para o endpoint de API Vertex AI. Devido ao Os modelos da OpenAI usam uma API gerenciada. Não é necessário provisionar nem gerenciar a infraestrutura.

É possível transmitir as respostas para reduzir a percepção de latência do usuário final. Uma resposta transmitida usa eventos enviados pelo servidor (SSE) para transmitir a resposta de forma incremental.

Modelos da OpenAI disponíveis

Os modelos a seguir estão disponíveis na OpenAI para uso na Vertex AI. Para acessar um modelo da OpenAI, acesse o card de modelo do Model Garden.

gpt-oss 120B

O OpenAI gpt-oss 120B é um modelo de linguagem de 120 bilhões de parâmetros de código aberto lançado sob a licença Apache 2.0. Ele é adequado para casos de uso de raciocínio e chamada de função. O modelo é otimizado para implantação em hardware de consumo.

O modelo de 120 bilhões de parâmetros alcança quase a paridade com o o4-mini da OpenAI em comparativos de mercado de raciocínio principais, enquanto é executado em uma única GPU de 80 GB.

Acessar o card do modelo gpt-oss 120B

gpt-oss 20B

O OpenAI gpt-oss 20B é um modelo de linguagem de 20 bilhões de parâmetros de código aberto lançado sob a licença Apache 2.0. Ele é adequado para casos de uso de raciocínio e chamada de função. O modelo é otimizado para implantação em hardware de consumo.

O modelo de 20 bilhões oferece resultados semelhantes ao o3-mini da OpenAI em comparativos comuns e pode ser executado em dispositivos de borda com 16 GB de memória, o que o torna ideal para casos de uso no dispositivo, inferência local ou iteração rápida sem infraestrutura cara.

Acessar o card do modelo gpt-oss 20B

Antes de começar

Para usar modelos da OpenAI com a Vertex AI, faça o etapas a seguir. A API Vertex AI (aiplatform.googleapis.com) precisa estar ativada para usar a Vertex AI. Se você já tiver um projeto existente com a API do Vertex AI ativada, poderá usar esse projeto em vez de criar um novo.

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  2. Verify that billing is enabled for your Google Cloud project.

  3. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  4. Acesse um dos seguintes cards de modelo do Model Garden e clique em Ativar.