A partir de 29 de abril de 2025, os modelos Gemini 1.5 Pro e Gemini 1.5 Flash não estarão disponíveis em projetos que não os usaram antes, incluindo novos projetos. Para mais detalhes, consulte Versões e ciclo de vida do modelo.

Referência da API modelo para IA generativa

A IA generativa na Vertex AI (também conhecida como genai) dá acesso à modelos grandes de IA generativa na Vertex Generative AI.

Referência do modelo de fundação de IA generativa

Nome do modelo	Descrição	Respostas em tempo real
Gemini API (`gemini-1.5-pro`, `gemini-1.0-pro` e `gemini-1.0-pro-vision`)	Gemini é uma família de modelos de IA generativa desenvolvida pelo Google DeepMind, criada para casos de uso multimodais. A API Gemini fornece acesso aos modelos Gemini Pro Vision e Gemini Pro.	✔
PaLM 2 para texto (`text-bison`)	Ajustado para seguir instruções de linguagem natural e adequado para várias tarefas de linguagem.	✔
Embeddings para texto (`textembedding-gecko`)	Retorna embeddings de modelo para entradas de texto.
PaLM 2 para chat (`chat-bison`)	Sintonizado para casos de uso de conversa com vários turnos.	✔
Codey para geração de código (`code-bison`)	Um modelo ajustado para gerar uma base de código em uma descrição de linguagem natural do código desejado. Por exemplo, ele pode gerar um teste de unidade para uma função.	✔
Codey para chat de código (`codechat-bison`)	Um modelo ajustado para conversas do chatbot que ajudam com perguntas relacionadas a programação.	✔
Codey para preenchimento de código (`code-gecko`)	Um modelo ajustado para sugerir a finalização de um programa com base no contexto no código que está escrito.
Imagen para geração de imagens (`imagegeneration`)	Este modelo oferece suporte à geração de imagens e pode criar recursos visuais de alta qualidade em segundos.
Embeddings para multimodal (`multimodalembedding`)	Esse modelo gera vetores com base na entrada fornecida, que pode incluir uma combinação de imagem e texto.
Legendas de imagens (`imagetext`)	Este modelo suporta legendas ocultas e pode gerar legendas de imagens fornecidas com base no idioma especificado.
MedLM (`medlm-medium` e `medlm-large`)	Uma família de modelos de fundação ajustados para o setor de saúde.	✔
Resposta a perguntas visual - VQA (`imagetext`)	Um modelo que oferece suporte para imagens de perguntas e respostas.

Resposta em tempo real de modelos de IA generativa

Os parâmetros são os mesmos para streaming e solicitações sem streaming para as APIs.

Para conferir exemplos de solicitações de código e respostas usando a API REST, consulte Exemplos usando a API REST de streaming.

Para conferir exemplos de código de solicitações e respostas usando o SDK da Vertex AI para Python, consulte Exemplos que usam o SDK da Vertex AI para Python para streaming.

Regiões disponíveis

Para conferir uma lista de regiões em que os modelos de fundação tem suporte da IA generativa na Vertex AI, consulte Regiões.

Referência de IA responsável

Para saber mais sobre atributos específicos de segurança e visualizar exemplos de respostas, consulte Filtros e atributos de segurança. Ao longo dessas referências, há um parâmetro citation. Para saber mais sobre citações, consulte Metadados da citação.

A seguir

A IA generativa na Vertex AI tem algumas limitações. Para saber mais, consulte as Limitações da API PaLM.
Confira um tutorial de início rápido usando o Vertex AI Studio ou a API Vertex AI.
Confira modelos pré-treinados no Model Garden.
Saiba mais sobre cotas e limites.
Saiba mais sobre Preços.

Referência da API modelo para IA generativa Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.