Referência da API modelo para IA generativa

A IA generativa na Vertex AI (também conhecida como genai) oferece acesso aos grandes modelos de IA generativa do Google na Vertex AI.

Referência do modelo de fundação de IA generativa

Nome do modelo Descrição Respostas em tempo real
Gemini API (gemini-1.5-pro, gemini-1.0-pro e gemini-1.0-pro-vision)

Gemini é uma família de modelos de IA generativa desenvolvida pelo Google DeepMind, criada para casos de uso multimodais. A API Gemini fornece acesso aos modelos Gemini Pro Vision e Gemini Pro.

PaLM 2 para texto (text-bison)

Ajustado para seguir instruções de linguagem natural e adequado para várias tarefas de linguagem.

Embeddings para texto (textembedding-gecko)

Retorna embeddings de modelo para entradas de texto.

PaLM 2 para chat (chat-bison)

Sintonizado para casos de uso de conversa com vários turnos.

Codey para geração de código (code-bison)

Um modelo ajustado para gerar uma base de código em uma descrição de linguagem natural do código desejado. Por exemplo, ele pode gerar um teste de unidade para uma função.

Codey para chat de código (codechat-bison)

Um modelo ajustado para conversas do chatbot que ajudam com perguntas relacionadas a programação.

Codey para preenchimento de código (code-gecko)

Um modelo ajustado para sugerir a finalização de um programa com base no contexto no código que está escrito.

Imagen para geração de imagens (imagegeneration)

Este modelo oferece suporte à geração de imagens e pode criar recursos visuais de alta qualidade em segundos.

Embeddings para multimodal (multimodalembedding)

Esse modelo gera vetores com base na entrada fornecida, que pode incluir uma combinação de imagem e texto.

Legendas de imagens (imagetext)

Este modelo suporta legendas ocultas e pode gerar legendas de imagens fornecidas com base no idioma especificado.

Resposta a perguntas visual - VQA (imagetext)

Um modelo que oferece suporte para imagens de perguntas e respostas.

Resposta em tempo real de modelos de IA generativa

Os parâmetros são os mesmos para streaming e solicitações sem streaming para as APIs.

Para conferir exemplos de solicitações de código e respostas usando a API REST, consulte Exemplos usando a API REST de streaming.

Para conferir exemplos de código de solicitações e respostas usando o SDK da Vertex AI para Python, consulte Exemplos que usam o SDK da Vertex AI para Python para streaming.

Regiões disponíveis

Para conferir uma lista de regiões em que os modelos de fundação tem suporte da IA generativa na Vertex AI, consulte Regiões.

Referência de IA responsável

Para saber mais sobre atributos específicos de segurança e visualizar exemplos de respostas, consulte Filtros e atributos de segurança. Ao longo dessas referências, há um parâmetro citation. Para saber mais sobre citações, consulte Metadados da citação.

A seguir