Versões e ciclo de vida do modelo de geração de respostas

A Vertex AI Search oferece várias versões de modelo para você escolher ao gerar respostas. Você pode escolher as versões do modelo ao usar resumos de pesquisa e respostas e seguimentos.

Modelos disponíveis

A Vertex AI Search usa dois tipos de modelos para casos de uso de perguntas e respostas:

  • Modelos de LLM da Vertex AI que foram testados em tarefas de perguntas e respostas
  • Modelos da Vertex AI para Pesquisa baseados em modelos LLM da Vertex AI e treinados para responder a perguntas e tarefas de resposta

Os modelos da Vertex AI para Pesquisa têm a mesma data de desativação dos modelos de LLM da Vertex AI. O modelo LLM de base fica disponível por seis meses após a data de lançamento da próxima versão do modelo, de acordo com a política de ciclo de vida do modelo da Vertex AI. Deixe tempo suficiente para migrar para os novos modelos antes das datas de descontinuação.

A tabela a seguir lista as especificações da versão do modelo. Quando você define uma especificação de modelo, a API usa o modelo especificado para gerar respostas.

Versão do modelo Genérico Saúde
Descrição Janela de contexto Data de desativação Descrição Janela de contexto Data de desativação
stable

A escolha do modelo padrão se a versão do modelo não estiver definida.

A especificação do modelo stable aponta para gemini-1.5-flash-001/answer_gen/v1.

O modelo designado como stable muda periodicamente à medida que novos modelos e versões ficam disponíveis.

128 mil N/A

A escolha do modelo padrão se a versão do modelo não estiver definida.

A especificação do modelo stable aponta para gemini-1.5-flash-001/answer_gen/v1.

O modelo designado como stable muda periodicamente à medida que novos modelos e versões ficam disponíveis.

128 mil N/A
gemini-1.0-pro-001/answer_gen/v1

Aponta para o modelo gemini-1.0-pro-001.

O modelo é congelado após o lançamento.

32K 9 de abril de 2025 Não disponível
gemini-1.0-pro-002/answer_gen/v1

Uma pesquisa da Vertex AI baseada no modelo gemini-1.0-pro-002 com treinamento adicional para responder a perguntas e tarefas.

O modelo é congelado após o lançamento.

32K 9 de abril de 2025

Um modelo da Vertex AI para Pesquisa baseado no gemini-1.0-pro-002 model com treinamento adicional para responder a perguntas.

O modelo é congelado após o lançamento.

32K 9 de abril de 2025
gemini-1.5-flash-001/answer_gen/v1

Um modelo da Vertex AI para Pesquisa baseado no modelo gemini-1.5-flash-001 com ajustes adicionais para lidar com tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 24 de maio de 2025

Um modelo da Vertex AI para Pesquisa baseado no modelo gemini-1.5-flash-001 com ajustes adicionais para lidar com tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 24 de maio de 2025
gemini-1.5-flash-001/answer_gen/v2

Um modelo da Vertex AI para Pesquisa com base no modelo gemini-1.5-flash-001 e ajustes adicionais (versão 2) em dados estruturados e não estruturados combinados para responder a perguntas.

O modelo é congelado após o lançamento.

128 mil 24 de maio de 2025 Não disponível
gemini-1.5-flash-002/answer_gen/v1

Um modelo da Vertex AI para Pesquisa baseado no modelo gemini-1.5-flash-002 com ajustes adicionais para lidar com tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 24 de setembro de 2025 Não disponível
medlm-medium/answer_gen/v1 Não disponível Os modelos do MedLM foram treinados com informações da Web em grande escala disponíveis ao público, conjuntos de dados públicos e conjuntos de dados privados licenciados e desidentificados com informações de saúde e médicas. 32 mil 16 de novembro de 2024
preview

A especificação do modelo de pré-lançamento aponta para o modelo gemini-1.5-pro-002 mais recente. O modelo de visualização está sujeito a alterações sem aviso prévio. Se você usar esse modelo, poderá notar mudanças nas respostas quando o modelo mudar. Se você quiser mais consistência nas respostas, selecione um modelo específico.

128 mil N/A medlm-medium/answer_gen/v1 32 mil N/A

A seguir