Respostas às versões do modelo de geração e ciclo de vida

A Vertex AI para Pesquisa oferece várias versões de modelo para você escolher quando gerar respostas. Você pode escolher as versões do modelo ao usar o comando resumos e respostas e acompanhamentos.

Modelos disponíveis

A Vertex AI para Pesquisa usa dois tipos de modelos para perguntas e respostas casos de uso específicos:

  • Modelos de LLM da Vertex AI que foram testados em tarefas de perguntas e respostas
  • Modelos da Vertex AI para Pesquisa baseados em modelos de LLM da Vertex AI e treinados para responder a perguntas e tarefas de resposta

Os modelos da Vertex AI para Pesquisa têm a mesma data de desativação dos modelos de LLM da Vertex AI. O modelo LLM básico está disponível para seis meses após a data de lançamento da próxima versão do modelo, de acordo com a Ciclo de vida do modelo de IA política. Reserve tempo suficiente para migrar para novos modelos antes das datas de desativação.

A tabela a seguir lista as especificações da versão do modelo. Quando você define um modelo a API usa o modelo especificado para gerar respostas.

Versão do modelo Genérico Saúde
Descrição Janela de contexto Data de desativação Descrição Janela de contexto Data de desativação
stable

A escolha de modelo padrão caso a versão do modelo não esteja definida.

A especificação do modelo stable aponta para gemini-1.5-flash-001/answer_gen/v1.

O modelo designado como stable muda periodicamente à medida que novos modelos e versões ficam disponíveis.

128 mil N/A

A escolha do modelo padrão se a versão do modelo não estiver definida.

A especificação do modelo stable aponta para gemini-1.5-flash-001/answer_gen/v1.

O modelo designado como stable muda periodicamente à medida que novos modelos e versões ficam disponíveis.

128 mil N/A
gemini-1.0-pro-001/answer_gen/v1

Aponta para o modelo gemini-1.0-pro-001.

O modelo é congelado após o lançamento.

32K 15 de fevereiro de 2025 Não disponível
gemini-1.0-pro-002/answer_gen/v1

Uma Vertex AI para Pesquisa com base no gemini-1.0-pro-002 com treinamento adicional para abordar perguntas e respostas a tarefas.

O modelo é congelado após o lançamento.

32K 9 de Abril de 2025

Um modelo da Vertex AI para Pesquisa baseado no gemini-1.0-pro-002 model com treinamento adicional para responder a perguntas.

O modelo é congelado após o lançamento.

32K 9 de Abril de 2025
gemini-1.5-flash-001/answer_gen/v1

Um modelo da Vertex AI para Pesquisa baseado no modelo gemini-1.5-flash-001 com ajuste adicional para lidar com tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 24 de maio de 2025

Um modelo da Vertex AI para Pesquisa baseado no modelo gemini-1.5-flash-001 com mais ajustes para abordar perguntas e respostas a tarefas.

O modelo é congelado após o lançamento.

128 mil 24 de maio de 2025
gemini-1.5-flash-001/answer_gen/v2

Um modelo da Vertex AI para Pesquisa baseado no modelo gemini-1.5-flash-001 com mais ajustes (versão 2) em dados combinados, estruturados e não estruturados, para abordar perguntas e respostas a tarefas.

O modelo é congelado após o lançamento.

128 mil 24 de maio de 2025 Não disponível
gemini-1.5-flash-002/answer_gen/v1

Um modelo da Vertex AI para Pesquisa baseado no modelo gemini-1.5-flash-002 com ajuste adicional para lidar com tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 24 de setembro de 2025 Não disponível
text-bison@002/answer_gen/v1

Um modelo da Vertex AI para Pesquisa baseado no modelo text-bison@002 com treinamento adicional para responder a perguntas.

O modelo é congelado após o lançamento.

8 mil 9 de outubro de 2024 Não disponível
medlm-medium/answer_gen/v1 Não disponível Os modelos do MedLM foram treinados com informações da Web disponíveis em grande escala, conjuntos de dados públicos e conjuntos de dados particulares licenciados e desidentificados com informações de saúde e médicas. 32 mil 16 de novembro de 2024
preview

A especificação do modelo de prévia aponta para a versão mais recente do gemini-1.5-pro-002. um modelo de machine learning. O modelo de visualização está sujeito a alterações sem notificação. Se você usar esse modelo, poderá notar mudanças nas respostas quando o modelo mudar. Se você quiser mais consistência nas respostas, selecione um modelo específico.

128 mil N/A medlm-medium/answer_gen/v1 32 mil N/A

A seguir