Versões e ciclo de vida do modelo de geração de respostas
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
As aplicações de IA oferecem várias versões de modelos para escolher quando
gerar respostas. Pode escolher as versões do modelo quando usar resumos
de pesquisa e respostas e
seguimentos.
Modelos disponíveis
As aplicações de IA usam dois tipos de modelos para exemplos de utilização de perguntas e respostas:
Modelos de MDIs/CEs da Vertex AI que foram testados em tarefas de perguntas e respostas
Modelos de aplicações de IA baseados em modelos de MDIs/CEs da Vertex AI e preparados adicionalmente para responder a perguntas
Os modelos de aplicações de IA partilham a mesma data de descontinuação que os respetivos modelos de GMLs da Vertex AI base. O modelo de LLM base está disponível durante seis meses após a data de lançamento da versão seguinte do modelo, de acordo com a política de ciclo de vida do modelo do Vertex AI.
Deixe tempo suficiente para migrar para os novos modelos antes das datas de descontinuação.
A tabela seguinte lista as especificações da versão do modelo. Quando define uma especificação do modelo, a API usa o modelo especificado para gerar respostas.
Vertical da indústria
Personalizado
Cuidados de saúde
Versão do modelo
Descrição
Capacidade de resposta
Data de descontinuação
Descrição
Capacidade de resposta
Data de descontinuação
stable
A escolha do modelo predefinido se a versão do modelo não estiver definida.
A especificação do modelo stable aponta para
gemini-2.5-flash/answer_gen/v1.
O modelo designado como stable muda periodicamente à medida que são disponibilizados novos modelos e versões.
128K
N/A
A escolha do modelo predefinido se a versão do modelo não estiver definida.
A especificação do modelo stable aponta para
gemini-2.5-flash/answer_gen/v1.
O modelo designado como stable muda periodicamente à medida que são disponibilizados novos modelos e versões.
128K
N/A
gemini-2.5-flash/answer_gen/v1
Um modelo de aplicações de IA baseado no modelo gemini-2.5-flash com otimização adicional para resolver tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128K
17 de junho de 2026
Um modelo de aplicações de IA baseado no modelo gemini-2.5-flash com otimização adicional para resolver tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128K
17 de junho de 2026
gemini-2.0-flash-001/answer_gen/v1
Um modelo de aplicações de IA baseado no modelo gemini-2.0-flash-001 com otimização adicional para resolver tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128K
5 de fevereiro de 2026
Um modelo de aplicações de IA baseado no modelo gemini-2.0-flash-001 com otimização adicional para resolver tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128K
5 de fevereiro de 2026
gemini-1.5-flash-002/answer_gen/v1
Um modelo de aplicações de IA baseado no modelo gemini-1.5-flash-002 com otimização adicional para resolver tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128K
24 de setembro de 2025
Não disponível
gemini-1.5-flash-001/answer_gen/v2
Um modelo de aplicações de IA baseado no modelo gemini-1.5-flash-001 com ajuste adicional (versão 2) em dados estruturados e não estruturados misturados para resolver tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128K
24 de maio de 2025
Um modelo de aplicações de IA baseado no modelo gemini-1.5-flash-001 com ajuste adicional (versão 2) em dados estruturados e não estruturados misturados para resolver tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128K
24 de maio de 2025
gemini-1.5-flash-001/answer_gen/v1
Um modelo de aplicações de IA baseado no modelo gemini-1.5-flash-001 com otimização adicional para resolver tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128K
24 de maio de 2025
Um modelo de aplicações de IA baseado no modelo gemini-1.5-flash-001 com otimização adicional para resolver tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128K
24 de maio de 2025
preview
A especificação do modelo de pré-visualização aponta para o modelo gemini-1.5-pro-002 mais recente. O modelo de pré-visualização está sujeito a alterações sem notificação. Se
usar o modelo preview, pode ver alterações nas respostas quando o
modelo muda. Se quiser consistência nas respostas, selecione um modelo específico.
128K
N/A
A especificação do modelo de pré-visualização aponta para o modelo gemini-1.5-pro-002 mais recente. O modelo de pré-visualização está sujeito a alterações sem notificação. Se
usar o modelo preview, pode ver alterações nas respostas quando o
modelo muda. Se quiser consistência nas respostas, selecione um modelo específico.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-21 UTC."],[[["\u003cp\u003eVertex AI Search offers a selection of model versions for generating answers, accessible when using search summaries and answers with follow-ups.\u003c/p\u003e\n"],["\u003cp\u003eThere are two main types of models used by Vertex AI Search for question-and-answer tasks: Vertex AI LLM models and Vertex AI Search models, the latter being further trained based on LLMs.\u003c/p\u003e\n"],["\u003cp\u003eThe \u003ccode\u003estable\u003c/code\u003e model designation in Vertex AI Search automatically updates to the most current model version available, whereas other model versions remain frozen after their release.\u003c/p\u003e\n"],["\u003cp\u003eVertex AI Search models share the same discontinuation date as their base Vertex AI LLM models, with the base LLM models being supported for six months after the release of the subsequent version.\u003c/p\u003e\n"],["\u003cp\u003eThe \u003ccode\u003epreview\u003c/code\u003e model specfication uses the latest \u003ccode\u003egemini-1.5-pro-002\u003c/code\u003e model, and is subject to change without notification.\u003c/p\u003e\n"]]],[],null,["# Answer generation model versions and lifecycle\n\nAI Applications offers multiple model versions for you to choose when\ngenerating answers. You can choose the model versions when using [search\nsummaries](/generative-ai-app-builder/docs/get-search-summaries) and [answers and\nfollow-ups](/generative-ai-app-builder/docs/answer).\n\nAvailable models\n----------------\n\nAI Applications uses two types of models for question and answering\nuse cases:\n\n- Vertex AI LLM models that have been tested on question and answering tasks\n- AI Applications models that are based on Vertex AI LLM models and further trained to address question and answering tasks\n\nAI Applications models share the same discontinuation date as their\nbase Vertex AI LLM models. The base LLM model is available for six\nmonths after the release date of the next version of the model, per the [Vertex\nAI model lifecycle\npolicy](/vertex-ai/generative-ai/docs/learn/model-versioning).\nLeave enough time to migrate to new models before the discontinuation dates.\n\nThe following table lists model version specifications. When you set a model\nspecification, the API uses the specified model to generate answers.\n\nWhat's next\n-----------\n\n- [Get search summaries](/generative-ai-app-builder/docs/get-search-summaries)"]]