Versões de modelo e ciclo de vida

Cada modelo de linguagem da IA generativa na Vertex AI está inicialmente disponível em um preview e, depois, em uma versão stable. Cada versão estável tem uma auto-atualizado. Nesta página, explicamos como o controle de versões de modelo funciona com todos modelos do Google.

Para saber mais sobre as versões de modelos do Imagen na Vertex AI e o ciclo de vida delas, consulte Versões de modelos do Imagen na Vertex AI e ciclo de vida.

Se você ajustar um modelo do Gemini, o modelo ajustado compartilha a mesma data de descontinuação como o modelo base usado no processo de ajuste. Para mais informações, consulte Visão geral do ajuste de modelos para o Gemini.

Versão estável do Gemini

Uma versão estável de um modelo do Gemini não é alterada e continua disponível até a data de desativação. Não use uma versão estável após a data de desativação. mudar para um versão estável mais recente e disponível. É possível identificar a versão de um modelo estável pelo número de três dígitos anexado ao nome do modelo. Por exemplo, gemini-1.5-pro-001 é a versão estável número um do modelo do Gemini 1.5 Pro.

O Google lança versões estáveis regularmente. É possível alternar de uma versão estável para outra, desde que a outra ainda esteja disponível. Ao fazer isso, execute os jobs de ajuste novamente, porque pode haver prompt, saída e outras diferenças entre as versões.

Para usar a versão estável de um modelo do Gemini, Adicionar ao final o número de versão de três dígitos do modelo com um hífen (-). Por exemplo, para especifique a versão um do modelo gemini-1.5-pro estável, Adicionar ao final -001 ao nome do modelo:

https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.5-pro-001

Versões estáveis do modelo Gemini disponíveis

As seguintes versões de modelo estáveis estão disponíveis para os modelos do Gemini com disponibilidade geral:

Modelo Flash 1.5 do Gemini Data da versão Data de desativação Destaques da versão do modelo
gemini-1.5-flash-002 24 de setembro de 2024 24 de setembro de 2025 Melhoria na qualidade geral do modelo com ganhos significativos nas seguintes categorias:
  • Veracidade e redução de alucinações de modelos.
  • Perguntas e respostas do Openbook para casos de uso de RAG.
  • Seguir instruções.
  • Compreensão multilíngue em 102 idiomas, principalmente coreano, francês, alemão, espanhol, japonês, russo e chinês.
  • Geração de SQL.
  • Compreensão de áudio.
  • Entendimento de documentos.
  • Contexto longo.
  • Matemática e raciocínio.

O Gemini 1.5 Flash 002 usa a cota compartilhada dinâmica.

Às vezes, o gemini-1.5-flash-002 pode responder no seu idioma local, mesmo que o comando esteja escrito em outro idioma. Esse problema só se aplica a comandos que não são em inglês. Para atenuar esse problema, recomendamos adicionar o seguinte às instruções do sistema para garantir que o modelo responda no mesmo idioma do comando:

All questions should be answered comprehensively with details, unless the user requests a concise response specifically. Respond in the same language as the query.

gemini-1.5-flash-001 24 de maio de 2024 24 de maio de 2025 Versão inicial do Gemini 1.5 Flash.
Modelo Gemini 1.5 Pro Data da versão Data de desativação Destaques da versão do modelo
gemini-1.5-pro-002 24 de setembro de 2024 24 de setembro de 2025 Melhoria na qualidade geral do modelo com ganhos significativos nas seguintes categorias:
  • Veracidade e redução de alucinações de modelos.
  • Perguntas e respostas do Openbook para casos de uso de RAG.
  • Seguir instruções.
  • Compreensão multilíngue em 102 idiomas, principalmente coreano, francês, alemão, espanhol, japonês, russo e chinês.
  • Geração de SQL.
  • Compreensão de áudio.
  • Entendimento de documentos.
  • Contexto longo.
  • Matemática e raciocínio.

O Gemini 1.5 Pro 002 usa a cota compartilhada dinâmica.

Às vezes, o gemini-1.5-pro-002 pode responder no seu idioma local, mesmo que o comando esteja escrito em outro idioma. Esse problema só se aplica a comandos que não são em inglês. Para atenuar esse problema, recomendamos adicionar o seguinte às instruções do sistema para garantir que o modelo responda no mesmo idioma do comando:

All questions should be answered comprehensively with details, unless the user requests a concise response specifically. Respond in the same language as the query.

gemini-1.5-pro-001 24 de maio de 2024 24 de maio de 2025 Versão inicial do Gemini 1.5 Pro.
Modelo Pro Vision do Gemini 1.0 Data da versão Data de desativação
gemini-1.0-pro-vision-001 15 de fevereiro de 2024 9 de abril de 2025
Modelo Gemini 1.0 Pro Data da versão Data de desativação
gemini-1.0-pro-001 15 de fevereiro de 2024 9 de abril de 2025
gemini-1.0-pro-002 9 de abril de 2024 9 de Abril de 2025

Alias atualizado automaticamente do Gemini

O alias atualizado automaticamente de um modelo do Gemini aponta para a versão estável mais recente. Quando um novo alias estável é lançada, a versão atualizada automaticamente aponta para a nova versão. Isso significa que, se você especificar o alias atualizado automaticamente de um modelo do Gemini no seu código, ele poderá se comportar de maneira diferente sem aviso quando a próxima versão estável for lançada. Por isso, ao ajustar seu modelo, use um alias atualizado automaticamente com cuidado.

Para usar o alias atualizado automaticamente em um modelo, não acrescente nada ao nome dele. Por exemplo, o comando a seguir usa a versão atualizada automaticamente do modelo gemini-1.0-pro-vision:

https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.0-pro-vision

Aliases atualizados automaticamente pelo Gemini

A tabela a seguir mostra os aliases atualizados automaticamente para Gemini e a versão estável deles referencia a API.

Alias atualizado automaticamente Versão estável de referência
gemini-1.5-flash gemini-1.5-flash-001
Observação: para usar a versão mais recente (002), anexe -002 ao nome do modelo em vez de usar o alias.
gemini-1.0-pro-vision gemini-1.0-pro-vision-001
gemini-1.5-pro gemini-1.5-pro-001
Observação: para usar a versão mais recente (002), anexe -002 ao nome do modelo em vez de usar o alias.
gemini-1.0-pro gemini-1.0-pro-002
gemini-pro-experimental Consulte Modelos experimentais.
gemini-flash-experimental Consulte Modelos experimentais.

Versões de modelo estáveis para preenchimento de código

As seguintes versões de modelos estáveis estão disponíveis para modelos de IA generativa com disponibilidade geral:

Modelo code-gecko Data da versão Data de desativação
code-gecko@002 6 de dezembro de 2023 9 de abril de 2025

Embeddings de versões de modelo estáveis

As seguintes versões de modelos estáveis estão disponíveis para modelos de IA generativa com disponibilidade geral:

Nome do modelo Data da versão Data de desativação
text-embedding-005 18 de novembro de 2024 A ser determinado.
text-embedding-004 14 de maio de 2024 18 de novembro de 2025
text-multilingual-embedding-002 14 de maio de 2024 A ser determinado.
textembedding-gecko@003 12 de dezembro de 2023 14 de maio de 2025
textembedding-gecko-multilingual@001 2 de novembro de 2023 14 de maio de 2025
textembedding-gecko@002
(reaberto, mas ainda com suporte)
2 de novembro de 2023 9 de abril de 2025
textembedding-gecko@001
(reaberto, mas ainda com suporte)
7 de junho de 2013 9 de abril de 2025
multimodalembedding@001 12 de fevereiro de 2024 A ser determinado.

Modelos legados

Para informações sobre as datas de desativação de modelos legados, como o PaLM 2, consulte Informações sobre o modelo legado.