Versões de modelo e ciclo de vida

Cada modelo de linguagem de IA generativa da Vertex AI está disponível em uma versão estável e uma versão com atualização automática. As convenções de nomenclatura e controle de versões de modelos do Gemini e do PaLM são semelhantes, mas não idênticas. Consulte os tópicos a seguir para saber como o controle de versões de modelos funciona com modelos do Gemini e PaLM. Para saber mais sobre as versões de modelos do Imagen na Vertex AI e o ciclo de vida delas, consulte Versões de modelos do Imagen na Vertex AI e ciclo de vida.

Versões e ciclo de vida do modelo do Gemini

Os modelos de linguagem do Gemini são multimodais, o que significa que podem processar informações de mais de uma modalidade, como imagens, vídeos e texto.

Versão estável do Gemini

Uma versão estável de um modelo do Gemini não é alterada e continua disponível até a data de desativação. Consulte as tabelas em Versões de modelos estáveis do Gemini disponíveis nesta página para conhecer as datas de desativação dos modelos do Gemini. Se você usar uma estável após a data de desativação, será necessário mudar para uma versão estável mais recente. É possível identificar a versão de um modelo estável pelo número de três dígitos anexado ao nome do modelo. Por exemplo, gemini-1.0-pro-001 é a versão estável número um do modelo do Gemini 1.0 Pro.

O Google lança versões estáveis regularmente. É possível alternar de uma versão estável para outra, desde que a outra ainda esteja disponível. Ao passar de uma versão estável para uma versão estável diferente, você precisa executar seus jobs de ajuste novamente, porque pode haver solicitação, saída e outras diferenças entre as versões.

Para usar a versão estável de um modelo do Gemini, anexe o número da versão de três dígitos ao modelo com um hífen (-). Por exemplo, para especificar o modelo gemini-1.0-pro estável que é a versão seis, anexe -006 ao nome do modelo:

https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.0-pro-006

Versões do modelo estáveis do Gemini disponíveis

As seguintes versões de modelo estáveis estão disponíveis para os modelos do Gemini com disponibilidade geral:

Modelo Gemini 1.0 Pro Data da versão Data de desativação
gemini-1.0-pro-001 15 de fevereiro de 2024 15 de fevereiro de 2025
gemini-1.0-pro-002 9 de abril de 2024 A partir de 9 de abril de 2025
Modelo Pro Vision do Gemini 1.0 Data da versão Data de desativação
gemini-1.0-pro-vision-001 15 de fevereiro de 2024 15 de fevereiro de 2025

Versão atualizada automaticamente do Gemini

A versão atualizada automaticamente de um modelo do Gemini aponta para a versão estável mais recente. Quando uma nova versão estável é lançada, a versão atualizada automaticamente aponta para a nova versão. Isso significa que, se você especificar a versão atualizada automaticamente de um modelo do Gemini no seu código, ela poderá se comportar de maneira diferente sem aviso quando a próxima versão estável for lançada. Por isso, use uma versão atualizada automaticamente com cuidado ao ajustar o modelo.

Para usar a versão atualizada automaticamente de um modelo, não acrescente nada ao nome. Por exemplo, o comando a seguir usa a versão atualizada automaticamente do modelo gemini-1.0-pro-vision:

https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.0-pro-vision

Modelos com atualização automática do Gemini

A tabela a seguir mostra as versões do modelo Gemini atualizadas automaticamente disponíveis e a versão estável que cada uma referencia.

Nome do modelo Nome atualizado automaticamente Versão estável de referência
Modelo Pro Vision do Gemini 1.0 gemini-1.0-pro-vision gemini-1.0-pro-vision-001
Modelo Gemini 1.0 Pro gemini-1.0-pro gemini-1.0-pro-002

Versão de pré-lançamento do Gemini

A versão de pré-lançamento de um modelo do Gemini é um modelo que está em pré-lançamento e não tem disponibilidade geral (GA, na sigla em inglês). Uma versão de pré-lançamento de um modelo contém uma funcionalidade que não está na versão mais recente ou atualizada automaticamente. Como uma versão de modelo em pré-lançamento não é estável, não é recomendável usá-la em produções.

Cada modelo em pré-lançamento é fixado na data do lançamento. A data de lançamento faz parte do nome do modelo usado no seu código. O padrão de nome usado por um modelo em pré-lançamento é model_name-preview-MMDD. Por exemplo, gemini-1.5-pro-preview-0409 é a versão de pré-lançamento do modelo do Gemini 1.5 Pro, lançada em 9 de abril.

Modelos de pré-lançamento do Gemini

A tabela a seguir mostra as versões do modelo do Gemini empré-lançamento disponíveis e a versão de pré-lançamento que cada uma referencia.

Nome do modelo Nome do pré-lançamento Data de desativação
Modeo Gemini 1.5 Pro gemini-1.5-pro-preview-0409 A ser atualizado para uma versão estável

Versões e ciclo de vida do modelo do PaLM

Os modelos de linguagem PaLM incluem modelos de texto e código, como text-bison, text-unicorn, chat-bison, code-bison e code-gecko. As versões diferem se mudam ou não ao longo do tempo e por quanto tempo ficam disponíveis.

Versão estável do PaLM

Uma versão estável de um modelo não é alterada e continua disponível até a data de desativação. Consulte as tabelas em Versões de modelos estáveis do PaLM disponíveis nesta página para conhecer as datas de desativação dos modelos do PaLM. Se você usar uma versão estável após a data de desativação, será necessário mudar para uma versão estável mais recente disponível. É possível identificar a versão de um modelo estável pelo número de três dígitos anexado ao nome do modelo. Por exemplo, text-bison@001 é a versão estável número um do modelo de texto de IA generativa da Vertex AI.

O Google lança versões estáveis regularmente. É possível alternar de uma versão estável para outra, desde que a outra ainda esteja disponível. Ao passar de uma versão estável para uma versão estável diferente, você precisa executar seus jobs de ajuste novamente, porque pode haver solicitação, saída e outras diferenças entre as versões.

Versões do modelo estáveis do PaLM disponíveis

As seguintes versões de modelos estáveis estão disponíveis para modelos de IA generativa com disponibilidade geral:

modelo de chat-bison Data da versão Data de desativação
chat-bison@002 6 de dezembro de 2023 9 de outubro de 2024
chat-bison@001 10 de julho de 2023 6 de julho de 2024
Modelo chat-bison-32k Data da versão Data de desativação
chat-bison-32k@002 4 de dezembro de 2023 9 de outubro de 2024
Modelo code-bison Data da versão Data de desativação
code-bison@002 6 de dezembro de 2023 9 de outubro de 2024
code-bison@001 29 de junho de 2023 6 de julho de 2024
Modelo code-bison-32k Data da versão Data de desativação
code-bison-32k@002 4 de dezembro de 2023 9 de outubro de 2024
modelo codechat-bison Data da versão Data de desativação
codechat-bison@002 6 de dezembro de 2023 9 de outubro de 2024
codechat-bison@001 29 de junho de 2023 6 de julho de 2024
Modelo codechat-bison-32k Data da versão Data de desativação
codechat-bison-32k@002 4 de dezembro de 2023 9 de outubro de 2024
Modelo code-gecko Data da versão Data de desativação
code-gecko@002 6 de dezembro de 2023 9 de outubro de 2024
code-gecko@001 29 de junho de 2023 6 de julho de 2024
modelo text-bison Data da versão Data de desativação
text-bison@002 6 de dezembro de 2023 9 de outubro de 2024
text-bison@001 7 de junho de 2023 6 de julho de 2024
Modelo text-bison-32k Data da versão Data de desativação
text-bison-32k@002 4 de dezembro de 2023 9 de outubro de 2024
modelo de texto-unicórnio Data da versão Data de desativação
text-unicorn@001 30 de novembro de 2023 A partir de 30 de novembro de 2024
modelo textembedding-gecko Data da versão Data de desativação
textembedding-gecko@003 12 de dezembro de 2023 Não relevante
textembedding-gecko@002 2 de novembro de 2023 9 de outubro de 2024
textembedding-gecko-multilingual@001 2 de novembro de 2023 Não relevante
textembedding-gecko@001 7 de junho de 2023 9 de outubro de 2024
text-embedding-preview-0409 9 de abril de 2024 A ser atualizado para uma versão estável.
text-multilingual-embedding-preview-0409 9 de abril de 2024 A ser atualizado para uma versão estável.

Versão mais recente do PaLM

A versão mais recente de um modelo é atualizada periodicamente e inclui atualizações e melhorias incrementais. Essas mudanças podem resultar em diferenças sutis na saída ao longo do tempo para um determinado prompt. Não há garantia de que a versão mais recente de um modelo seja estável.

Para usar a versão estável de um modelo de linguagem, anexe o número da versão de três dígitos ao modelo. Por exemplo, para especificar o modelo estável text-bison que é a versão seis, anexe @006 ao nome do modelo:

https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/text-bison@006

Para usar a versão mais recente de um modelo, não anexe nada ao nome do modelo. Por exemplo, o comando a seguir usa a versão mais recente do modelo codechat-bison:

https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/codechat-bison

Modelos mais recentes do PaLM

A tabela a seguir mostra os identificadores das versões mais recentes disponíveis do modelo de IA generativa:

modelos PaLM 2 para texto (text-bison) text-bison
text-bison-32k
modelos PaLM 2 para chat (chat-bison) chat-bison
chat-bison-32k
Codey para modelos de geração de código (code-bison) code-bison
code-bison-32k
Codey para modelos de chat de código (codechat-bison) codechat-bison
codechat-bison-32k
Codey para modelos de preenchimento de código (code-gecko) code-gecko
Embeddings para texto (modelos textembedding-gecko) textembedding-gecko@latest
textembedding-gecko-multilingual@latest

A seguir