A partir de 29 de abril de 2025, os modelos Gemini 1.5 Pro e Gemini 1.5 Flash não estarão disponíveis em projetos que não os usaram antes, incluindo novos projetos. Para mais detalhes, consulte Versões e ciclo de vida do modelo.

Visão geral do ajuste de modelos para o Gemini

O ajuste de modelos é um processo crucial na adaptação do Gemini para executar tarefas específicas com maior precisão. O ajuste de modelos fornece um modelo com um conjunto de dados de treinamento que contém um conjunto de exemplos de tarefas downstream específicas.

Nesta página, você encontra uma visão geral do ajuste de modelos para o Gemini, descreve as opções disponíveis e ajuda a determinar quando cada opção de ajuste precisa ser usada.

Benefícios do ajuste de modelos

O ajuste de modelos é uma maneira eficaz de personalizar modelos grandes para suas tarefas. Essa é uma etapa fundamental para melhorar a qualidade e a eficiência do modelo. O ajuste de modelos oferece os seguintes benefícios:

Qualidade mais alta para suas tarefas específicas.
Maior robustez de modelo.
Menor latência e custo de inferência devido a comandos mais curtos.

Ajuste comparado ao design de comandos

O ajuste oferece os seguintes benefícios em relação ao design de comandos.

Permite uma personalização profunda no modelo e resulta em melhor desempenho em tarefas específicas.
Oferece resultados mais consistentes e confiáveis.
Capaz de processar mais exemplos de uma só vez.

Abordagens de ajuste

O ajuste com eficiência de parâmetros e o ajuste fino completo são duas abordagens para personalizar modelos grandes. Ambos os métodos têm vantagens e implicações em termos de qualidade do modelo e eficiência de recursos.

O ajuste da eficiência dos parâmetros

O ajuste da eficiência de parâmetros, também chamado de ajuste do adaptador, permite a adaptação eficiente de modelos grandes para tarefas ou domínios específicos. O ajuste eficiente de parâmetros atualiza um subconjunto relativamente pequeno de parâmetros do modelo durante o processo de ajuste.

Para entender como a Vertex AI oferece suporte ao ajuste e à disponibilização de adaptadores, confira mais detalhes neste artigo: Adaptação de modelos de fundação grandes.

Ajuste completo

O ajuste completo atualiza todos os parâmetros do modelo, o que o torna adequado para adaptá-lo a tarefas altamente complexas, com o potencial de alcançar maior qualidade. No entanto, o ajuste fino completo exige recursos computacionais mais altos para ajuste e disponibilização, levando a custos gerais mais altos.

O ajuste da eficiência dos parâmetros em comparação com o ajuste fino completo

O ajuste com eficiência de parâmetros é mais econômico em comparação com o ajuste fino completo. Ele usa recursos computacionais significativamente menores para treinamento. Ele adapta o modelo mais rapidamente com um conjunto de dados menor. A flexibilidade do ajuste de eficiência de parâmetros oferece uma solução para o aprendizado de várias tarefas sem a necessidade de um retreinamento extensivo.

Ajuste de modelos do Gemini

Os modelos do Gemini (gemini-1.0-pro-002) são compatíveis com os seguintes métodos de ajuste:

Ajuste supervisionado com eficiência de parâmetros

O ajuste fino supervisionado é ideal quando você tem uma tarefa bem definida com dados rotulados disponíveis. O ajuste supervisionado adapta o comportamento do modelo com um conjunto de dados rotulado. Esse processo ajusta os pesos do modelo para minimizar a diferença entre as previsões e os rótulos reais.

Cota

A cota é aplicada ao número de jobs de ajuste simultâneos. Todo projeto tem uma cota padrão para executar pelo menos um job de ajuste. Essa é uma cota global compartilhada por todas as regiões disponíveis. Se você quiser executar mais jobs simultaneamente, solicite uma cota extra para Global concurrent tuning jobs.

A seguir

Para saber como preparar dados de ajuste, consulte Preparar dados de ajuste supervisionados.
Para saber como o ajuste supervisionado pode ser usado em uma solução que cria uma base de conhecimento de IA generativa, consulte Solução de início rápido: base de conhecimento de IA generativa.