Visão geral do ajuste de modelos para o Gemini

O ajuste de modelos é um processo crucial na adaptação do Gemini para executar tarefas específicas com maior precisão. O ajuste de modelos fornece um modelo com um conjunto de dados de treinamento que contém um conjunto de exemplos de tarefas downstream específicas.

Nesta página, você encontra uma visão geral do ajuste de modelos para o Gemini, descreve as opções disponíveis e ajuda a determinar quando cada opção de ajuste precisa ser usada.

Benefícios do ajuste de modelos

O ajuste de modelos é uma maneira eficaz de personalizar modelos grandes para suas tarefas. Essa é uma etapa fundamental para melhorar a qualidade e a eficiência do modelo. O ajuste de modelos oferece os seguintes benefícios:

  • Qualidade mais alta para suas tarefas específicas.
  • Maior robustez de modelo.
  • Menor latência e custo de inferência devido a comandos mais curtos.

Ajuste comparado ao design de comandos

O ajuste oferece os seguintes benefícios em relação ao design de comandos.

  • Permite uma personalização profunda no modelo e resulta em melhor desempenho em tarefas específicas.
  • Oferece resultados mais consistentes e confiáveis.
  • Capaz de processar mais exemplos de uma só vez.

O ajuste da eficiência dos parâmetros

O ajuste da eficiência de parâmetros, também chamado de ajuste do adaptador, permite a adaptação eficiente de modelos grandes para tarefas ou domínios específicos. O ajuste eficiente de parâmetros atualiza um subconjunto relativamente pequeno de parâmetros do modelo durante o processo de ajuste.

Para entender como a Vertex AI oferece suporte ao ajuste e à disponibilização de adaptadores, confira mais detalhes neste artigo: Adaptação de modelos de fundação grandes.

O ajuste da eficiência dos parâmetros em comparação com o ajuste fino completo

O ajuste com eficiência de parâmetros e o ajuste fino completo são duas abordagens para personalizar modelos grandes. Ambos os métodos têm vantagens e implicações em termos de qualidade do modelo e eficiência de recursos.

O ajuste completo atualiza todos os parâmetros do modelo, o que o torna adequado para adaptá-lo a tarefas altamente complexas, com o potencial de alcançar maior qualidade. No entanto, o ajuste fino completo exige recursos computacionais mais altos para ajuste e disponibilização, levando a custos gerais mais altos.

O ajuste com eficiência de parâmetros é mais econômico em comparação com o ajuste fino completo. Ele usa recursos computacionais significativamente menores para treinamento. Ele adapta o modelo mais rapidamente com um conjunto de dados menor. A flexibilidade do ajuste de eficiência de parâmetros oferece uma solução para o aprendizado de várias tarefas sem a necessidade de um retreinamento extensivo.

A Vertex AI oferece suporte para ajustes com eficiência de parâmetros e ajuste completo para diferentes modelos em diferentes cenários.

Ajuste de modelos do Gemini

Os modelos do Gemini a seguir são compatíveis com o ajuste supervisionado usando ajustes com eficiência de parâmetros:

  • gemini-1.0-pro-002

O ajuste fino supervisionado é uma boa opção quando você tem uma tarefa bem definida com dados rotulados disponíveis. Ele é particularmente eficaz para aplicativos específicos de domínio em que a linguagem ou o conteúdo é significativamente diferente dos dados para os quais o modelo grande foi originalmente treinado.

O ajuste supervisionado adapta o comportamento do modelo com um conjunto de dados rotulado. Esse processo ajusta os pesos do modelo para minimizar a diferença entre as previsões e os rótulos reais. Ele pode melhorar o desempenho do modelo para os seguintes tipos de tarefas:

  • Classificação
  • Análise de sentimento
  • Extração de entidades
  • Resumo de conteúdo não complexo
  • Escrever consultas específicas do domínio.

Cota para ajuste de modelos do Gemini

A cota é aplicada ao número de jobs de ajuste simultâneos. Todo projeto tem uma cota padrão para executar pelo menos um job de ajuste. Essa é uma cota global compartilhada por todas as regiões disponíveis. Se você quiser executar mais jobs simultaneamente, solicite uma cota extra para Global concurrent tuning jobs.