Introdução aos ajustes

O ajuste de modelos é um processo crucial na adaptação do Gemini para executar tarefas específicas com maior precisão. O ajuste de modelos fornece um modelo com um conjunto de dados de treinamento que contém um conjunto de exemplos de tarefas downstream específicas.

Nesta página, você encontra uma visão geral do ajuste de modelos para o Gemini, uma descrição das opções disponíveis e ajuda para determinar quando cada opção de ajuste precisa ser usada.

Benefícios do ajuste de modelos

O ajuste de modelos é uma maneira eficaz de personalizar modelos grandes para suas tarefas. Essa é uma etapa fundamental para melhorar a qualidade e a eficiência do modelo. O ajuste de modelos oferece os seguintes benefícios:

  • Qualidade mais alta para suas tarefas específicas
  • Maior robustez de modelo
  • Menor latência e custo de inferência devido a comandos mais curtos

Ajuste comparado ao design de comandos

  • Comandos com modelos pré-treinados do Gemini: o comando é a arte de criar instruções eficazes para orientar modelos de IA, como o Gemini, na geração das saídas que você quer. Isso envolve a criação de comandos que transmitam claramente a tarefa, o formato desejado e qualquer contexto relevante. É possível usar os recursos do Gemini com uma configuração mínima. É mais adequado para:
    • Dados rotulados limitados: se você tiver uma pequena quantidade de dados rotulados ou não puder fazer um processo de ajuste fino longo.
    • Prototipagem rápida: quando você precisa testar rapidamente um conceito ou obter uma performance de referência sem um grande investimento em ajustes.
  • Ajuste personalizado dos modelos do Gemini: para resultados mais personalizados, o Gemini permite ajustar os modelos nos seus conjuntos de dados específicos. Para criar um modelo de IA que se destaque no seu domínio específico, considere fazer ajustes. Isso envolve o treinamento do modelo base no seu próprio conjunto de dados rotulado, adaptando os pesos à sua tarefa e aos dados. Você pode adaptar o Gemini aos seus casos de uso. O ajuste fino é mais eficaz quando:
    • Você tem dados rotulados: um conjunto de dados considerável para treinar (pense em 100 exemplos ou mais), o que permite que o modelo aprenda profundamente as especificidades da tarefa.
    • Tarefas complexas ou únicas: para cenários em que as estratégias de solicitação avançadas não são suficientes e um modelo personalizado para seus dados é essencial.

Recomendamos começar com a solicitação para encontrar a melhor opção. Em seguida, faça o ajuste fino (se necessário) para aumentar ainda mais a performance ou corrigir erros recorrentes. Embora adicionar mais exemplos possa ser benéfico, é importante avaliar onde o modelo comete erros antes de adicionar mais dados. Dados de alta qualidade e bem rotulados são essenciais para uma boa performance e são melhores do que a quantidade. Além disso, os dados usados para o ajuste fino precisam refletir a distribuição, o formato e o contexto do comando que o modelo vai encontrar na produção.

O ajuste oferece os seguintes benefícios em relação ao design de comandos:

  • Permite uma personalização profunda no modelo e resulta em melhor desempenho em tarefas específicas.
  • Alinhe o modelo com sintaxe personalizada, instruções, regras semânticas específicas do domínio.
  • Oferece resultados mais consistentes e confiáveis.
  • Capaz de processar mais exemplos de uma só vez.
  • Economize custos na inferência removendo exemplos de few-shot e instruções longas nos comandos

Abordagens de ajuste

O ajuste com eficiência de parâmetros e o ajuste fino completo são duas abordagens para personalizar modelos grandes. Ambos os métodos têm vantagens e implicações em termos de qualidade do modelo e eficiência de recursos.

O ajuste da eficiência dos parâmetros

O ajuste da eficiência de parâmetros, também chamado de ajuste do adaptador, permite a adaptação eficiente de modelos grandes para tarefas ou domínios específicos. O ajuste eficiente de parâmetros atualiza um subconjunto relativamente pequeno de parâmetros do modelo durante o processo de ajuste.

Para entender como a Vertex AI oferece suporte ao ajuste e à disponibilização de adaptadores, confira mais detalhes neste artigo: Adaptação de modelos de fundação grandes.

Ajuste completo

O ajuste completo atualiza todos os parâmetros do modelo, o que o torna adequado para adaptá-lo a tarefas altamente complexas, com o potencial de alcançar maior qualidade. No entanto, o ajuste fino completo exige recursos computacionais mais altos para ajuste e disponibilização, levando a custos gerais mais altos.

O ajuste da eficiência dos parâmetros em comparação com o ajuste fino completo

O ajuste com eficiência de parâmetros é mais econômico em comparação com o ajuste fino completo. Ele usa recursos computacionais significativamente menores para treinamento. Ele adapta o modelo mais rapidamente com um conjunto de dados menor. A flexibilidade do ajuste de eficiência de parâmetros oferece uma solução para o aprendizado de várias tarefas sem a necessidade de um retreinamento extensivo.

Métodos de ajuste com suporte

A Vertex AI oferece suporte a ajustes supervisionados para personalizar modelos de base.

Ajuste de detalhes supervisionado

O ajuste de detalhes supervisionado melhora o desempenho do modelo ensinando uma nova habilidade. Dados que contêm centenas de exemplos rotulados são usados para ensinar o modelo a imitar um comportamento ou tarefa desejado. Cada exemplo rotulado demonstra o que você quer que o modelo produza durante a inferência.

Ao executar um job de ajuste, o modelo aprende outros parâmetros que o ajudam a codificar as informações necessárias para executar a tarefa desejada ou aprender o comportamento desejado. Esses parâmetros são usados durante a inferência. A saída do job de ajuste é um novo modelo que combina os parâmetros recém-aprendidos com o modelo original.

O ajuste de detalhes supervisionado de um modelo de texto é uma boa opção quando a saída do modelo não é complexa e é relativamente fácil de definir. O ajuste de detalhes supervisionado é recomendado para classificação, análise de sentimento, extração de entidade, resumo de conteúdo não complexo e gravação de consultas específicas de domínio. Para modelos de código, o ajuste supervisionado é a única opção.

Modelos com suporte para ajuste supervisionado

  • gemini-1.5-pro-002 (no GA)
  • gemini-1.5-flash-002(no GA)
  • gemini-1.0-pro-002 (na visualização, só oferece suporte ao ajuste de texto)

Para mais informações sobre como usar o ajuste de detalhes supervisionado em cada modelo, consulte as seguintes páginas: Ajustar os tipos de dados texto, imagem, áudio e documento.

A seguir