A partir de 29 de abril de 2025, os modelos Gemini 1.5 Pro e Gemini 1.5 Flash não estão disponíveis em projetos que não tenham usado estes modelos anteriormente, incluindo novos projetos. Para ver detalhes, consulte o artigo Versões e ciclo de vida dos modelos.
A tabela seguinte resume as nossas recomendações para otimizar os MDGs usando LoRA ou QLoRA:
Especificação
Recomendado
Detalhes
Eficiência da memória da GPU
QLoRA
O QLoRA tem uma utilização de memória da GPU máxima cerca de 75% inferior em comparação com o LoRA.
Velocidade
LoRA
O LoRA é cerca de 66% mais rápido do que o QLoRA em termos de velocidade de otimização.
Relação custo-eficácia
LoRA
Embora ambos os métodos sejam relativamente baratos, o LoRA é até 40% menos caro do que o QLoRA.
Comprimento máximo da sequência mais elevado
QLoRA
Um comprimento máximo da sequência mais elevado aumenta o consumo de memória da GPU. O QLoRA usa menos memória da GPU, pelo que pode suportar comprimentos de sequência máximos mais elevados.
Melhoria da precisão
Igual
Ambos os métodos oferecem melhorias de precisão semelhantes.
Tamanho do lote mais elevado
QLoRA
O QLoRA suporta tamanhos de lotes muito superiores. Por exemplo, seguem-se as recomendações de tamanho do lote para a otimização do openLLaMA-7B nas seguintes GPUs:
1 x A100 40G:
LoRA: recomenda-se um tamanho do lote de 2.
QLoRA: recomenda-se um tamanho do lote de 24.
1 x L4:
LoRA: o tamanho do lote de 1 falha com um erro de falta de memória (OOM).
QLoRA: recomenda-se um tamanho do lote de 12.
1 x V100:
LoRA: o tamanho do lote de 1 falha com um erro de falta de memória (OOM).
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-22 UTC."],[],[],null,[]]