Esta página foi traduzida pela API Cloud Translation.

Experimente valores de parâmetros

Cada chamada que envia a um modelo inclui valores de parâmetros que controlam a forma como o modelo gera uma resposta. O modelo pode gerar resultados diferentes para valores de parâmetros diferentes. Experimente diferentes valores de parâmetros para obter os melhores valores para a tarefa. Os parâmetros disponíveis para diferentes modelos podem variar. Os parâmetros mais comuns são os seguintes:

Número máximo de tokens de saída
Temperatura
Top-P
Top-K
Número aleatório

Número máximo de tokens de saída

Número máximo de tokens que podem ser gerados na resposta. Um token tem aproximadamente quatro carateres. 100 tokens correspondem a aproximadamente 60 a 80 palavras.

Especifique um valor inferior para respostas mais curtas e um valor superior para respostas potencialmente mais longas.

Temperatura

A temperatura é usada para a amostragem durante a geração de respostas, que ocorre quando topP e topK são aplicados. A temperatura controla o grau de aleatoriedade na seleção de tokens. As temperaturas mais baixas são adequadas para comandos que requerem uma resposta menos aberta ou criativa, enquanto as temperaturas mais altas podem gerar resultados mais diversos ou criativos. Uma temperatura de 0 significa que os tokens de probabilidade mais elevada são sempre selecionados. Neste caso, as respostas para um determinado comando são maioritariamente determinísticas, mas ainda é possível uma pequena variação.

Se o modelo devolver uma resposta demasiado genérica, demasiado curta ou uma resposta alternativa, experimente aumentar a temperatura.

Os modelos Gemini suportam um valor de temperatura entre 0,0 e 2,0. Os modelos têm uma temperatura predefinida de 1,0.

Top-P

O Top-P altera a forma como o modelo seleciona tokens para a saída. Os tokens são selecionados do mais provável para o menos provável até que a soma das respetivas probabilidades seja igual ao valor de Top-P. Por exemplo, se os tokens A, B e C tiverem uma probabilidade de 0,3, 0,2 e 0,1 e o valor de top-P for 0.5, o modelo seleciona A ou B como o token seguinte através da temperatura e exclui C como um candidato.

Especifique um valor inferior para respostas menos aleatórias e um valor superior para respostas mais aleatórias.

Top-K

O Top-K altera a forma como o modelo seleciona tokens para a saída. Um top-K de 1 significa que o token selecionado seguinte é o mais provável entre todos os tokens no vocabulário do modelo (também denominado descodificação gananciosa), enquanto um top-K de 3 significa que o token seguinte é selecionado entre os três tokens mais prováveis através da temperatura.

Para cada passo de seleção de tokens, são amostrados os K principais tokens com as probabilidades mais elevadas. Em seguida, os tokens são filtrados com base no top-P, sendo o token final selecionado através da amostragem de temperatura.

Especifique um valor inferior para respostas menos aleatórias e um valor superior para respostas mais aleatórias.

Número aleatório

Quando a semente é fixada num valor específico, o modelo faz o seu melhor para fornecer a mesma resposta para pedidos repetidos. O resultado determinístico não é garantido. Além disso, a alteração das definições do modelo ou dos parâmetros, como a temperatura, pode provocar variações na resposta, mesmo quando usa o mesmo valor de semente. Por predefinição, é usado um valor de semente aleatório.

Esta é uma funcionalidade de pré-visualização.

O que se segue?

Explore exemplos de comandos na Galeria de comandos.
Saiba como otimizar comandos para utilização com os modelos Google através do otimizador de comandos do Vertex AI (pré-visualização).