このページでは、モデルへのリクエストで設定できるオプションのサンプリング パラメータについて説明します。使用可能なパラメータはモデルによって異なる場合があります。詳細については、リファレンス ドキュメントをご覧ください。
トークン サンプリング パラメータ
Top-P
Top-P は、モデルが出力用にトークンを選択する方法を変更します。トークンは、確率の合計が Top-P 値に等しくなるまで、確率の高いもの(Top-K を参照)から低いものへと選択されます。たとえば、トークン A、B、C の確率が 0.3、0.2、0.1 であり、トップ P 値が 0.5
であるとします。この場合、モデルは温度を使用して A または B を次のトークンとして選択し、C は候補から除外します。
ランダムなレスポンスを減らしたい場合は小さい値を、ランダムなレスポンスを増やしたい場合は大きい値を指定します。
詳細については、topP
をご覧ください。
Top-K
Top-K は、モデルが出力用にトークンを選択する方法を変更します。Top-K が 1
の場合、次に選択されるトークンは、モデルの語彙内のすべてのトークンで最も確率の高いものであることになります(グリーディ デコードとも呼ばれます)。Top-K が 3
の場合は、最も確率が高い上位 3 つのトークンから次のトークン選択されることになります(温度を使用します)。
トークン選択のそれぞれのステップで、最も高い確率を持つ Top-K のトークンがサンプリングされます。その後、トークンはトップ P に基づいてさらにフィルタリングされ、最終的なトークンは温度サンプリングを用いて選択されます。
ランダムなレスポンスを減らしたい場合は小さい値を、ランダムなレスポンスを増やしたい場合は大きい値を指定します。
詳細については、topK
をご覧ください。
温度
温度は、レスポンス生成時のサンプリングに使用されます。レスポンス生成は、topP
と topK
が適用された場合に発生します。温度は、トークン選択のランダム性の度合いを制御します。温度が低いほど、確定的で自由度や創造性を抑えたレスポンスが求められるプロンプトに適しています。一方、温度が高いと、より多様で創造的な結果を導くことができます。温度が 0
の場合、確率が最も高いトークンが常に選択されます。この場合、特定のプロンプトに対するレスポンスはほとんど確定的ですが、わずかに変動する可能性は残ります。
モデルが返すレスポンスが一般的すぎたり、短すぎたり、フォールバック(代替)レスポンスが返ってきたりする場合は、Temperature を高くしてみてください。
温度が低いほど、予測可能な結果が得られます(ただし、完全に確定的ではありません)。詳細については、temperature
をご覧ください。
停止パラメータ
最大出力トークン
レスポンスで生成されるトークン数を制限するには、maxOutputTokens
を設定します。トークンは約 4 文字であるため、100 トークンは約 60 ~ 80 語に相当します。低い値を設定すると、レスポンスの長さを制限できます。
停止シーケンス
stopSequences
で文字列を定義して、レスポンスでいずれかの文字列が検出された場合にテキストの生成を停止するようモデルに指示します。レスポンスで文字列が複数回出現する場合、レスポンスでは最初に見つかった箇所が切り捨てられます。文字列では大文字と小文字が区別されます。
トークンのペナルティ パラメータ
頻度のペナルティ
値が正の場合は、生成されたテキストに繰り返し出現するトークンにペナルティが課されるため、コンテンツが繰り返される確率は低下します。最小値は -2.0
です。最大値は 2.0
の手前の値です。詳細については、frequencyPenalty
をご覧ください。
プレゼンス ペナルティ
値が正の場合は、生成されたテキスト内の既存のトークンにペナルティが課されるため、より多様なコンテンツが生成される確率は高くなります。最小値は -2.0
です。最大値は 2.0
の手前の値です。詳細については、presencePenalty
をご覧ください。
拡張パラメータ
これらのパラメータを使用すると、レスポンスでトークンの詳細情報を返したり、レスポンスのばらつきを制御したりできます。
出力トークンのログ確率
各生成ステップで、最上位の候補トークンのログ確率を返します。モデルが選択したトークンは、各ステップで上位候補トークンとは異なる場合があります。1
~5
の範囲の整数値を使用して、返される候補の数を指定します。詳細については、logprobs
をご覧ください。この機能を使用するには、responseLogprobs
パラメータを true
に設定する必要があります。
responseLogprobs
パラメータは、各ステップでモデルによって選択されたトークンのログ確率を返します。
シード
シードが特定の値に固定されている場合、繰り返されるリクエストに対してモデルはベスト エフォートで同じレスポンスを提供します。確定的な出力は保証されません。また、モデルやパラメータの設定(温度など)を変更すると、同じシード値を使用してもレスポンスが変化することがあります。デフォルトでは、ランダムなシード値が使用されます。詳細については、seed
をご覧ください。