プロンプトを設計する

このページでは、テキストとマルチモーダル Gemini モデル用の効果的なプロンプトを設計する方法について説明します。プロンプトを慎重に設計し、モデルのパラメータを調整することで、Gemini モデルを誘導して、高品質で関連性の高いクリエイティブな出力を生成できます。

プロンプトの設計について詳しくは、 Google Cloud ドキュメントのプロンプト戦略の概要をご覧ください。

テキストプロンプトを設計する

テキストプロンプトは、Gemini モデルとやり取りする主な方法です。適切に作成されたテキストプロンプトを使用すると、モデルをガイドして、高品質で関連性の高い出力を生成できます。テキストプロンプトを設計する際のベストプラクティスは次のとおりです。

次のカテゴリに分類できる任意の数のタスクを処理するためのテキストプロンプトを作成できます。

マルチモーダルプロンプトは、テキストと画像や音声などの他のモダリティを組み合わせて、Gemini モデルにリッチな入力を提供し、より複雑でニュアンスのあるやり取りを可能にします。マルチモーダルプロンプトを設計する際のベストプラクティスは次のとおりです。

パラメータを調整して、Gemini モデルの出力を制御できます。

最大トークン数: モデルがレスポンスで生成できるトークンの最大数を決定します。値が小さいほど回答が短くなり、値が大きいほど回答が長くなる可能性があります。トークンは約 4 文字です。
温度: 出力のランダム性を制御します。温度が高いほど、より創造的で予測不可能な出力が生成されます。一方、温度が低いほど、より決定的で保守的な出力が生成されます。
Top-P: モデルが出力用にトークンを選択する方法を変更し、モデルの語彙を、ユーザーが定義した累積確率を持つトークンのサブセットに制限します。

調整可能なパラメータの詳細については、パラメータを試すと API パラメータをご覧ください。