设计提示

本页介绍了如何为文本和多模态 Gemini 模型设计有效的提示。通过精心设计提示并调整模型参数,您可以引导 Gemini 模型生成高质量、相关且富有创意的输出内容。

如需详细了解如何设计提示,请参阅 Google Cloud 文档中的提示策略概览

设计文本提示

文本提示是与 Gemini 模型互动的主要方式。精心编写的文本提示可以引导模型生成高质量的相关输出。以下是设计文字提示方面的一些最佳实践:

  • 清晰简洁:避免含糊不清和不必要的复杂性。
  • 提供背景信息:为模型提供理解您的请求所需的背景信息。
  • 指定预期输出:告知模型您希望获得哪种类型的回答(例如摘要、列表或诗歌)。
  • 使用关键字:添加相关关键字,帮助模型专注于正确的主题。
  • 尝试不同的方法:尝试不同的提示风格和长度,看看哪种效果最佳。

常见的文本提示任务

您可以创建文本提示来处理任意数量的任务,这些任务可归入以下类别:

  • 分类:为一段文本分配标签或类别。
  • 总结:将较长的文本浓缩为较短的摘要。
  • 提取:从文本中提取特定信息。

设计多模态提示

多模态提示将文本与其他模态(例如图片或音频)相结合,可为 Gemini 模型提供更丰富的输入,并实现更复杂、更细致的互动。以下是设计多模态提示的一些最佳实践:

  • 选择合适的模态:选择与任务相关且能补充文本提示的模态。
  • 对齐模态:确保不同的模态传达的信息一致。
  • 考虑顺序:呈现模态的顺序会影响模型的输出。
  • 使用适当的格式:以模型能够理解的方式设置提示格式。

调整参数

您可以调整参数来控制 Gemini 模型的输出:

  • 词元数上限:用于确定模型在回答中可生成的词元数量上限。较低的值可获得较短的回答,较高的值可获得可能较长的回答。一个 token 约为 4 个字符。
  • 温度:控制输出的随机性。温度越高,输出就越具创造性和不可预测性;温度越低,输出就越具确定性和保守性。
  • Top-P:可更改模型选择输出 token 的方式,并将模型的词汇限定为累计概率由您定义的一部分 token。

如需详细了解您可以调整的参数,请参阅使用参数进行实验API 参数

后续步骤