本页介绍了如何为文本和多模态 Gemini 模型设计有效的提示。通过精心设计提示并调整模型参数,您可以引导 Gemini 模型生成高质量、相关且富有创意的输出内容。
如需详细了解如何设计提示,请参阅 Google Cloud 文档中的提示策略概览。
设计文本提示
文本提示是与 Gemini 模型互动的主要方式。精心编写的文本提示可以引导模型生成高质量的相关输出。以下是设计文字提示方面的一些最佳实践:
- 清晰简洁:避免含糊不清和不必要的复杂性。
- 提供背景信息:为模型提供理解您的请求所需的背景信息。
- 指定预期输出:告知模型您希望获得哪种类型的回答(例如摘要、列表或诗歌)。
- 使用关键字:添加相关关键字,帮助模型专注于正确的主题。
- 尝试不同的方法:尝试不同的提示风格和长度,看看哪种效果最佳。
常见的文本提示任务
您可以创建文本提示来处理任意数量的任务,这些任务可归入以下类别:
- 分类:为一段文本分配标签或类别。
- 总结:将较长的文本浓缩为较短的摘要。
- 提取:从文本中提取特定信息。
设计多模态提示
多模态提示将文本与其他模态(例如图片或音频)相结合,可为 Gemini 模型提供更丰富的输入,并实现更复杂、更细致的互动。以下是设计多模态提示的一些最佳实践:
- 选择合适的模态:选择与任务相关且能补充文本提示的模态。
- 对齐模态:确保不同的模态传达的信息一致。
- 考虑顺序:呈现模态的顺序会影响模型的输出。
- 使用适当的格式:以模型能够理解的方式设置提示格式。
调整参数
您可以调整参数来控制 Gemini 模型的输出:
- 词元数上限:用于确定模型在回答中可生成的词元数量上限。较低的值可获得较短的回答,较高的值可获得可能较长的回答。一个 token 约为 4 个字符。
- 温度:控制输出的随机性。温度越高,输出就越具创造性和不可预测性;温度越低,输出就越具确定性和保守性。
- Top-P:可更改模型选择输出 token 的方式,并将模型的词汇限定为累计概率由您定义的一部分 token。
如需详细了解您可以调整的参数,请参阅使用参数进行实验和 API 参数。