模型调优是调整 Gemini 以更准确地执行特定任务的关键过程。模型调优的工作原理是为模型提供训练数据集,其中包含一组特定下游任务的示例。
本页面简要介绍了 Gemini 的模型调优,介绍了 Gemini 可用的调优选项,并可帮助您确定应在何时使用每个调优选项。
调优模型的好处
模型调优是针对任务自定义大型模型的有效方法。这是提高模型质量和效率的关键步骤。模型调优具有以下优势:
- 针对您的特定任务提供更高的质量。
- 提高模型稳健性。
- 提示较短,因此推理延迟时间和费用更低。
调优与提示设计比较
- 使用预训练的 Gemini 模型发出提示:提示是撰写有效指令的艺术,可以指导 Gemini 等 AI 模型生成所需的输出。这涉及设计提示,以清晰地传达任务、所需格式和任何相关上下文。您只需进行最少的设置即可使用 Gemini 的功能。它最适合的情况:
- 有限的加标签数据:您有少量已加标签的数据或无法承受冗长的微调过程。
- 快速原型设计:当您需要快速测试概念或获取基准性能,而无需投入大量精力进行微调时。
- 自定义 Gemini 模型调优:为了获得更个性化的结果,Gemini 允许您针对特定数据集微调其模型。如需创建在特定领域表现出色的 AI 模型,不妨考虑微调。这涉及使用您自己的标记数据集重新训练基本模型,使其权重适应您的任务和数据。您可以根据自己的应用场景调整 Gemini。 在以下情况下,微调最为有效:
- 您有标记数据:用于训练的可调数据集(例如 100 个示例或更多),可让模型深入学习任务的具体细节。
- 复杂或独特的任务:在高级提示策略不够用且必须根据您的数据量身定制模型的场景中。
我们建议从提示开始找到最佳提示。然后,继续进行微调(如果需要),以进一步提高性能或修复重复错误。虽然添加更多示例可能有益,但在添加更多数据之前,请务必评估模型在哪些方面出错。高质量、准确添加标签的数据对于提高性能和更好的数量都至关重要。此外,用于微调的数据应反映模型在生产环境中将遇到的提示分布、格式和上下文。
与提示设计相比,调优具有以下优势:
- 允许对模型进行深度自定义,从而在特定任务上获得更好的性能。
- 将模型与自定义语法、指令、特定于网域的语义规则保持一致。
- 提供更一致、更可靠的结果。
- 能够一次处理更多示例。
- 通过移除提示中的少量示例、长说明,在推理时节省成本
调优方法
参数高效调优和完全微调是自定义大型模型的两种方法。这两种方法在模型质量和资源效率方面有各自的优势和影响。
参数高效微调
参数高效调优(也称为适配器调优)可让大型模型高效地适应特定任务或领域的需求。参数高效的调优会在调整过程中更新模型参数中相对较小的子集。
如需了解 Vertex AI 如何支持适配器调优和传送,请参阅《大型基础模型自适应》白皮书了解详情。
全面微调
全面微调会更新模型的所有参数,它适合用来调整模型以适应高度复杂的任务,同时尽可能提高任务完成质量。但是,全面微调需要更多计算资源来进行调优和传送,从而导致总体费用更高。
参数高效调优与完全微调对比
与全面微调相比,参数高效调优更省资源且更经济实惠。它训练模型所需的计算资源要少得多。它能够使用较小的数据集更快地调整模型。参数高效调优的灵活性为多任务学习提供了一种解决方案,无需进行大量重新训练。
支持的调优方法
Vertex AI 支持使用监督式微调来自定义基础模型。
监督式微调
监督式微调通过让模型学习新技能来提高模型的性能。此方法使用包含数百个有标签样本的数据来训练模型,让其模拟所需的行为或任务。每个有标签样本均展示您希望模型在推理期间输出的内容。
运行监督式微调作业时,模型会学习其他参数,以便对所需信息进行编码以执行所需任务或学习预期行为。在推理期间会用到这些参数。调优作业的输出是一个新模型,它将新学习的参数与原始模型相结合。
如果模型的输出不复杂且相对容易定义,则对文本模型进行监督式微调是一个不错的选择。建议将监督式微调用于分类、情感分析、实体提取、非复杂内容的总结以及编写特定领域的查询。对于代码模型,只能选择监督式调优。
支持监督式微调的模型
gemini-1.5-pro-002
(正式版)gemini-1.5-flash-002
(正式版)gemini-1.0-pro-002
(处于预览版阶段,仅支持文本调优)
如需详细了解如何将监督式微调与各个模型结合使用,请参阅以下页面:调优文本、图片、音频和文档数据类型。
后续步骤
- 如需详细了解 Gemini 模型的文档理解功能,请参阅文档理解概览。
- 如需开始调优,请参阅使用监督式微调来调优 Gemini 模型
- 如需了解如何在构建生成式 AI 知识库的解决方案中使用监督式微调,请参阅快速起步解决方案:生成式 AI 知识库。