基础模型(有时称为基模型)是强大的人工智能 (AI) 模型,它们基于海量数据进行训练,并能够适应多种任务。“基础模型”一词由斯坦福以人为本人工智能研究院 (HAI) 于 2021 年提出。
这项技术为各行各业带来了新的可能性,从简化软件开发到改善客户服务互动。
基础模型是一类 AI 模型,基于大量数据进行预训练,从而能够执行多种任务。这种训练过程通常采用自监督学习,使模型能够学习数据中的复杂模式和关系,从而以更高的准确率执行多种任务。更重要的是,这种大规模可能带来涌现能力,即模型能够完成并未经过明确训练的任务。这种从专用工具向适应性更强的通用模型的转变,是基础模型范式的显著特征。
“基础模型”和大语言模型 (LLM) 这两个术语经常互换使用,但它们之间存在一个关键区别。LLM 是基础模型的一种主要类型,但并非唯一类型。您可以将其视为一种父子关系:所有 LLM 都是基础模型,但并非所有基础模型都是 LLM。
主要区别在于它们所基于的数据类型。顾名思义,LLM 专门使用大量文本和代码进行训练。“基础模型”这一更广泛的类别还包括基于其他数据类型(如图片、音频和视频)或这些数据类型的组合(多模态)训练的模型。
生成式 AI 和基础模型是不同的概念,但密切相关。理解两者区别的最佳方式是将它们分别视为“引擎”和“功能”:
虽然大多数热门基础模型都用于生成任务,但基础模型也可以用于非生成目的,例如复杂分类或分析。因此,并非所有基础模型本质上都是生成式的,但它们是推动当前生成式 AI 应用浪潮的关键技术。
基础模型包含各种架构,每种架构都具有独特的优势和应用。以下是一些值得注意的类型:
基础模型基于庞大的数据集,采用自监督学习方法进行训练。自监督学习是一种机器学习方法,它利用无监督学习技术来完成传统上需要监督学习的任务(例如,通过人工输入为数据加上标签)。这有助于训练模型预测输入数据中被掩盖或缺失的部分。随着模型不断进行预测,它会学习识别数据中的模式、关系以及底层结构。
基础模型的训练过程与机器学习模型的训练过程类似,通常包括以下几个关键步骤:
基础模型可为企业和开发者带来以下几项潜在优势:
用途广泛
基础模型能够适应多种任务,无需为每个具体应用单独训练模型。这种适应性使它们在各行各业及多种应用场景中都具有价值。
提升效率
使用预训练的基础模型可以显著减少开发新 AI 应用所需的时间和资源。微调预训练模型通常比从头开始训练模型更快、更高效。
准确率
由于基础模型在庞大数据集上进行了广泛训练,因此能够在各种任务中实现高准确率,性能优于在小数据集上训练的模型。
成本效益
基础模型可以减少对大量训练数据和计算资源的需求,为开发 AI 应用提供经济高效的解决方案。
创新
基础模型正在推动 AI 领域的创新,有助于开发出新的、更复杂的 AI 应用。
可伸缩性
基础模型可以扩展以处理大型数据集和复杂任务,因此适用于高要求的应用。
尽管基础模型具有显著优势,但用户和开发者必须应对以下重大挑战:
基础模型生态系统充满活力,竞争激烈。以下是一些来自主要行业参与者的最具影响力的示例:
Google Cloud 提供端到端企业平台 Vertex AI,旨在帮助组织访问、自定义和部署基础模型,以用于实际应用。该策略建立在提供多样化选择、强大工具和集成式基础设施的基础之上。
Google Cloud 使用基础模型的方式如下: