使用 LangChain 构建依托 LLM 的应用

本页面介绍了如何使用 LangChain 构建依托 LLM 的应用。本页上的概览链接到 GitHub 中的过程指南。

什么是 LangChain?

LangChain 是一个 LLM 编排框架,可帮助开发者构建生成式 AI 应用或检索增强生成 (RAG) 工作流。它提供了可简化复杂大型语言模型 (LLM) 工作流的结构、工具和组件。如需详细了解 LLM、其用例以及 Google 提供的特定模型和服务,请参阅 Google Cloud中 LLM 概念和服务的概览

如需详细了解 LangChain,请参阅 Google LangChain 页面。如需详细了解 LangChain 框架,请参阅 LangChain 产品文档。

适用于 AlloyDB 的 LangChain 组件

如需了解如何使用 LangChain,请参阅适用于 AlloyDB 的 LangChain 快速入门。本快速入门将创建一款可访问 Netflix 电影数据集的应用,以便用户与电影数据进行互动。

AlloyDB 的矢量存储区

矢量存储区从矢量数据库中检索并存储文档和元数据。矢量存储区让应用能够执行解释用户查询含义的语义搜索。这种类型的搜索称为矢量搜索,它可以查找在概念上与查询匹配的主题。查询时,矢量存储区会检索与搜索请求的嵌入最相似的嵌入矢量。在 LangChain 中,矢量存储区负责存储嵌入的数据并为您执行矢量搜索。

如需在 AlloyDB 中使用矢量存储区,请使用 AlloyDBVectorStore 类。

如需了解详情,请参阅 LangChain 矢量存储区产品文档。

矢量存储区过程指南

关于矢量存储区的 AlloyDB 指南介绍了如何执行以下操作:

  • 安装集成软件包和 LangChain
  • 创建 AlloyDBEngine 对象并为 AlloyDB 数据库配置连接池
  • 为矢量存储区初始化表
  • 使用 VertexAIEmbeddings 设置嵌入服务
  • 初始化 AlloyDBVectorStore
  • 添加和删除文档
  • 搜索类似文档
  • 添加向量索引以提高搜索性能
  • 创建一个自定义矢量存储,以连接到包含矢量嵌入表的现有 AlloyDB for PostgreSQL 数据库

AlloyDB 的文档加载器

文档加载器会保存、加载和删除 LangChain Document 对象。例如,您可以将要处理的数据加载到嵌入中,并将其存储在矢量存储区,或将其用作向链提供特定上下文的工具。

如需从 AlloyDB 加载文档,请使用 AlloyDBLoader 类。AlloyDBLoader 从表中返回文档列表,第一列用于网页内容,所有其他列用于元数据。默认表的第一列是网页内容,第二列是 JSON 元数据。每一行都是一个文档。如需了解如何自定义这些设置,请参阅流程指南

使用 AlloyDBSaver 类来保存和删除文档。

如需了解详情,请参阅 LangChain 文档加载器主题。

文档加载器过程指南

关于文档加载器的 AlloyDB 指南介绍了如何执行以下操作:

  • 安装集成软件包和 LangChain
  • 从表中加载文档
  • 向加载器添加过滤条件
  • 自定义连接和身份验证
  • 通过指定客户内容和元数据来自定义文档构造
  • 如何使用并自定义 AlloyDBSaver 来存储和删除文档

AlloyDB 的 Chat 消息记录

问答应用需要对话中所述内容的历史记录,以便提供应用上下文来回答用户的其他问题。LangChain ChatMessageHistory 类可让应用将消息保存到数据库,并在需要时检索消息来编制更多答案。消息可以是问题、答案、陈述句、问候语或者用户或应用在对话期间提供的其他任何一段文字。ChatMessageHistory 会存储每条消息,并将每个对话的消息链接在一起。

AlloyDB 使用 AlloyDBChatMessageHistory 扩展此类。

聊天消息记录过程指南

关于聊天消息记录的 AlloyDB 指南介绍了如何执行以下操作:

  • 安装集成软件包和 LangChain
  • 创建 AlloyDBEngine 对象并为 AlloyDB 数据库配置连接池
  • 初始化表
  • 初始化 AlloyDBChatMessageHistory 类以添加和删除消息
  • 使用 LangChain 表达式语言 (LCEL) 创建消息记录链