为您的生成式 AI 应用选择基础设施

了解哪些产品、框架和工具最适合用于构建您的生成式 AI 应用。云托管生成式 AI 应用中的常见组件包括:

  1. 应用托管:用于托管应用的计算。您的应用可以使用 Google Cloud 的客户端库和 SDK 与不同的 Cloud 产品进行通信。
  2. 模型托管:适用于生成模型的可扩缩且安全的托管。
  3. 模型:用于文本、聊天、图片、代码、嵌入和多模态的生成模型。
  4. 连接解决方案:将模型输出锚定到可验证的更新信息来源。
  5. 数据库:存储应用的数据。您可以通过 SQL 查询增强提示,或使用 pgvector 等扩展程序将数据存储为向量嵌入,从而将现有数据库重复用作连接解决方案。
  6. 存储空间:存储图片、视频或静态 Web 前端等文件。您还可以使用存储空间来存储原始依据数据(例如PDF 文件),您稍后会将这些内容转换为嵌入并存储在向量数据库中。

生成式 AI 应用托管基础设施(包括模型及其模型托管基础设施、连接解决方案、数据库、存储和应用托管)的简要概览示意图。

以下部分逐步介绍了每个组件,可帮助您选择要试用的 Google Cloud 产品。

应用托管基础设施

选择一种产品来托管和处理应用工作负载,这将调用生成模型。

决策树,指导用户选择适当的应用托管服务。

开始使用:

模型托管基础设施

Google Cloud 提供了多种方法来托管生成模型,从旗舰级 Vertex AI Platform 到 Google Kubernetes Engine 上的可自定义和可移植托管,不一而足。

决策树,指导用户根据优先级和需求选择正确的云服务托管模型。

开始使用:

模型

Google Cloud 通过 Vertex AI 提供一组先进的基础模型,包括 Gemini。您还可以将第三方模型部署到 Vertex AI Model GardenGKE 上的自托管、Cloud Run 或 Compute Engine。

决策树,指导用户选择 Vertex AI 服务来生成文本或代码,并提供使用文本嵌入、图片或视频的选项。

开始使用:

落地

为确保获得可靠且准确的模型回答,您可能需要使用实时数据增强您的生成式 AI 应用。这称为检索增强生成 (RAG)。

您可以在向量数据库中使用自己的数据实现增强功能,这是相似度搜索等操作的最佳格式。Google Cloud 针对不同的使用场景提供多种向量数据库解决方案。

注意:您还可以使用传统(非向量)数据库增强应用,方法是查询 Cloud SQL 或 Firestore 等现有数据库,并在模型提示中使用结果。

决策树,指导用户根据自己的需求选择合适的向量数据库解决方案。

开始使用:

使用 API 建立依据

许多在线服务都提供用于检索基础数据以增强模型提示的 API,而不是(或额外)使用您自己的数据作为基础。

Vertex AI Extensions(非公开预览版)

创建、部署和管理将大语言模型连接到外部系统的 API 的扩展程序。

LangChain 组件

探索适用于生成式 AI 应用的各种文档加载器API 集成,包括 YouTubeGoogle 学术搜索等等。

Vertex AI 中的依据

如果您使用的是托管在 Vertex AI 中的模型,则可以使用 Vertex AI Search、Google 搜索或内嵌/文件内文本作为模型回答的基础。

开始构建

为 Google Cloud 设置开发环境

设置 LangChain

LangChain 是一个适用于生成式 AI 应用的开源框架,使您可以将上下文构建到提示中,并根据模型的回答采取行动。

查看代码示例和部署示例应用

查看常见用例的代码示例和生成式 AI 应用的部署示例,这些示例安全、高效、弹性佳、高性能且经济实惠。