为您的生成式 AI 应用选择基础设施
了解哪些产品、框架和工具最适合用于构建您的生成式 AI 应用。云托管生成式 AI 应用中的常见组件包括:
- 应用托管:用于托管应用的计算。您的应用可以使用 Google Cloud 的客户端库和 SDK 与不同的 Cloud 产品进行通信。
- 模型托管:适用于生成模型的可扩缩且安全的托管。
- 模型:用于文本、聊天、图片、代码、嵌入和多模态的生成模型。
- 连接解决方案:将模型输出锚定到可验证的更新信息来源。
- 数据库:存储应用的数据。您可以通过 SQL 查询增强提示,或使用 pgvector 等扩展程序将数据存储为向量嵌入,从而将现有数据库重复用作连接解决方案。
- 存储空间:存储图片、视频或静态 Web 前端等文件。您还可以使用存储空间来存储原始依据数据(例如PDF 文件),您稍后会将这些内容转换为嵌入并存储在向量数据库中。
以下部分逐步介绍了每个组件,可帮助您选择要试用的 Google Cloud 产品。
应用托管基础设施
选择一种产品来托管和处理应用工作负载,这将调用生成模型。
开始使用:
模型托管基础设施
Google Cloud 提供了多种方法来托管生成模型,从旗舰级 Vertex AI Platform 到 Google Kubernetes Engine 上的可自定义和可移植托管,不一而足。
开始使用:
模型
Google Cloud 通过 Vertex AI 提供一组先进的基础模型,包括 Gemini。您还可以将第三方模型部署到 Vertex AI Model Garden 或 GKE 上的自托管、Cloud Run 或 Compute Engine。
开始使用:
- Gemini
- Codey
- Imagen
- 文本嵌入
- Vertex AI Model Garden(开源模型)
- Hugging Face Model Hub(开源模型)
落地
为确保获得可靠且准确的模型回答,您可能需要使用实时数据来增强您的生成式 AI 应用。这称为检索增强生成 (RAG)。
您可以在向量数据库中使用自己的数据实现增强功能,这是相似度搜索等操作的最佳格式。Google Cloud 针对不同的使用场景提供多种向量数据库解决方案。
注意:您还可以使用传统(非向量)数据库增强应用,方法是查询 Cloud SQL 或 Firestore 等现有数据库,并在模型提示中使用结果。
开始使用:
- Vertex AI Agent Builder(原 Enterprise Search、Gen AI App Builder、Discovery Engine)
- Vector Search(原 Matching Engine)
- AlloyDB for PostgreSQL
- Cloud SQL
- BigQuery
使用 API 建立依据
许多在线服务都提供用于检索基础数据以增强模型提示的 API,而不是(或额外)使用您自己的数据作为基础。
Vertex AI Extensions(非公开预览版)
创建、部署和管理将大语言模型连接到外部系统的 API 的扩展程序。
LangChain 组件
探索适用于生成式 AI 应用的各种文档加载器和 API 集成,包括 YouTube 和 Google 学术搜索等等。
Vertex AI 中的依据
如果您使用的是托管在 Vertex AI 中的模型,则可以使用 Vertex AI Search、Google 搜索或内嵌/文件内文本作为模型回答的基础。
开始构建
为 Google Cloud 设置开发环境
设置 LangChain
LangChain 是一个适用于生成式 AI 应用的开源框架,使您可以将上下文构建到提示中,并根据模型的回答采取行动。
查看代码示例和部署示例应用
查看常见用例的代码示例和生成式 AI 应用的部署示例,这些示例安全、高效、弹性佳、高性能且经济实惠。