为您的生成式 AI 应用选择模型和基础架构
应用托管:用于托管应用的计算。您的应用可以使用 Google Cloud 的客户端库和 SDK 与不同的 Cloud 产品进行通信。
模型托管:适用于生成模型的可扩缩且安全的托管。
模型:用于文本、聊天、图片、代码、嵌入和多模态的生成模型。
连接解决方案:将模型输出锚定到可验证的更新信息来源。
数据库:存储应用的数据。您可以通过 SQL 查询增强提示,和/或使用 pgvector 等扩展程序将数据存储为向量嵌入,从而将现有数据库重复用作连接解决方案。
存储空间:存储图片、视频或静态 Web 前端等文件。您还可以使用存储空间来存储原始依据数据(例如PDF 文件),您稍后会将这些内容转换为嵌入并存储在向量数据库中。
以下部分逐步介绍了每个组件,可帮助您选择要试用的 Google Cloud 产品。
应用托管基础设施
选择一种产品来托管和处理应用工作负载,这将调用生成模型。
模型托管基础设施
Google Cloud 提供了多种方法来托管生成模型,从旗舰级 Vertex AI Platform 到 Google Kubernetes Engine 上的可自定义和可移植托管,不一而足。
模型
Google Cloud 通过 Vertex AI 提供一组先进的基础模型,包括 Gemini。您还可以将第三方模型部署到 Vertex AI Model Garden 或 GKE 上的自托管、Cloud Run 或 Compute Engine。
落地
为确保获得可靠且准确的模型回答,您可能需要使用实时数据来增强您的生成式 AI 应用。这称为检索增强生成 (RAG)。
您可以在向量数据库中使用自己的数据实现增强功能,这是相似度搜索等操作的最佳格式。Google Cloud 针对不同的使用场景提供多种向量数据库解决方案。
注意:您还可以使用传统(非向量)数据库增强应用,只需查询 Cloud SQL 或 Firestore 等现有数据库,并在模型提示中使用结果即可。
您的数据是否通过程序化方式访问 (OLTP)?已在使用 SQL 数据库?
想直接从数据库中使用 Google AI 模型?需要低延迟?
使用 API 建立依据
Vertex AI Extensions(非公开预览版)
Vertex AI 中的依据
开始构建
设置 LangChain
LangChain 是一个适用于生成式 AI 应用的开源框架,使您可以将上下文构建到提示中,并根据模型的回答采取行动。
查看代码示例和部署示例应用
查看常见用例的代码示例和生成式 AI 应用的部署示例,这些示例安全、高效、弹性佳、高性能且经济实惠。