在 Google Cloud 上构建生成式 AI 应用
Google Cloud 提供了一系列产品和工具,用于构建具有企业级扩缩能力、安全性和可观测性的生成式 AI 应用。
通过本页面了解开发生成式 AI 应用的阶段,选择最适合您的使用场景的产品和工具,以及获取入门所需的文档。
了解生成式 AI 开发的基础知识
何时使用生成式 AI 或传统 AI
生成式 AI 应用开发概览
为您的生成式 AI 应用选择基础设施
了解哪些产品、框架和工具最适合用于构建您的生成式 AI 应用。云托管生成式 AI 应用中的常见组件包括:
- 应用托管:用于托管应用的计算。您的应用可以使用 Google Cloud 的客户端库和 SDK 与不同的 Cloud 产品进行通信。
- 模型托管:适用于生成模型的可扩缩且安全的托管。
- 模型:用于文本、聊天、图片、代码、嵌入和多模态的生成模型。
- 连接解决方案:将模型输出锚定到可验证的更新信息来源。
- 数据库:存储应用的数据。您可以通过 SQL 查询增强提示,和/或使用 pgvector 等扩展程序将数据存储为向量嵌入,从而将现有数据库重复用作连接解决方案。
- 存储空间:存储图片、视频或静态 Web 前端等文件。您还可以使用存储空间来存储原始依据数据(例如PDF 文件),您稍后会将这些内容转换为嵌入并存储在向量数据库中。
以下部分逐步介绍了每个组件,可帮助您选择要试用的 Google Cloud 产品。
应用托管基础设施
开始使用:
模型托管基础设施
开始使用:
模型
开始使用:
- Gemini
- Codey
- Imagen
- 文本嵌入
- Vertex AI Model Garden(开源模型)
- HuggingFace Model Hub(开源模型)
落地
为确保获得可靠且准确的模型回答,您可能需要使用实时数据来增强您的生成式 AI 应用。这称为检索增强生成 (RAG)。
您可以在向量数据库中使用自己的数据实现增强功能,这是相似度搜索等操作的最佳格式。Google Cloud 针对不同的使用场景提供多种向量数据库解决方案。
注意:您还可以使用传统(非向量)数据库增强应用,只需查询 Cloud SQL 或 Firestore 等现有数据库,并在模型提示中使用结果即可。
开始使用:
- Vertex AI Agent Builder(原 Enterprise Search、Gen AI App Builder、Discovery Engine)
- Vector Search(原 Matching Engine)
- AlloyDB for PostgreSQL
- Cloud SQL
- BigQuery
使用 API 建立依据
Vertex AI Extensions(非公开预览版)
Vertex AI 中的依据
开始构建
设置开发环境
安装 Google Cloud CLI
在 IDE 中安装 Cloud Code 扩展程序
设置身份验证
设置 LangChain
设计提示并评估模型
提示设计简介
Vertex AI Studio
生成式 AI 提示示例
使用 Vertex AI 上的生成模型进行构思
代码示例
Web 聊天机器人:回答有关 Google 商店的问题
了解如何使用 Vertex AI Agent Builder 和 Firebase 构建基于网络的问答聊天机器人。
使用 Eventarc 和 Vertex AI 的聊天应用
了解如何构建一个简单的 Python Flask 应用,以在 Vertex AI 中调用预训练的基础模型。
使用 Gemini 生成营销活动
在 Vertex AI、Cloud Run 和 Streamlit 上使用 Gemini 构建 Web 应用,以生成营销活动创意。
包含《MLOps 从业人员指南》的问答应用
了解如何使用 Vertex AI Search 和 LangChain 将模型提示连接到可验证的知识来源(Google Cloud 白皮书)。
Weather API 请求帮助程序:使用 Gemini 进行函数调用
了解如何实现函数调用,即使用 LLM 填充请求正文,然后将其发送到外部 API 的过程。
架构指南和快速起步解决方案
使用 Vertex AI 且支持 RAG 的生成式 AI 应用的基础设施
使用此参考架构来设计基础架构,以使用 Vertex AI 和 AlloyDB for PostgreSQL 运行具有检索增强生成 (RAG) 功能的生成式 AI 应用。
使用 GKE 且支持 RAG 的生成式 AI 应用的基础设施
使用此参考架构来设计基础设施,以使用 GKE、Cloud SQL 以及开源工具(Ray、Huging Face 和 LangChain 等)运行具有检索增强生成 (RAG) 功能的生成式 AI 应用。
为 Google Cloud 中的 AI 和机器学习工作负载设计存储
本文档提供了有关如何使用和集成 Google Cloud 为关键 AI 和机器学习工作负载提供的各种存储方案的设计指导。
快速起步解决方案:文档汇总
部署一键式示例应用,以使用 Vertex AI 汇总长文档。
快速起步解决方案:Generative AI RAG with Cloud SQL
部署一键式示例应用,该应用使用存储在 Cloud SQL 中的矢量嵌入,来提高聊天应用的响应准确率。
快速起步解决方案:生成式 AI 知识库
部署用于从一组文档中提取问答对的一键式示例应用,以及在上传文档时触发该应用的流水线。