Google Cloud 提供了一系列产品和工具,用于构建具有企业级扩缩能力、安全性和可观测性的生成式 AI 应用。

通过本页面了解开发生成式 AI 应用的阶段,选择最适合您的使用场景的产品和工具,以及获取入门所需的文档。

了解生成式 AI 开发的基础知识

了解如何开发生成式 AI 应用。
了解常见的生成式 AI 使用场景和模型类型。
确定生成式 AI、传统 AI 或两者的组合是否适合您的业务应用场景。
了解如何应对开发生成式 AI 应用的各个阶段的挑战。

为您的生成式 AI 应用选择基础设施

了解哪些产品、框架和工具最适合用于构建您的生成式 AI 应用。云托管生成式 AI 应用中的常见组件包括:

  1. 应用托管:用于托管应用的计算。您的应用可以使用 Google Cloud 的客户端库和 SDK 与不同的 Cloud 产品进行通信。
  2. 模型托管:适用于生成模型的可扩缩且安全的托管。
  3. 模型:用于文本、聊天、图片、代码、嵌入和多模态的生成模型。
  4. 连接解决方案:将模型输出锚定到可验证的更新信息来源。
  5. 数据库:存储应用的数据。您可以通过 SQL 查询增强提示,和/或使用 pgvector 等扩展程序将数据存储为向量嵌入,从而将现有数据库重复用作连接解决方案。
  6. 存储空间:存储图片、视频或静态 Web 前端等文件。您还可以使用存储空间来存储原始依据数据(例如PDF 文件),您稍后会将这些内容转换为嵌入并存储在向量数据库中。

生成式 AI 应用托管基础设施(包括模型及其模型托管基础设施、连接解决方案、数据库、存储和应用托管)的简要概览示意图。

以下部分逐步介绍了每个组件,可帮助您选择要试用的 Google Cloud 产品。

应用托管基础设施

选择一种产品来托管和处理应用工作负载,这将调用生成模型。
决策树,指导用户选择适当的应用托管服务。

开始使用:

模型托管基础设施

Google Cloud 提供了多种方法来托管生成模型,从旗舰级 Vertex AI Platform 到 Google Kubernetes Engine 上的可自定义和可移植托管,不一而足。

决策树,指导用户根据优先级和需求选择正确的云服务托管模型。

开始使用:

模型

Google Cloud 通过 Vertex AI 提供一组先进的基础模型,包括 Gemini。您还可以将第三方模型部署到 Vertex AI Model GardenGKE 上的自托管、Cloud Run 或 Compute Engine。

决策树,指导用户选择 Vertex AI 服务来生成文本或代码,并提供使用文本嵌入、图片或视频的选项。

开始使用:

落地

为确保获得可靠且准确的模型回答,您可能需要使用实时数据增强您的生成式 AI 应用。这称为检索增强生成 (RAG)。

您可以在向量数据库中使用自己的数据实现增强功能,这是相似度搜索等操作的最佳格式。Google Cloud 针对不同的使用场景提供多种向量数据库解决方案。

注意:您还可以使用传统(非向量)数据库增强应用,只需查询 Cloud SQL 或 Firestore 等现有数据库,并在模型提示中使用结果即可。

决策树,指导用户根据自己的需求选择合适的向量数据库解决方案。

开始使用:

使用 API 建立依据

许多在线服务都提供用于检索基础数据以增强模型提示的 API,而不是(或额外)使用您自己的数据作为基础。
创建、部署和管理将大语言模型连接到外部系统的 API 的扩展程序。
探索适用于生成式 AI 应用的各种文档加载器API 集成,包括 YouTubeGoogle 学术搜索等等。
如果您使用的是托管在 Vertex AI 中的模型,则可以使用 Vertex AI Search、Google 搜索或内嵌/文件内文本作为模型回答的基础。

开始构建

设置开发环境

安装在 Google Cloud 上构建生成式 AI 应用所需的工具。
用于设置本地开发环境以及与 Cloud API 交互的命令行工具。
在 IDE 中查看 API 文档和示例,并加快 GKE 和 Cloud Run 本地开发速度。
了解如何从本地环境和托管的工作负载向 Google Cloud API 进行身份验证。
LangChain 是一个适用于生成式 AI 应用的开源框架,使您可以将上下文构建到提示中,并根据模型的回答采取行动。

设计提示并评估模型

了解提示设计策略,并使用不同的模型进行试验。
了解为不同的数据类型(从文本和代码到多模态)设计提示的策略。
了解如何在 Vertex AI Studio 中设计、测试和管理提示。
查看数十个提示示例,这些示例涵盖分类、构思和摘要等应用场景。
探索产生、构思和交流新想法的提示示例。

代码示例

在 GitHub 上创建一个示例分支,然后开始构建。

了解如何使用 Vertex AI Agent Builder 和 Firebase 构建基于网络的问答聊天机器人。

新手 Node.js

了解如何构建一个简单的 Python Flask 应用,以在 Vertex AI 中调用预训练的基础模型。

新手 Python

在 Vertex AI、Cloud Run 和 Streamlit 上使用 Gemini 构建 Web 应用,以生成营销活动创意。

新手 Python

了解如何使用 Vertex AI Search 和 LangChain 将模型提示连接到可验证的知识来源(Google Cloud 白皮书)。

中级 Python

了解如何实现函数调用,即使用 LLM 填充请求正文,然后将其发送到外部 API 的过程。

中级 Python

使用 AlloyDB for PostgreSQL 和 Vertex AI 进行检索增强生成的示例应用。(博文Codelab)。

中级 Python

架构指南和快速起步解决方案

安全、高效、弹性佳、高性能且经济实惠的生成式 AI 应用的建议和示例。

使用此参考架构来设计基础架构,以使用 Vertex AI 和 AlloyDB for PostgreSQL 运行具有检索增强生成 (RAG) 功能的生成式 AI 应用。

中级

使用此参考架构来设计基础设施,以使用 GKE、Cloud SQL 以及开源工具(Ray、Huging Face 和 LangChain 等)运行具有检索增强生成 (RAG) 功能的生成式 AI 应用。

中级

本文档提供了有关如何使用和集成 Google Cloud 为关键 AI 和机器学习工作负载提供的各种存储方案的设计指导。

高级

部署一键式示例应用,以使用 Vertex AI 汇总长文档。

中级

部署一键式示例应用,该应用使用存储在 Cloud SQL 中的矢量嵌入,来提高聊天应用的响应准确率。

中级

部署用于从一组文档中提取问答对的一键式示例应用,以及在上传文档时触发该应用的流水线。

中级