为您的生成式 AI 应用选择模型和基础架构

了解哪些产品、框架和工具最适合用于构建您的生成式 AI 应用。下图显示了云托管生成式 AI 应用中的常见组件。
显示生成式 AI 系统组件的 Venn 图 显示生成式 AI 系统组件的 Venn 图
  1. 应用托管:用于托管应用的计算。您的应用可以使用 Google Cloud 的客户端库和 SDK 与不同的 Cloud 产品进行通信。

  2. 模型托管:适用于生成模型的可扩缩且安全的托管。

  3. 模型:用于文本、聊天、图片、代码、嵌入和多模态的生成模型。

  4. 连接解决方案:将模型输出锚定到可验证的更新信息来源。

  5. 数据库:存储应用的数据。您可以通过 SQL 查询增强提示,和/或使用 pgvector 等扩展程序将数据存储为向量嵌入,从而将现有数据库重复用作连接解决方案。

  6. 存储空间:存储图片、视频或静态 Web 前端等文件。您还可以使用存储空间来存储原始依据数据(例如PDF 文件),您稍后会将这些内容转换为嵌入并存储在向量数据库中。

以下部分逐步介绍了每个组件,可帮助您选择要试用的 Google Cloud 产品。

应用托管基础设施

选择一种产品来托管和处理应用工作负载,这将调用生成模型。

想要使用托管式无服务器基础架构?

关闭
检查
Cloud Run
关闭

您的应用是否可以容器化?

关闭
检查
Kubernetes Engine
关闭

模型托管基础设施

Google Cloud 提供了多种方法来托管生成模型,从旗舰级 Vertex AI Platform 到 Google Kubernetes Engine 上的可自定义和可移植托管,不一而足。

使用 Gemini 且需要企业功能(例如扩缩、安全性、数据隐私和可观测性)

检查
关闭
Gemini Developer API
检查

想要使用全托管式基础架构以及一流的生成式 AI 工具和 API?

关闭
检查
Vertex AI
关闭

您的模型是否需要专用内核、旧版操作系统或特殊的许可条款?

关闭
检查
Compute Engine
关闭

模型

Google Cloud 通过 Vertex AI 提供一组先进的基础模型,包括 Gemini。您还可以将第三方模型部署到 Vertex AI Model GardenGKE 上的自托管、Cloud Run 或 Compute Engine。

要生成代码?

关闭
检查
Codey (Vertex AI)
关闭

要生成图片?

关闭
检查
Imagen (Vertex AI)
关闭

要为搜索、分类或聚类生成嵌入吗?

关闭
检查
文本嵌入 (Vertex AI)
关闭

好,您想生成文本。您想在文字提示中添加图片或视频吗?(多模态)

关闭
检查
Gemini (Vertex AI)
关闭

好,只显示文本提示。想要利用 Google 最强大的旗舰模型?

关闭
检查
Gemini (Vertex AI)
关闭

落地

为确保获得可靠且准确的模型回答,您可能需要使用实时数据增强您的生成式 AI 应用。这称为检索增强生成 (RAG)

您可以在向量数据库使用自己的数据实现增强功能,这是相似度搜索等操作的最佳格式。Google Cloud 针对不同的使用场景提供多种向量数据库解决方案。

注意:您还可以使用传统(非向量)数据库增强应用,只需查询 Cloud SQL 或 Firestore 等现有数据库,并在模型提示中使用结果即可。

想要一个简单的解决方案,而无需访问底层嵌入式对象?

关闭
检查
Vertex AI Search & Conversation
关闭

您是需要低延迟向量搜索、大规模提供,还是想要使用专用向量数据库?

关闭
检查
Vertex AI Vector Search
关闭

您的数据是否通过程序化方式访问 (OLTP)?已在使用 SQL 数据库?

关闭
检查

想直接从数据库中使用 Google AI 模型?需要低延迟?

检查
关闭
关闭

拥有大型分析数据集 (OLAP)?需要批量处理,并且需要人工或脚本(数据科学)频繁访问 SQL 表?

检查
BigQuery

使用 API 建立依据

许多在线服务都提供用于检索基础数据以增强模型提示的 API,而不是(或额外)使用您自己的数据作为基础。
创建、部署和管理将大语言模型连接到外部系统的 API 的扩展程序。
探索适用于生成式 AI 应用的各种文档加载器API 集成,包括 YouTubeGoogle 学术搜索等等。
如果您使用的是托管在 Vertex AI 中的模型,则可以使用 Vertex AI Search、Google 搜索或内嵌/文件内文本作为模型回答的基础。

开始构建

LangChain 是一个适用于生成式 AI 应用的开源框架,使您可以将上下文构建到提示中,并根据模型的回答采取行动。

查看常见用例的代码示例和生成式 AI 应用的部署示例,这些示例安全、高效、弹性佳、高性能且经济实惠。