生成式 AI | Generative AI | Google Cloud

English
Deutsch
Español – América Latina
Français
Indonesia
Italiano
Português – Brasil
中文 – 简体
日本語
한국어

控制台

联系我们免费开始使用吧

为您的生成式 AI 应用选择模型和基础架构

了解哪些产品、框架和工具最适合用于构建您的生成式 AI 应用。下图显示了云托管生成式 AI 应用中的常见组件。

显示生成式 AI 系统组件的 Venn 图

显示生成式 AI 系统组件的 Venn 图

应用托管：用于托管应用的计算。您的应用可以使用 Google Cloud 的客户端库和 SDK 与不同的 Cloud 产品进行通信。
模型托管：适用于生成模型的可扩缩且安全的托管。
模型：用于文本、聊天、图片、代码、嵌入和多模态的生成模型。
连接解决方案：将模型输出锚定到可验证的更新信息来源。
数据库：存储应用的数据。您可以通过 SQL 查询增强提示，和/或使用 pgvector 等扩展程序将数据存储为向量嵌入，从而将现有数据库重复用作连接解决方案。
存储空间：存储图片、视频或静态 Web 前端等文件。您还可以使用存储空间来存储原始依据数据（例如PDF 文件），您稍后会将这些内容转换为嵌入并存储在向量数据库中。

以下部分逐步介绍了每个组件，可帮助您选择要试用的 Google Cloud 产品。

应用托管基础设施

选择一种产品来托管和处理应用工作负载，这将调用生成模型。

想要使用托管式无服务器基础架构？

关闭

检查

关闭

您的应用是否可以容器化？

关闭

检查

Kubernetes Engine

关闭

模型托管基础设施

Google Cloud 提供了多种方法来托管生成模型，从旗舰级 Vertex AI Platform 到 Google Kubernetes Engine 上的可自定义和可移植托管，不一而足。

使用 Gemini 且需要企业功能（例如扩缩、安全性、数据隐私和可观测性）

检查

关闭

Gemini Developer API

检查

想要使用全托管式基础架构以及一流的生成式 AI 工具和 API？

关闭

检查

关闭

您的模型是否需要专用内核、旧版操作系统或特殊的许可条款？

关闭

检查

关闭

Kubernetes Engine

模型

Google Cloud 通过 Vertex AI 提供一组先进的基础模型，包括 Gemini。您还可以将第三方模型部署到 Vertex AI Model Garden 或 GKE 上的自托管、Cloud Run 或 Compute Engine。

要生成代码？

关闭

检查

Codey (Vertex AI)

关闭

要生成图片？

关闭

检查

Imagen (Vertex AI)

关闭

要为搜索、分类或聚类生成嵌入吗？

关闭

检查

文本嵌入 (Vertex AI)

关闭

好，您想生成文本。您想在文字提示中添加图片或视频吗？（多模态）

关闭

检查

Gemini (Vertex AI)

关闭

好，只显示文本提示。想要利用 Google 最强大的旗舰模型？

关闭

检查

Gemini (Vertex AI)

关闭

将开源模型部署到：Vertex AI (Model Garden) GKE (HuggingFace)

建立依据和 RAG

为确保获得可靠且准确的模型回答，请使用实时数据来增强您的生成式 AI 应用。这称为检索增强生成 (RAG)。

如果您想生成基于互联网最新信息的内容，Gemini 模型可以评估模型的知识是否足够或是否需要借助 Google 搜索建立依据。

您可以使用搜索引擎对数据进行索引来建立依据。许多搜索引擎现在将嵌入存储在向量数据库中，这是相似度搜索等操作的最佳格式。 Google Cloud 针对不同的使用场景提供多种向量数据库解决方案。

注意：您可以使用非向量数据库增强应用，方法是查询 Cloud SQL 或 Firestore 等现有数据库，并在模型提示中使用查询结果。

您是否想要一个全托管式优化解决方案，该解决方案支持大多数数据源，并可防止直接访问底层嵌入式对象？

关闭

检查

Vertex AI Search

关闭

您正在为 RAG 构建搜索引擎

您是否希望使用具有类似 LlamaIndex 界面的托管式编排程序构建 RAG 搜索引擎？

关闭

检查

Vertex AI RAG 引擎

关闭

您可以使用参考架构为 RAG 使用场景构建量身定制的搜索引擎和向量数据库。

关闭

您是需要低延迟向量搜索、大规模提供服务，还是需要专用且经过优化的向量数据库？

关闭

检查

Vertex AI Vector Search

关闭

您的数据是否通过程序化方式访问 (OLTP)？已在使用 SQL 数据库？

关闭

检查

想直接从数据库中使用 Google AI 模型？需要低延迟？

检查

关闭

AlloyDB Cloud SQL

关闭

拥有大型分析数据集 (OLAP)？需要批量处理，并且需要人工或脚本（数据科学）频繁访问 SQL 表？

检查

使用 API 建立依据

许多在线服务都提供用于检索基础数据以增强模型提示的 API，而不是（或额外）使用您自己的数据作为基础。

Vertex AI Extensions（非公开预览版）

创建、部署和管理将大语言模型连接到外部系统的 API 的扩展程序。

LangChain 组件

探索适用于生成式 AI 应用的各种文档加载器和 API 集成，包括 YouTube 和 Google 学术搜索等等。

Vertex AI 中的依据

如果您使用的是托管在 Vertex AI 中的模型，则可以使用 Vertex AI Search、Google 搜索或内嵌/文件内文本作为模型回答的基础。

开始构建

为 Google Cloud 设置开发环境

设置 LangChain

LangChain 是一个适用于生成式 AI 应用的开源框架，使您可以将上下文构建到提示中，并根据模型的回答采取行动。

查看代码示例和部署示例应用

查看常见用例的代码示例和生成式 AI 应用的部署示例，这些示例安全、高效、弹性佳、高性能且经济实惠。

保留所有权利。Java 是 Oracle 和/或其关联公司的注册商标。

最后更新时间 (UTC)：2025-02-19。