使用 Gemma 开放模型

Gemma 是一组轻量级生成式人工智能 (AI) 开放模型。Gemma 模型可以在应用以及硬件、移动设备或托管服务上运行。您还可以使用调优技术自定义这些模型，使其善于执行您和您用户的重要任务。Gemma 模型基于 Gemini 模型，旨在供 AI 开发社区进行扩展和改进。

微调有助于提高模型在特定任务中的表现。由于 Gemma 模型系列中的模型是开放权重，因此您可以使用自己选择的 AI 框架和 Vertex AI SDK 调优任何模型。您可以使用 Model Garden 中的 Gemma 模型卡片上提供的链接，打开一个笔记本示例来微调 Gemma 模型。

以下 Gemma 模型可与 Vertex AI 搭配使用。如需详细了解和测试 Gemma 模型，请参阅其 Model Garden 模型卡片。

模型名称	使用场景	Model Garden 模型卡片
Gemma 3n	能够接受多模态输入，处理文本、图片、视频和音频输入，并生成文本输出。	前往 Gemma 3n 模型卡片
Gemma 3	最适合文本生成和图片理解任务，包括问答、总结和推理。	前往 Gemma 3 模型卡片
Gemma 2	最适合用于文本生成、总结和提取。	前往 Gemma 2 模型卡片
Gemma	最适合用于文本生成、总结和提取。	前往 Gemma 模型卡片
CodeGemma	最适合生成代码和代码补全。	前往 CodeGemma 模型卡片
PaliGemma 2	最适合图片说明任务和视觉问答任务。	前往 PaliGemma 2 模型卡片
PaliGemma	最适合图片说明任务和视觉问答任务。	前往 PaliGemma 模型卡片
ShieldGemma 2	检查合成图片和自然图片的安全性，帮助您构建可靠的数据集和模型。	前往 ShieldGemma 2 模型卡片
TxGemma	最适合治疗相关预测任务，包括分类、回归或生成，以及推理任务。	前往 TxGemma 模型卡片
MedGemma	专门经过训练的 Gemma 3 变体，旨在提升医学文本和影像理解方面的性能。	前往 MedGemma 模型卡片
MedSigLIP	专门经过训练的 SigLIP 变体，可将医学影像和文本编码到通用嵌入空间中。	前往 MedSigLIP 模型卡片
T5Gemma	非常适合各种生成任务，包括问答、总结和推理。	前往 T5Gemma 模型卡片

以下是您可以使用 Gemma 的一些选项：

将 Gemma 与 Vertex AI 搭配使用

Vertex AI 提供了一个托管式平台，无需内部 MLOps 专业知识，即可快速构建和扩缩机器学习项目。您可以将 Vertex AI 用作提供 Gemma 模型的下游应用。例如，您可以从 Gemma 的 Keras 实现中移植权重。接下来，您可以使用 Vertex AI 提供该版本的 Gemma 以获取预测结果。如果您需要端到端 MLOps 功能、增值机器学习功能以及无服务器体验（用于简化开发），我们建议您使用 Vertex AI。

如需开始使用 Gemma，请参阅以下笔记本：

在其他 Google Cloud 产品中使用 Gemma

您可以将 Gemma 与其他 Google Cloud 产品（例如 Google Kubernetes Engine 和 Dataflow）结合使用。

将 Gemma 与 GKE 搭配使用

Google Kubernetes Engine (GKE) 是托管式 Kubernetes 的 Google Cloud 解决方案，它提供可伸缩性、安全性、弹性和成本效益。如果您已有 Kubernetes 投资，您的组织拥有内部 MLOps 专业知识，或者您需要对复杂的 AI/机器学习工作负载进行精细控制并在安全性、数据流水线和资源管理方面具有独特的要求，则建议您使用此选项。如需了解详情，请参阅 GKE 文档中的以下教程：

将 Gemma 与 Dataflow 搭配使用

您可以将 Gemma 模型与 Dataflow 配合使用，以进行情感分析。使用 Dataflow 运行使用 Gemma 模型的推理流水线。如需了解详情，请参阅使用 Gemma 开放模型运行推理流水线。

将 Gemma 与 Colab 搭配使用

您可以将 Gemma 与 Colaboratory 结合使用来创建 Gemma 解决方案。在 Colab 中，您可以将 Gemma 与 PyTorch 和 JAX 等框架选项搭配使用。如需了解详情，请参阅：

Gemma 模型大小和功能

Gemma 模型有多种大小，因此您可以根据可用的计算资源、所需的功能和运行位置来构建生成式 AI 解决方案。每个模型都有经过调优和未调优的版本：

预先训练 - 此版本的模型未针对 Gemma 核心数据训练集以外的任何特定任务或指令进行训练。我们不建议您在未执行某些调优的情况下使用此模型。
指令调优 - 此版本的模型通过人类语言交互进行训练，可以参与对话，类似于基本的聊天机器人。
混合微调 - 此版本的模型针对混合学术数据集进行了微调，并可接受自然语言提示。

参数值越小，资源要求就越低，部署灵活性则会更高。

模型名称	参数大小	输入	输出	调优后的版本	目标平台
Gemma 3n
Gemma 3n E4B	40 亿个有效参数	文本、图片和音频	文本	预先训练指令调优	移动设备和笔记本电脑
Gemma 3n E2B	20 亿个有效参数	文本、图片和音频	文本	预先训练指令调优	移动设备和笔记本电脑
Gemma 3
Gemma 27B	270 亿	文本和图片	文本	预先训练指令调优	大型服务器或服务器集群
Gemma 12B	120 亿	文本和图片	文本	预先训练指令调优	高端桌面设备和服务器
Gemma 4B	40 亿	文本和图片	文本	预先训练指令调优	桌面设备和小型服务器
Gemma 1B	10 亿	文本	文本	预先训练指令调优	移动设备和笔记本电脑
Gemma 2
Gemma 27B	270 亿	文本	文本	预先训练指令调优	大型服务器或服务器集群
Gemma 9B	9 个十亿	文本	文本	预先训练指令调优	高端桌面设备和服务器
Gemma 2B	20 亿	文本	文本	预先训练指令调优	移动设备和笔记本电脑
Gemma
Gemma 7B	70 亿	文本	文本	预先训练指令调优	桌面设备和小型服务器
Gemma 2B	22 亿	文本	文本	预先训练指令调优	移动设备和笔记本电脑
CodeGemma
CodeGemma 7B	70 亿	文本	文本	预先训练指令调优	桌面设备和小型服务器
CodeGemma 2B	20 亿	文本	文本	预先训练	桌面设备和小型服务器
PaliGemma 2
PaliGemma 28B	280 亿	文本和图片	文本	预先训练混合微调	大型服务器或服务器集群
PaliGemma 10B	100 亿	文本和图片	文本	预先训练混合微调	高端桌面设备和服务器
PaliGemma 3B	30 亿	文本和图片	文本	预先训练混合微调	桌面设备和小型服务器
PaliGemma
PaliGemma 3B	30 亿	文本和图片	文本	预先训练混合微调	桌面设备和小型服务器
ShieldGemma 2
ShieldGemma 2	40 亿	文本和图片	文本	微调	桌面设备和小型服务器
TxGemma
TxGemma 27B	270 亿	文本	文本	预先训练指令调优	大型服务器或服务器集群
TxGemma 9B	9 个十亿	文本	文本	预先训练指令调优	高端桌面设备和服务器
TxGemma 2B	20 亿	文本	文本	预先训练	移动设备和笔记本电脑
MedGemma
MedGemma 27B	270 亿	文本和图片	文本	仅限文本的指令调优指令调优	大型服务器或服务器集群
MedGemma 4B	40 亿	文本和图片	文本	预先训练指令调优	桌面设备和小型服务器
MedSigLIP
MedSigLIP	8 亿	文本和图片	嵌入	微调	移动设备和笔记本电脑
T5Gemma
T5Gemma 9B-9B	180 亿	文本	文本	PrefixLM，预训练 PrefixLM，指令调优 UL2，预训练 UL2，指令调优	移动设备和笔记本电脑
T5Gemma 9B-2B	110 亿	文本	文本	PrefixLM，预训练 PrefixLM，指令调优 UL2，预训练 UL2，指令调优	移动设备和笔记本电脑
T5Gemma 2B-2B	40 亿	文本	文本	PrefixLM，预训练 PrefixLM，指令调优 UL2，预训练 UL2，指令调优	移动设备和笔记本电脑
T5Gemma XL-XL	40 亿	文本	文本	PrefixLM，预训练 PrefixLM，指令调优 UL2，预训练 UL2，指令调优	移动设备和笔记本电脑
T5Gemma M-L	20 亿	文本	文本	PrefixLM，预训练 PrefixLM，指令调优 UL2，预训练 UL2，指令调优	移动设备和笔记本电脑
T5Gemma L-L	10 亿	文本	文本	PrefixLM，预训练 PrefixLM，指令调优 UL2，预训练 UL2，指令调优	移动设备和笔记本电脑
T5Gemma B-B	6 亿	文本	文本	PrefixLM，预训练 PrefixLM，指令调优 UL2，预训练 UL2，指令调优	移动设备和笔记本电脑
T5Gemma S-S	3 亿	文本	文本	PrefixLM，预训练 PrefixLM，指令调优 UL2，预训练 UL2，指令调优	移动设备和笔记本电脑

Gemma 已使用 Google 专门打造的 v5e TPU 硬件和 NVIDIA 的 L4 (G2 Standard)、A100 (A2 Standard)、H100 (A3 High) GPU 硬件进行了测试。

后续步骤

请参阅 Gemma 文档。