Gemini 2.0 模型是 Vertex AI 支持的最新 Google 模型。本页面介绍了以下模型:
如果您要了解 Gemini 2.0 Flash Thinking 模型,请参阅 Gemini 2.0 Flash Thinking 文档。
2.0 模型
2.0 Flash
Gemini 2.0 Flash 是我们 Gemini 系列中最新推出的正式版模型。这是适用于所有日常任务的主要模型,具有增强型性能,并支持实时 Live API。对于希望使用速度略慢但质量明显更高的模型的 1.5 Flash 用户,或者对于希望以更低的价格获得更高质量和实时延迟时间的 1.5 Pro 用户,2.0 Flash 是一个升级途径。
Gemini 2.0 Flash 引入了以下新功能和增强功能:
- Multimodal Live API:这一新的 API 支持与 Gemini 建立低延迟的双向语音和视频互动。
- 质量:在大多数质量基准方面,性能优于 Gemini 1.5 Pro。
- 改进了智能体功能:2.0 Flash 改进了多模态理解、编码、复杂指令遵从和函数调用功能。这些改进相辅相成,可支持更好的智能体体验。
- 新模态:2.0 Flash 引入了内置的图片生成和可控的文字转语音功能,可实现图片修改、本地化艺术作品创作和富有表现力的讲故事。
Gemini 2.0 Flash 功能:
- 多模态输入
- 文本输出(正式版)/多模态输出(非公开预览)
- 提示优化器
- 受控生成功能
- 函数调用
- 使用 Google 搜索建立依据
- 代码执行
- 计数 token
使用此模型 ID 将 Gemini 2.0 Flash 与 Gen AI SDK 搭配使用:gemini-2.0-flash
功能可用性
以下功能适用于 Gemini 2.0 Flash:
功能 | 可用性等级 |
---|---|
文本生成 | 已全面推出 |
使用 Google 搜索建立依据 | 已全面推出 |
Gen AI SDK | 已全面推出 |
Multimodal Live API | 公开预览版 |
边界框检测 | 公开预览版 |
图片生成 | 非公开预览版 |
语音生成 | 非公开预览版 |
- 正式版:此功能已公开发布,并支持在生产级代码中使用。
- 公开预览版:此功能以较小容量公开发布。请勿在生产代码中使用以公开预览版形式发布的功能,因为该功能的支持级别和作用可能会在没有任何警告的情况下发生更改。
- 非公开预览:只有列入已获批准的许可名单的用户才能使用此功能。请勿在生产代码中使用以非公开预览版形式发布的功能,因为该功能的支持级别和作用可能会在没有任何警告的情况下发生更改。
价格
如需了解 Gemini 2.0 Flash 的价格,请访问我们的价格页面。
配额和限制
Gemini 2.0 Flash 中的正式版功能使用动态共享配额。
Gemini 2.0 Flash 中的“使用 Google 搜索进行接地”功能会受到速率限制。
2.0 Flash-Lite
Gemini 2.0 Flash-Lite 是我们速度最快、最具成本效益的 Flash 模型。对于希望以相同的价格和速度获得更高质量的 1.5 Flash 用户来说,这是一个升级途径。
Gemini 2.0 Flash-Lite 包含:
- 多模态输入、文本输出
- 100 万个 token 的输入上下文窗口
- 8,000 个 token 输出上下文窗口
2.0 Flash-Lite 不包含以下功能:
- 多模态输出生成
- 与 Multimodal Live API 集成
- 思考模式
- 内置工具使用情况
使用此模型 ID 将 Gemini 2.0 Flash-Lite 与 Gen AI SDK 搭配使用:gemini-2.0-flash-lite
2.0 Pro
Gemini 2.0 Pro 是我们最强大的编码和世界知识模型,具有 200 万个字符的长上下文窗口。 Gemini 2.0 Pro 是 Vertex AI 中的实验性模型,对于希望获得更高质量的模型或者特别关注长上下文和代码的 1.5 Pro 用户来说,这是一个升级途径。
Gemini 2.0 Pro 功能:
- 多模态输入
- 文本输出
- 提示优化器
- 受控生成功能
- 函数调用(不包括组合函数调用)
- 使用 Google 搜索建立依据
- 代码执行
- 计数 token
使用此模型 ID 将 Gemini 2.0 Pro 与 Gen AI SDK 搭配使用:gemini-2.0-pro-exp-02-05
配额和限制
Gemini 2.0 Pro 在实验阶段的速率限制为每分钟 10 次查询 (QPM)。
Gemini 2.0 Pro 中的“使用 Google 搜索进行接地”功能会受到速率限制。
Google Gen AI SDK
Gen AI SDK 通过 Gemini Developer API 和 Vertex AI 上的 Gemini API 为 Gemini 2.0 提供了统一接口。除了少数例外情况,在一个平台上运行的代码都会在两个平台上运行。这意味着,您可以使用 Developer API 为应用开发原型,然后将应用迁移到 Vertex AI,而无需重写代码。
Gen AI SDK 还支持 Gemini 1.5 模型。
该 SDK 已以 Python 版本正式发布。对 Go 的支持目前处于预览版阶段,很快会推出对 Java 和 JavaScript 的支持。
您可以开始使用该 SDK,如下所示。
Gen AI SDK for Python
了解如何安装或更新 Gen AI SDK for Python。
如需了解详情,请参阅 SDK 参考文档。设置环境变量以将 Gen AI SDK 与 Vertex AI 搭配使用:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True