此页面由 Cloud Translation API 翻译。

Gemini 2.0 Flash

注意：Gemini 2.0 Flash 图片生成功能将于 2025 年 9 月 26 日弃用。gemini-2.0-flash-preview-image-generation 将于 2025 年 9 月 26 日移除。将所有工作流迁移到 gemini-2.5-flash-image-preview。

Gemini 2.0 Flash 具备专为智能体时代设计的新一代特性和改进功能，包括卓越的速度、内置工具使用、多模态生成和 100 万个 token 的上下文窗口。Gemini 2.0 Flash 在我们之前的 Flash 模型的基础上进行了改进，在速度相近的情况下，质量有所提升。

如需详细了解 Gemini 2.0 Flash 相关的技术信息（例如性能基准、训练数据集相关信息、在可持续发展方面的努力、预期用途和局限性，以及我们在伦理和安全方面的做法），请参阅 Gemini 2.0 Flash 的模型卡片。

2.0 Flash

在 Vertex AI 中试用在 Model Garden 中查看（预览版）部署示例应用

注意：如需使用“部署示例应用”功能，您需要拥有一个启用了结算功能和 Vertex AI API 的 Google Cloud 项目。

技术规范
模型 ID	`gemini-2.0-flash`
支持的输入和输出	输入：文本、代码、图片、音频、视频输出：文本
token 数量上限	输入 token 数量上限：1,048,576 输出 token 数量上限：8,192（默认值）
功能	支持使用 Google 搜索建立依据代码执行调优系统指令结构化输出批量预测函数调用统计 token 数量上下文缓存 Vertex AI RAG 引擎聊天补全不支持 Live API 预览版功能思考型
使用类型	支持预配吞吐量动态共享配额不支持固定配额
输入大小限制	500 MB
	图片	每个提示的图片数量上限： 3,000 图片大小上限： 7 MB 每个项目的每分钟 token 数 (TPM) 上限：高/中/默认媒体分辨率：美国/亚洲：40 M 欧盟：10 M 低媒体分辨率：美国/亚洲：10 M 欧盟：2.6 M 支持的 MIME 类型： `image/png`、 `image/jpeg`、 `image/webp`
	文档	每个提示的文件数量上限： 3,000 每个文件的页数上限： 1,000 每个文件的文件大小上限： 50 MB 每个项目的每分钟 token 数 (TPM) 上限¹：美国/亚洲： 3.4 M 欧盟： 3.4 M 支持的 MIME 类型： `application/pdf`、 `text/plain`
	视频	视频时长上限（包含音频）：约 45 分钟视频时长上限（不含音频）：约 1 小时每个提示的视频数量上限：10 每分钟 token 数 (TPM) 上限：高/中/默认媒体分辨率：美国/亚洲：38 M 欧盟：10 M 低媒体分辨率：美国/亚洲：10 M 欧盟：2.5 M 支持的 MIME 类型： `video/x-flv`、 `video/quicktime`、 `video/mpeg`、 `video/mpegs`、 `video/mpg`、 `video/mp4`、 `video/webm`、 `video/wmv`、 `video/3gpp`
	音频	每个提示的音频时长上限：约 8.4 小时或最多 100 万个 token 每个提示的音频文件数量上限： 1 语音理解用途：音频总结、转写和翻译每分钟 token 数 (TPM) 上限：美国/亚洲： 3.5 M 欧盟： 3.5 M 支持的 MIME 类型： `audio/x-aac`、 `audio/flac`、 `audio/mp3`、 `audio/m4a`、 `audio/mpeg`、 `audio/mpga`、 `audio/mp4`、 `audio/opus`、 `audio/pcm`、 `audio/wav`、 `audio/webm`
	参数默认值	温度：0.0-2.0（默认值为 1.0） topP：0.0-1.0（默认值为 0.95） topK：64（固定值） candidateCount：1-8（默认值为 1）
支持的区域
	模型可用性（包括动态共享配额和预配吞吐量）	全球全局美国 us-central1 us-east1 us-east4 us-east5 us-south1 us-west1 us-west4 欧洲 europe-central2 europe-north1 europe-southwest1 europe-west1 europe-west4 europe-west8 europe-west9
	ML 处理	美国多区域欧洲多区域
	如需了解详情，请参阅数据驻留。
知识截点日期	2024 年 6 月
版本	`gemini-2.0-flash-001` 发布阶段：正式版发布日期：2025 年 2 月 5 日终止日期：2026 年 2 月 5 日
安全控制
	在线预测	数据驻留（静态）支持客户管理的加密密钥 (CMEK) 支持 VPC Service Controls 支持 Access Transparency (AXT) 支持
	批量预测	数据驻留（静态）支持客户管理的加密密钥 (CMEK) 不支持 VPC Service Controls 支持 Access Transparency (AXT) 不支持
	调优	数据驻留（静态）支持客户管理的加密密钥 (CMEK) 支持 VPC Service Controls 支持 Access Transparency (AXT) 不支持
	如需了解详情，请参阅安全控制。
价格	请参阅价格。

图片生成

在 Vertex AI 中试用

技术规范
模型 ID	`gemini-2.0-flash-preview-image-generation`
支持的输入和输出	输入：文本、代码、图片、音频、视频输出：文本和图片
token 数量上限	输入 token 数量上限：32,768 输出 token 数量上限：8,192（默认值）
功能	支持系统指令统计 token 数量不支持使用 Google 搜索建立依据代码执行调优结构化输出批量预测函数调用 Live API 预览版功能思考型上下文缓存 Vertex AI RAG 引擎
使用类型	支持动态共享配额不支持固定配额预配的吞吐量
输入大小限制	500 MB
	图片	每个提示的图片数量上限： 3,000 图片大小上限： 7 MB 每个提示的输出图片数量上限： 10 每个项目的每分钟 token 数 (TPM) 上限：高/中/默认媒体分辨率：美国/亚洲：40 M 欧盟：10 M 低媒体分辨率：美国/亚洲：10 M 欧盟：3 M 支持的 MIME 类型： `image/png`、 `image/jpeg`、 `image/webp`
	文档	每个提示的文件数量上限： 3,000 每个文件的页数上限： 1,000 每个文件的文件大小上限： 50 MB 支持的 MIME 类型： `application/pdf`、 `text/plain`
	视频	视频时长上限（包含音频）：约 45 分钟视频时长上限（不含音频）：约 1 小时每个提示的视频数量上限：10 每分钟 token 数 (TPM) 上限：高/中/默认媒体分辨率：美国/亚洲：37.9 M 欧盟：9.5 M 低媒体分辨率：美国/亚洲：1 G 欧盟：2.5 M 支持的 MIME 类型： `video/x-flv`、 `video/quicktime`、 `video/mpeg`、 `video/mpegs`、 `video/mpg`、 `video/mp4`、 `video/webm`、 `video/wmv`、 `video/3gpp`
	音频	每个提示的音频时长上限：约 8.4 小时或最多 100 万个 token 每个提示的音频文件数量上限： 1 语音理解用途：音频总结、转写和翻译每分钟 token 数 (TPM) 上限：美国/亚洲： 1.7 M 欧盟： 0.4 M 支持的 MIME 类型： `audio/x-aac`、 `audio/flac`、 `audio/mp3`、 `audio/m4a`、 `audio/mpeg`、 `audio/mpga`、 `audio/mp4`、 `audio/opus`、 `audio/pcm`、 `audio/wav`、 `audio/webm`
	参数默认值	温度：0.0-2.0（默认值为 1.0） topP：0.0-1.0（默认值为 0.95） topK：64（固定值） candidateCount：1-8（默认值为 1）
支持的区域
	模型可用性	全局全局
	如需了解详情，请参阅数据驻留。
知识截点日期	2024 年 8 月
版本	`gemini-2.0-flash-preview-image-generation` 发布阶段：公开预览版发布日期：2025 年 5 月 6 日终止日期：2025 年 9 月 26 日
安全控制
	在线预测	数据驻留（静态）不支持客户管理的加密密钥 (CMEK) 不支持 VPC Service Controls 支持 Access Transparency (AXT) 支持
	如需了解详情，请参阅安全控制。
价格	请参阅价格。

Live API

在 Vertex AI 中试用

技术规范
模型 ID	`gemini-2.0-flash-live-preview-04-09`
支持的输入和输出	输入：音频、视频输出：音频
token 数量上限	输入 token 数量上限：32,768 输出 token 数量上限：8,192（默认值）
功能	支持使用 Google 搜索建立依据代码执行系统指令函数调用 Live API 预览版功能不支持调优结构化输出批量预测思考型上下文缓存 Vertex AI RAG 引擎
使用类型	支持动态共享配额不支持固定配额预配的吞吐量
输入大小限制	500 MB
	视频	视频时长上限（包含音频）：约 45 分钟视频时长上限（不含音频）：约 1 小时每个提示的视频数量上限：10 每分钟 token 数 (TPM) 上限：高/中/默认媒体分辨率：美国/亚洲：37.9 M 欧盟：9.5 M 低媒体分辨率：美国/亚洲：1 G 欧盟：2.5 M 支持的 MIME 类型： `video/x-flv`、 `video/quicktime`、 `video/mpeg`、 `video/mpegs`、 `video/mpg`、 `video/mp4`、 `video/webm`、 `video/wmv`、 `video/3gpp`
	音频	每个提示的音频时长上限：约 8.4 小时或最多 100 万个 token 每个提示的音频文件数量上限： 1 语音理解用途：音频总结、转写和翻译每分钟 token 数 (TPM) 上限：美国/亚洲： 1.7 M 欧盟： 0.4 M 支持的 MIME 类型： `audio/x-aac`、 `audio/flac`、 `audio/mp3`、 `audio/m4a`、 `audio/mpeg`、 `audio/mpga`、 `audio/mp4`、 `audio/opus`、 `audio/pcm`、 `audio/wav`、 `audio/webm`
	参数默认值	温度：0.0-2.0（默认值为 1.0） topP：0.0-1.0（默认值为 0.95） topK：64（固定值） candidateCount：1-8（默认值为 1）
支持的区域
	模型可用性	美国 us-central1
	如需了解详情，请参阅数据驻留。
知识截点日期	2024 年 6 月
版本	`gemini-2.0-flash-live-preview-04-09` 发布阶段：公开预览版发布日期：2025 年 4 月 9 日
安全控制
	在线预测	数据驻留（静态）不支持客户管理的加密密钥 (CMEK) 不支持 VPC Service Controls 支持 Access Transparency (AXT) 支持
	如需了解详情，请参阅安全控制。
价格	请参阅价格。

Gemini 2.0 Flash 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

2.0 Flash

图片生成

Live API

Gemini 2.0 Flash