此页面由 Cloud Translation API 翻译。

Gemini 2.5 Flash

注意：gemini-2.0-flash-preview-image-generation 和 gemini-2.5-flash-image-preview 模型将于 2025 年 10 月 31 日被弃用。请务必在该日期之前将所有工作流迁移到 gemini-2.5-flash-image，以免服务中断。

Gemini 2.5 Flash 在价格和性能方面都是我们的最佳模型，并且提供全面的功能。Gemini 2.5 Flash 是我们的首款具备思考能力的 Flash 模型，可让您了解模型在生成回答时所经历的思考过程。

如需详细了解 Gemini 2.5 Flash 的技术信息（例如性能基准、训练数据集信息、在可持续发展方面的努力、预期用途和局限性，以及我们在伦理和安全方面的做法），请参阅我们关于 Gemini 2.5 模型的技术报告。

2.5 Flash

在 Vertex AI 中试用在 Model Garden 中查看（预览版）部署示例应用

注意：如需使用“部署示例应用”功能，您需要拥有一个启用了结算功能和 Vertex AI API 的 Google Cloud 项目。

技术规范
模型 ID	`gemini-2.5-flash`
支持的输入和输出	输入：文本、代码、图片、音频、视频输出：文本
token 数量上限	输入词元数上限：1,048,576 输出词元数上限：65,535（默认值）
功能	支持使用 Google 搜索建立依据代码执行调优系统指令结构化输出函数调用统计 token 数量 Live API 预览版功能思考型 Vertex AI RAG 引擎聊天补全不支持
使用类型	支持预配吞吐量动态共享配额批量预测不支持固定配额
输入大小限制	500 MB
	图片	每个提示的图片数量上限： 3,000 图片大小上限：7 MB 支持的 MIME 类型： `image/png`、`image/jpeg`、`image/webp`
	文档	每个提示的文件数量上限： 3,000 每个文件的页数上限：1,000 通过 API 或 Cloud Storage 导入时，每个文件的文件大小上限：50 MB 通过控制台直接上传的每个文件的文件大小上限：7 MB 支持的 MIME 类型： `application/pdf`、`text/plain`
	视频	视频时长上限（包含音频）：约 45 分钟视频时长上限（不含音频）：约 1 小时每个提示的视频数量上限：10 支持的 MIME 类型： `video/x-flv`、`video/quicktime`、`video/mpeg`、`video/mpegs`、`video/mpg`、`video/mp4`、`video/webm`、`video/wmv`、`video/3gpp`
	音频	每个提示的音频时长上限：约 8.4 小时或最多 100 万个 token 每个提示的音频文件数量上限： 1 语音理解，用于：音频摘要、转写和翻译支持的 MIME 类型： `audio/x-aac`、`audio/flac`、`audio/mp3`、`audio/m4a`、`audio/mpeg`、`audio/mpga`、`audio/mp4`、`audio/ogg`、`audio/pcm`、`audio/wav`、`audio/webm`
	参数默认值	温度：0.0-2.0（默认值为 1.0） topP：0.0-1.0（默认值为 0.95） topK：64（固定值） candidateCount：1-8（默认值为 1）
支持的区域
	模型可用性（包括动态共享配额和预配吞吐量）	全球全局美国 us-central1 us-east1 us-east4 us-east5 us-south1 us-west1 us-west4 欧洲 europe-central2 europe-north1 europe-southwest1 europe-west1 europe-west4 europe-west8
	ML 处理	美国多区域加拿大 northamerica-northeast1⁺ 欧洲多区域 europe-west2^{* +} europe-west3^{* +} europe-west9^{* +} 亚太地区 asia-northeast1^{* +} asia-northeast3^{* +} asia-south1^{* +} asia-southeast1⁺ australia-southeast1^{* +}
	如需了解详情，请参阅数据驻留。
知识截点日期	2025 年 1 月
版本	`gemini-2.5-flash` 发布阶段：正式版发布日期：2025 年 6 月 17 日终止日期：2026 年 6 月 17 日 `gemini-live-2.5-flash` 发布阶段：非公开正式版发布日期：2025 年 6 月 17 日
安全控制
安全控制	如需了解详情，请参阅安全控制。
支持的语言	请参阅支持的语言。
价格	请参阅价格。

+ 不支持监督式微调
* 仅适用于 128K 上下文窗口，不支持监督式微调

2.5 Flash

在 Vertex AI 中试用（预览版）部署示例应用

注意：如需使用“部署示例应用”功能，您需要拥有一个启用了结算功能和 Vertex AI API 的 Google Cloud 项目。

技术规范
模型 ID	`gemini-2.5-flash-preview-09-2025`
支持的输入和输出	输入：文本、代码、图片、音频、视频输出：文本
token 数量上限	输入词元数上限：1,048,576 输出词元数上限：65,535（默认值）
功能	支持使用 Google 搜索建立依据代码执行系统指令结构化输出函数调用统计 token 数量 Live API 预览版功能思考型 Vertex AI RAG 引擎聊天补全不支持调优
使用类型	支持预配吞吐量动态共享配额不支持固定配额批量预测
	图片	每个提示的图片数量上限： 3,000 图片大小上限：7 MB 支持的 MIME 类型： `image/png`、`image/jpeg`、`image/webp`
	文档	每个提示的文件数量上限： 3,000 每个文件的页数上限：1,000 通过 API 或 Cloud Storage 导入时，每个文件的文件大小上限：50 MB 通过控制台直接上传的每个文件的文件大小上限：7 MB 支持的 MIME 类型： `application/pdf`、`text/plain`
	视频	视频时长上限（包含音频）：约 45 分钟视频时长上限（不含音频）：约 1 小时每个提示的视频数量上限：10 支持的 MIME 类型： `video/x-flv`、`video/quicktime`、`video/mpeg`、`video/mpegs`、`video/mpg`、`video/mp4`、`video/webm`、`video/wmv`、`video/3gpp`
	音频	每个提示的音频时长上限：约 8.4 小时或最多 100 万个 token 每个提示的音频文件数量上限： 1 语音理解，用于：音频摘要、转写和翻译支持的 MIME 类型： `audio/x-aac`、`audio/flac`、`audio/mp3`、`audio/m4a`、`audio/mpeg`、`audio/mpga`、`audio/mp4`、`audio/ogg`、`audio/pcm`、`audio/wav`、`audio/webm`
	参数默认值	温度：0.0-2.0（默认值为 1.0） topP：0.0-1.0（默认值为 0.95） topK：64（固定值） candidateCount：1-8（默认值为 1）
支持的区域
	模型可用性（包括动态共享配额和预配吞吐量）	全球全局
	如需了解详情，请参阅数据驻留。
知识截点日期	2025 年 1 月
版本	`gemini-2.5-flash-preview-09-2025` 发布阶段：公开预览版发布日期：2025 年 9 月 25 日
安全控制
安全控制	如需了解详情，请参阅安全控制。
支持的语言	请参阅支持的语言。
价格	请参阅价格。