Gemini 2.5 Flash

Gemini 2.5 Flash 在价格和性能方面都是我们的最佳模型,并且提供全面的功能。Gemini 2.5 Flash 是我们的首款具备思考能力的 Flash 模型,可让您了解模型在生成回答时所经历的思考过程。

如需详细了解 Gemini 2.5 Flash 的技术信息(例如性能基准、训练数据集信息、在可持续发展方面的努力、预期用途和局限性,以及我们在伦理和安全方面的做法),请参阅我们关于 Gemini 2.5 模型的技术报告

2.5 Flash

Vertex AI 中试用 Model Garden 中查看 (预览版)部署示例应用

注意:如需使用“部署示例应用”功能,您需要拥有一个启用了结算功能和 Vertex AI API 的 Google Cloud 项目。
模型 ID gemini-2.5-flash
支持的输入和输出
  • 输入:
    文本代码图片音频视频
  • 输出:
    文本
token 数量上限
  • 输入词元数上限:1,048,576
  • 输出词元数上限:65,535(默认值)
功能
使用类型
输入大小限制 500 MB
技术规范
图片
  • 每个提示的图片数量上限: 3,000
  • 图片大小上限:7 MB
  • 支持的 MIME 类型:
    image/pngimage/jpegimage/webp
文档
  • 每个提示的文件数量上限: 3,000
  • 每个文件的页数上限:1,000
  • 通过 API 或 Cloud Storage 导入时,每个文件的文件大小上限:50 MB
  • 通过控制台直接上传的每个文件的文件大小上限:7 MB
  • 支持的 MIME 类型:
    application/pdftext/plain
视频
  • 视频时长上限(包含音频):约 45 分钟
  • 视频时长上限(不含音频):约 1 小时
  • 每个提示的视频数量上限:10
  • 支持的 MIME 类型:
    video/x-flvvideo/quicktimevideo/mpegvideo/mpegsvideo/mpgvideo/mp4video/webmvideo/wmvvideo/3gpp
音频
  • 每个提示的音频时长上限:约 8.4 小时或最多 100 万个 token
  • 每个提示的音频文件数量上限: 1
  • 语音理解,用于:音频摘要、转写和翻译
  • 支持的 MIME 类型:
    audio/x-aacaudio/flacaudio/mp3audio/m4aaudio/mpegaudio/mpgaaudio/mp4audio/oggaudio/pcmaudio/wavaudio/webm
参数默认值
  • 温度:0.0-2.0(默认值为 1.0)
  • topP:0.0-1.0(默认值为 0.95)
  • topK:64(固定值)
  • candidateCount:1-8(默认值为 1)
支持的区域

模型可用性

(包括动态共享配额和预配吞吐量)

  • 全球
    • 全局
  • 美国
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • 欧洲
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8

ML 处理

  • 美国
    • 多区域
  • 加拿大
    • northamerica-northeast1+
  • 欧洲
    • 多区域
    • europe-west2* +
    • europe-west3* +
    • europe-west9* +
  • 亚太地区
    • asia-northeast1* +
    • asia-northeast3* +
    • asia-south1* +
    • asia-southeast1+
    • australia-southeast1* +
如需了解详情,请参阅数据驻留
知识截点日期 2025 年 1 月
版本
  • gemini-2.5-flash
    • 发布阶段:正式版
    • 发布日期:2025 年 6 月 17 日
    • 终止日期:2026 年 6 月 17 日
  • gemini-live-2.5-flash
    • 发布阶段:非公开正式版
    • 发布日期:2025 年 6 月 17 日
安全控制
如需了解详情,请参阅安全控制
支持的语言 请参阅支持的语言
价格 请参阅价格
+ 不支持监督式微调
* 仅适用于 128K 上下文窗口,不支持监督式微调

2.5 Flash

Vertex AI 中试用 (预览版)部署示例应用

注意:如需使用“部署示例应用”功能,您需要拥有一个启用了结算功能和 Vertex AI API 的 Google Cloud 项目。
模型 ID gemini-2.5-flash-preview-09-2025
支持的输入和输出
  • 输入:
    文本代码图片音频视频
  • 输出:
    文本
token 数量上限
  • 输入词元数上限:1,048,576
  • 输出词元数上限:65,535(默认值)
功能
使用类型
技术规范
图片
  • 每个提示的图片数量上限: 3,000
  • 图片大小上限:7 MB
  • 支持的 MIME 类型:
    image/pngimage/jpegimage/webp
文档
  • 每个提示的文件数量上限: 3,000
  • 每个文件的页数上限:1,000
  • 通过 API 或 Cloud Storage 导入时,每个文件的文件大小上限:50 MB
  • 通过控制台直接上传的每个文件的文件大小上限:7 MB
  • 支持的 MIME 类型:
    application/pdftext/plain
视频
  • 视频时长上限(包含音频):约 45 分钟
  • 视频时长上限(不含音频):约 1 小时
  • 每个提示的视频数量上限:10
  • 支持的 MIME 类型:
    video/x-flvvideo/quicktimevideo/mpegvideo/mpegsvideo/mpgvideo/mp4video/webmvideo/wmvvideo/3gpp
音频
  • 每个提示的音频时长上限:约 8.4 小时或最多 100 万个 token
  • 每个提示的音频文件数量上限: 1
  • 语音理解,用于:音频摘要、转写和翻译
  • 支持的 MIME 类型:
    audio/x-aacaudio/flacaudio/mp3audio/m4aaudio/mpegaudio/mpgaaudio/mp4audio/oggaudio/pcmaudio/wavaudio/webm
参数默认值
  • 温度:0.0-2.0(默认值为 1.0)
  • topP:0.0-1.0(默认值为 0.95)
  • topK:64(固定值)
  • candidateCount:1-8(默认值为 1)
支持的区域

模型可用性

(包括动态共享配额和预配吞吐量)

  • 全球
    • 全局
如需了解详情,请参阅数据驻留
知识截点日期 2025 年 1 月
版本
  • gemini-2.5-flash-preview-09-2025
    • 发布阶段:公开预览版
    • 发布日期:2025 年 9 月 25 日
安全控制
如需了解详情,请参阅安全控制
支持的语言 请参阅支持的语言
价格 请参阅价格