Gemini 2.0 Flash

Gemini 2.0 Flash 具备专为智能体时代设计的新一代特性和改进功能,包括卓越的速度、内置工具使用、多模态生成和 100 万个 token 的上下文窗口。Gemini 2.0 Flash 在我们之前的 Flash 模型的基础上进行了改进,在速度相近的情况下,质量有所提升。

如需详细了解 Gemini 2.0 Flash 相关的技术信息(例如性能基准、训练数据集相关信息、在可持续发展方面的努力、预期用途和局限性,以及我们在伦理和安全方面的做法),请参阅 Gemini 2.0 Flash 的模型卡片

2.0 Flash

Vertex AI 中试用 Model Garden 中查看 (预览版)部署示例应用

注意:如需使用“部署示例应用”功能,您需要拥有一个启用了结算功能和 Vertex AI API 的 Google Cloud 项目。
模型 ID gemini-2.0-flash
支持的输入和输出
  • 输入:
    文本代码图片音频视频
  • 输出:
    文本
token 数量上限
  • 输入 token 数量上限:1,048,576
  • 输出 token 数量上限:8,192(默认值)
功能
使用类型
输入大小限制 500 MB
技术规范
图片
  • 每个提示的图片数量上限: 3,000
  • 图片大小上限: 7 MB
  • 每个项目的每分钟 token 数 (TPM) 上限:
    • 高/中/默认媒体分辨率:
      • 美国/亚洲:40 M
      • 欧盟:10 M
    • 低媒体分辨率:
      • 美国/亚洲:10 M
      • 欧盟:2.6 M
  • 支持的 MIME 类型:
    image/pngimage/jpegimage/webp
文档
  • 每个提示的文件数量上限: 3,000
  • 每个文件的页数上限: 1,000
  • 每个文件的文件大小上限: 50 MB
  • 每个项目的每分钟 token 数 (TPM) 上限1
    • 美国/亚洲: 3.4 M
    • 欧盟: 3.4 M
  • 支持的 MIME 类型:
    application/pdftext/plain
视频
  • 视频时长上限(包含音频):约 45 分钟
  • 视频时长上限(不含音频):约 1 小时
  • 每个提示的视频数量上限:10
  • 每分钟 token 数 (TPM) 上限:
    • 高/中/默认媒体分辨率:
      • 美国/亚洲:38 M
      • 欧盟:10 M
    • 低媒体分辨率:
      • 美国/亚洲:10 M
      • 欧盟:2.5 M
  • 支持的 MIME 类型:
    video/x-flvvideo/quicktimevideo/mpegvideo/mpegsvideo/mpgvideo/mp4video/webmvideo/wmvvideo/3gpp
音频
  • 每个提示的音频时长上限:约 8.4 小时或最多 100 万个 token
  • 每个提示的音频文件数量上限: 1
  • 语音理解用途:音频总结、转写和翻译
  • 每分钟 token 数 (TPM) 上限:
    • 美国/亚洲: 3.5 M
    • 欧盟: 3.5 M
  • 支持的 MIME 类型:
    audio/x-aacaudio/flacaudio/mp3audio/m4aaudio/mpegaudio/mpgaaudio/mp4audio/opusaudio/pcmaudio/wavaudio/webm
参数默认值
  • 温度:0.0-2.0(默认值为 1.0)
  • topP:0.0-1.0(默认值为 0.95)
  • topK:64(固定值)
  • candidateCount:1-8(默认值为 1)
支持的区域

模型可用性

(包括动态共享配额和预配吞吐量)

  • 全球
    • 全局
  • 美国
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • 欧洲
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

ML 处理

  • 美国
    • 多区域
  • 欧洲
    • 多区域
如需了解详情,请参阅数据驻留
知识截点日期 2024 年 6 月
版本
  • gemini-2.0-flash-001
    • 发布阶段:正式版
    • 发布日期:2025 年 2 月 5 日
    • 终止日期:2026 年 2 月 5 日
安全控制
在线预测
  • 数据驻留(静态) 支持
  • 客户管理的加密密钥 (CMEK) 支持
  • VPC Service Controls 支持
  • Access Transparency (AXT) 支持
批量预测
  • 数据驻留(静态) 支持
  • 客户管理的加密密钥 (CMEK) 不支持
  • VPC Service Controls 支持
  • Access Transparency (AXT) 不支持
调优
  • 数据驻留(静态) 支持
  • 客户管理的加密密钥 (CMEK) 支持
  • VPC Service Controls 支持
  • Access Transparency (AXT) 不支持
如需了解详情,请参阅安全控制
价格 请参阅价格

图片生成

Vertex AI 中试用

模型 ID gemini-2.0-flash-preview-image-generation
支持的输入和输出
  • 输入:
    文本代码图片音频视频
  • 输出:
    文本和图片
token 数量上限
  • 输入 token 数量上限:32,768
  • 输出 token 数量上限:8,192(默认值)
功能
使用类型
输入大小限制 500 MB
技术规范
图片
  • 每个提示的图片数量上限: 3,000
  • 图片大小上限: 7 MB
  • 每个提示的输出图片数量上限: 10
  • 每个项目的每分钟 token 数 (TPM) 上限:
    • 高/中/默认媒体分辨率:
      • 美国/亚洲:40 M
      • 欧盟:10 M
    • 低媒体分辨率:
      • 美国/亚洲:10 M
      • 欧盟:3 M
  • 支持的 MIME 类型:
    image/pngimage/jpegimage/webp
文档
  • 每个提示的文件数量上限: 3,000
  • 每个文件的页数上限: 1,000
  • 每个文件的文件大小上限: 50 MB
  • 支持的 MIME 类型:
    application/pdftext/plain
视频
  • 视频时长上限(包含音频):约 45 分钟
  • 视频时长上限(不含音频):约 1 小时
  • 每个提示的视频数量上限:10
  • 每分钟 token 数 (TPM) 上限:
    • 高/中/默认媒体分辨率:
      • 美国/亚洲:37.9 M
      • 欧盟:9.5 M
    • 低媒体分辨率:
      • 美国/亚洲:1 G
      • 欧盟:2.5 M
  • 支持的 MIME 类型:
    video/x-flvvideo/quicktimevideo/mpegvideo/mpegsvideo/mpgvideo/mp4video/webmvideo/wmvvideo/3gpp
音频
  • 每个提示的音频时长上限:约 8.4 小时或最多 100 万个 token
  • 每个提示的音频文件数量上限: 1
  • 语音理解用途:音频总结、转写和翻译
  • 每分钟 token 数 (TPM) 上限:
    • 美国/亚洲: 1.7 M
    • 欧盟: 0.4 M
  • 支持的 MIME 类型:
    audio/x-aacaudio/flacaudio/mp3audio/m4aaudio/mpegaudio/mpgaaudio/mp4audio/opusaudio/pcmaudio/wavaudio/webm
参数默认值
  • 温度:0.0-2.0(默认值为 1.0)
  • topP:0.0-1.0(默认值为 0.95)
  • topK:64(固定值)
  • candidateCount:1-8(默认值为 1)
支持的区域

模型可用性

  • 全局
    • 全局
如需了解详情,请参阅数据驻留
知识截点日期 2024 年 8 月
版本
  • gemini-2.0-flash-preview-image-generation
    • 发布阶段:公开预览版
    • 发布日期:2025 年 5 月 6 日
    • 终止日期:2025 年 9 月 26 日
安全控制
在线预测
  • 数据驻留(静态) 不支持
  • 客户管理的加密密钥 (CMEK) 不支持
  • VPC Service Controls 支持
  • Access Transparency (AXT) 支持
如需了解详情,请参阅安全控制
价格 请参阅价格

Live API

Vertex AI 中试用

模型 ID gemini-2.0-flash-live-preview-04-09
支持的输入和输出
  • 输入:
    音频视频
  • 输出:
    音频
token 数量上限
  • 输入 token 数量上限:32,768
  • 输出 token 数量上限:8,192(默认值)
功能
使用类型
输入大小限制 500 MB
技术规范
视频
  • 视频时长上限(包含音频):约 45 分钟
  • 视频时长上限(不含音频):约 1 小时
  • 每个提示的视频数量上限:10
  • 每分钟 token 数 (TPM) 上限:
    • 高/中/默认媒体分辨率:
      • 美国/亚洲:37.9 M
      • 欧盟:9.5 M
    • 低媒体分辨率:
      • 美国/亚洲:1 G
      • 欧盟:2.5 M
  • 支持的 MIME 类型:
    video/x-flvvideo/quicktimevideo/mpegvideo/mpegsvideo/mpgvideo/mp4video/webmvideo/wmvvideo/3gpp
音频
  • 每个提示的音频时长上限:约 8.4 小时或最多 100 万个 token
  • 每个提示的音频文件数量上限: 1
  • 语音理解用途:音频总结、转写和翻译
  • 每分钟 token 数 (TPM) 上限:
    • 美国/亚洲: 1.7 M
    • 欧盟: 0.4 M
  • 支持的 MIME 类型:
    audio/x-aacaudio/flacaudio/mp3audio/m4aaudio/mpegaudio/mpgaaudio/mp4audio/opusaudio/pcmaudio/wavaudio/webm
参数默认值
  • 温度:0.0-2.0(默认值为 1.0)
  • topP:0.0-1.0(默认值为 0.95)
  • topK:64(固定值)
  • candidateCount:1-8(默认值为 1)
支持的区域

模型可用性

  • 美国
    • us-central1
如需了解详情,请参阅数据驻留
知识截点日期 2024 年 6 月
版本
  • gemini-2.0-flash-live-preview-04-09
    • 发布阶段:公开预览版
    • 发布日期:2025 年 4 月 9 日
安全控制
在线预测
  • 数据驻留(静态) 不支持
  • 客户管理的加密密钥 (CMEK) 不支持
  • VPC Service Controls 支持
  • Access Transparency (AXT) 支持
如需了解详情,请参阅安全控制
价格 请参阅价格