Gemini 2.5 Flash

Gemini 2.5 Flash es nuestro mejor modelo en cuanto a precio y rendimiento, y ofrece funciones completas. Gemini 2.5 Flash es nuestro primer modelo Flash que incluye funciones de pensamiento, lo que te permite ver el proceso de pensamiento que sigue el modelo al generar su respuesta.

Para obtener información técnica aún más detallada sobre Gemini 2.5 Flash (como los puntos de referencia de rendimiento, información sobre nuestros conjuntos de datos de entrenamiento, las iniciativas de sostenibilidad, el uso y las limitaciones previstos, y nuestro enfoque de la ética y la seguridad), consulta nuestro informe técnico sobre nuestros modelos de Gemini 2.5 y la tarjeta de modelo de Gemini 2.5 Flash.

2.5 Flash

Probar en Vertex AI Ver en Model Garden (Vista previa) Desplegar aplicación de ejemplo

Nota: Para usar la función "Implementar aplicación de ejemplo", necesitas un proyecto de Google Cloud con la facturación y la API Vertex AI habilitadas.
ID del modelo gemini-2.5-flash
Entradas y salidas admitidas
  • Entradas:
    Texto, Código, Imágenes, Audio, Vídeo
  • Salidas:
    Texto
Límites de tokens
  • Número máximo de tokens de entrada: 1.048.576
  • Número máximo de tokens de salida: 65.535 (valor predeterminado)
Funciones
Tipos de uso
Límite de tamaño de entrada 500 MB
Especificaciones técnicas
Imágenes
  • Número máximo de imágenes por petición: 3000
  • Tamaño máximo de la imagen: 7 MB
  • Tipos MIME admitidos:
    image/png, image/jpeg, image/webp
Documentos
  • Número máximo de archivos por petición: 3000
  • Número máximo de páginas por archivo: 1000
  • Tamaño máximo de archivo por archivo para las importaciones de la API o de Cloud Storage: 50 MB
  • Tamaño máximo de archivo para las subidas directas a través de la consola: 7 MB
  • Tipos MIME admitidos:
    application/pdf text/plain
Vídeo
  • Duración máxima del vídeo (con audio): Aproximadamente 45 minutos
  • Duración máxima del vídeo (sin audio): Aproximadamente 1 hora
  • Número máximo de vídeos por petición: 10
  • Tipos MIME admitidos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Duración máxima del audio por petición: Aproximadamente 8, 4 horas o hasta 1 millón de tokens
  • Número máximo de archivos de audio por petición: 1
  • Comprensión del habla para: Resumir, transcribir y traducir audio
  • Tipos MIME admitidos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Valores predeterminados de los parámetros
  • Temperatura: 0,0-2,0 (1,0 de forma predeterminada)
  • topP: 0,0-1,0 (valor predeterminado: 0,95)
  • topK: 64 (fijo)
  • candidateCount: de 1 a 8 (1 de forma predeterminada)
Regiones disponibles

Disponibilidad del modelo

Incluye la cuota compartida dinámica y la capacidad de procesamiento reservada.

  • Global
    • Mundial
  • Estados Unidos
    • us-central1
    • us‑east1
    • us‑east4
    • us-east5
    • us-south1
    • us‑west1
    • us-west4
  • Europa
    • europe-central2
    • europe‑north1
    • europe-southwest1
    • europe‑west1
    • europe‑west4
    • europe-west8

Procesamiento de aprendizaje automático

  • Estados Unidos
    • Multirregional
  • Canadá
    • northamerica‑northeast1
  • Europa
    • Multirregional
    • europe-west2*
    • europe-west3*
  • Asia-Pacífico
    • asia-northeast1*
    • asia-northeast3*
    • asia-south1*
    • asia‑southeast1
    • australia-southeast1*
Consulta más información sobre la residencia de los datos.
Fecha de corte de conocimiento Enero del 2025
Versiones
  • gemini-2.5-flash
    • Fase de lanzamiento: GA
    • Fecha de lanzamiento: 17 de junio del 2025
    • Fecha de discontinuación: 17 de junio del 2026
  • gemini-live-2.5-flash
    • Fase de lanzamiento: GA privada
    • Fecha de lanzamiento: 17 de junio del 2025
  • gemini-2.5-flash-preview-05-20
    • Fase de lanzamiento: vista previa pública
    • Fecha de lanzamiento: 20 de mayo del 2025
    • Fecha de discontinuación: 15 de julio del 2025
  • gemini-2.5-flash-preview-04-17
    • Fase de lanzamiento: vista previa pública
    • Fecha de lanzamiento: 17 de abril del 2025
    • Fecha de discontinuación: 15 de julio del 2025
Controles de seguridad
Para obtener más información, consulta Controles de seguridad.
Idiomas disponibles Consulta los idiomas admitidos.
Precios Consulta Precios.
+ No se admite el ajuste supervisado
* Disponible solo para la ventana de contexto de 128 K

Imagen

Probar en Vertex AI (Vista previa) Implementar aplicación de ejemplo

Nota: Para usar la función "Implementar aplicación de ejemplo", necesitas un proyecto de Google Cloud con la facturación y la API Vertex AI habilitadas.
ID del modelo gemini-2.5-flash-image-preview
Entradas y salidas admitidas
  • Entradas:
    Texto, Imágenes
  • Resultados:
    Texto e imagen
Límites de tokens
  • Número máximo de tokens de entrada: 32.768
  • Número máximo de tokens de salida: 32.768
Funciones
Tipos de uso
Límite de tamaño de entrada 500 MB
Especificaciones técnicas
Imágenes
  • Número máximo de imágenes por petición: 3
  • Tamaño máximo de la imagen: 7 MB
  • Número máximo de imágenes de salida por petición: 10
  • Tipos MIME admitidos:
    image/png, image/jpeg, image/webp
Documentos
  • Número máximo de archivos por petición: 3
  • Número máximo de páginas por archivo: 3
  • Tamaño máximo por archivo: 50 MB
  • Tipos MIME admitidos:
    application/pdf text/plain
Valores predeterminados de los parámetros
  • Temperatura: 0,0-2,0 (1,0 de forma predeterminada)
  • topP: 0,0-1,0 (valor predeterminado: 0,95)
  • topK: 64 (fijo)
  • candidateCount: de 1 a 8 (1 de forma predeterminada)
Regiones disponibles

Disponibilidad del modelo

  • Global
    • Mundial
Consulta más información sobre la residencia de los datos.
Fecha de corte de conocimiento Junio del 2025
Versiones
  • gemini-2.5-flash-image-preview
    • Fase de lanzamiento: vista previa pública
    • Fecha de lanzamiento: 26 de agosto del 2025
Controles de seguridad
Para obtener más información, consulta Controles de seguridad.
Idiomas disponibles Consulta los idiomas admitidos.
Precios Consulta Precios.

Audio nativo de la API Live

Gemini 2.5 Flash con funciones de audio nativas de la API Live Nuestra función de audio nativa de vanguardia para la API Live. Además de las funciones estándar de la API Live, este modelo de vista previa incluye lo siguiente:

  • Calidad de voz y adaptabilidad mejoradas: la API Live native audio ofrece interacciones de voz más naturales y enriquecidas con 30 voces en HD en 24 idiomas.
  • Presentamos Audio proactivo: cuando Audio proactivo está habilitado, el modelo solo responde cuando es pertinente. El modelo genera transcripciones de texto y respuestas de audio de forma proactiva solo para las consultas dirigidas al dispositivo y no responde a las consultas que no se dirigen al dispositivo.
  • Presentamos Affective Dialog: los modelos que usan el audio nativo de la API Live pueden entender y responder adecuadamente a las expresiones emocionales de los usuarios para mantener conversaciones más matizadas.

Para obtener más información sobre la API Live, consulta la documentación independiente de la API Live.

Probar en Vertex AI

ID del modelo gemini-live-2.5-flash-preview-native-audio
Entradas y salidas admitidas
  • Entradas:
    Audio Vídeo
  • Salidas:
    Audio
Límites de tokens
  • Número máximo de tokens de entrada: 1.048.576
  • Número máximo de tokens de salida: 128.000 (valor predeterminado)
Funciones
Tipos de uso
Límite de tamaño de entrada 500 MB
Especificaciones técnicas
Vídeo
  • Duración máxima de la pantalla compartida: Aproximadamente 10 minutos
  • Tipos MIME admitidos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Duración máxima de la conversación: Aproximadamente 10 minutos
  • Comprensión del habla para: Resumir, transcribir y traducir audio
  • Tipos MIME admitidos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Valores predeterminados de los parámetros
  • Temperatura: 0,0-2,0 (1,0 de forma predeterminada)
  • topP: 0,0-1,0 (valor predeterminado: 0,95)
  • topK: 64 (fijo)
  • candidateCount: de 1 a 8 (1 de forma predeterminada)
Regiones disponibles

Disponibilidad del modelo

  • Estados Unidos
    • us-central1
Consulta más información sobre la residencia de los datos.
Fecha de corte de conocimiento Enero del 2025
Versiones
  • gemini-live-2.5-flash-preview-native-audio
    • Fase de lanzamiento: vista previa pública
    • Fecha de lanzamiento: 17 de junio del 2025
Controles de seguridad
Para obtener más información, consulta Controles de seguridad.
Idiomas disponibles Consulta los idiomas admitidos.
Precios Consulta Precios.