Gemini 2.5 Flash-Lite

Gemini 2.5 Flash-Lite es nuestro modelo Gemini más equilibrado y está optimizado para casos prácticos con baja latencia. Incluye las mismas funciones que hacen que otros modelos de Gemini 2.5 sean útiles, como la capacidad de activar la función de reflexión con diferentes presupuestos, conectarse a herramientas como la búsqueda de Google y la ejecución de código, la entrada multimodal y una longitud de contexto de 1 millón de tokens.

Para obtener información técnica aún más detallada sobre Gemini 2.5 Flash-Lite (como los puntos de referencia de rendimiento, información sobre nuestros conjuntos de datos de entrenamiento, las iniciativas de sostenibilidad, el uso previsto y las limitaciones, y nuestro enfoque en la ética y la seguridad), consulta nuestro informe técnico sobre nuestros modelos de Gemini 2.5.

Probar en Vertex AI (Vista previa) Implementar aplicación de ejemplo

Nota: Para usar la función "Implementar aplicación de ejemplo", necesitas un proyecto de Google Cloud con la facturación y la API Vertex AI habilitadas.
ID del modelo gemini-2.5-flash-lite
Entradas y salidas admitidas
  • Entradas:
    Texto, Código, Imágenes, Audio, Vídeo
  • Salidas:
    Texto
Límites de tokens
  • Número máximo de tokens de entrada: 1.048.576
  • Número máximo de tokens de salida: 65.536 (valor predeterminado)
Funciones
Tipos de uso
Límite de tamaño de entrada 500 MB
Especificaciones técnicas
Imágenes
  • Número máximo de imágenes por petición: 3000
  • Tamaño máximo de la imagen: 7 MB
  • Número máximo de imágenes de salida por petición: 10
  • Tipos MIME admitidos:
    image/png, image/jpeg, image/webp
Documentos
  • Número máximo de archivos por petición: 3000
  • Número máximo de páginas por archivo: 1000
  • Tamaño máximo por archivo: 50 MB
  • Tipos MIME admitidos:
    application/pdf text/plain
Vídeo
  • Duración máxima del vídeo (con audio): Aproximadamente 45 minutos
  • Duración máxima del vídeo (sin audio): Aproximadamente 1 hora
  • Número máximo de vídeos por petición: 10
  • Tipos MIME admitidos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Duración máxima del audio por petición: Aproximadamente 8, 4 horas o hasta 1 millón de tokens
  • Número máximo de archivos de audio por petición: 1
  • Tipos MIME admitidos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Valores predeterminados de los parámetros
  • Temperatura: 0,0-2,0 (1,0 de forma predeterminada)
  • topP: 0,0-1,0 (valor predeterminado: 0,95)
  • topK: 64 (fijo)
  • candidateCount: de 1 a 8 (1 de forma predeterminada)
Regiones disponibles

Disponibilidad del modelo

  • Global
    • Mundial
  • Estados Unidos
    • us-central1
    • us‑east1
    • us‑east4
    • us-east5
    • us-south1
    • us‑west1
    • us-west4
  • Europa
    • europe-central2
    • europe‑north1
    • europe-southwest1
    • europe‑west1
    • europe‑west4
    • europe-west8
    • europe-west9

Procesamiento de aprendizaje automático

  • Estados Unidos
    • Multirregional
  • Europa
    • Multirregional
Consulta más información sobre la residencia de los datos.
Fecha de corte de conocimiento Enero del 2025
Versiones
  • gemini-2.5-flash-lite
    • Fase de lanzamiento: GA
    • Fecha de lanzamiento: 22 de julio del 2025
    • Fecha de discontinuación: 22 de julio del 2026
  • gemini-2.5-flash-lite-preview-06-17
    • Fase de lanzamiento: vista previa pública
    • Fecha de lanzamiento: 17 de junio del 2025
    • Fecha de discontinuación: 21 de agosto del 2025
Controles de seguridad
Para obtener más información, consulta Controles de seguridad.
Idiomas disponibles Consulta los idiomas admitidos.
Precios Consulta Precios.