Gemini 2.5 Flash-Lite

O Gemini 2.5 Flash-Lite é o nosso modelo Gemini mais equilibrado, otimizado para exemplos de utilização de baixa latência. Inclui as mesmas capacidades que tornam outros modelos Gemini 2.5 úteis, como a capacidade de ativar o raciocínio com diferentes orçamentos, a ligação a ferramentas como a fundamentação com a Pesquisa Google e a execução de código, a entrada multimodal e um comprimento do contexto de 1 milhão de tokens.

Para informações técnicas ainda mais detalhadas sobre o Gemini 2.5 Flash-Lite (como referências de desempenho, informações sobre os nossos conjuntos de dados de preparação, esforços em sustentabilidade, utilização e limitações pretendidas, e a nossa abordagem à ética e segurança), consulte o nosso relatório técnico sobre os nossos modelos Gemini 2.5.

Experimentar no Vertex AI (Pré-visualização) Implementar app de exemplo

Nota: para usar a funcionalidade "Implementar app de exemplo", precisa de um projeto do Google Cloud com a faturação e a API Vertex AI ativadas.
ID do modelo gemini-2.5-flash-lite
Entradas e saídas suportadas
  • Entradas:
    Texto, Código, Imagens, Áudio, Vídeo
  • Resultados:
    Texto
Limites de tokens
  • Número máximo de tokens de entrada: 1 048 576
  • Tokens de saída máximos: 65 536 (predefinição)
Capacidades
Tipos de utilização
Limite de tamanho da entrada 500 MB
Especificações técnicas
Imagens
  • Número máximo de imagens por comando: 3000
  • Tamanho máximo da imagem: 7 MB
  • Número máximo de imagens de saída por comando: 10
  • Tipos MIME suportados:
    image/png, image/jpeg, image/webp
Documentos
  • Número máximo de ficheiros por comando: 3000
  • Número máximo de páginas por ficheiro: 1000
  • Tamanho máximo do ficheiro por ficheiro: 50 MB
  • Tipos MIME suportados:
    application/pdf, text/plain
Vídeo
  • Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos
  • Duração máxima do vídeo (sem áudio): Aproximadamente 1 hora
  • Número máximo de vídeos por comando: 10
  • Tipos MIME suportados:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima do áudio por comando: Aproximadamente 8, 4 horas ou até 1 milhão de tokens
  • Número máximo de ficheiros de áudio por comando: 1
  • Tipos MIME suportados:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Predefinições de parâmetros
  • Temperatura: 0,0 a 2,0 (predefinição: 1,0)
  • topP: 0,0 a 1,0 (predefinição: 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1 a 8 (predefinição: 1)
Regiões suportadas

Disponibilidade do modelo

  • Global
    • Global
  • Estados Unidos
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • Europa
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

Processamento de ML

  • Estados Unidos
    • Multirregião
  • Europa
    • Multirregião
Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento Janeiro de 2025
Versões
  • gemini-2.5-flash-lite
    • Fase de lançamento: GA
    • Data de lançamento: 22 de julho de 2025
    • Data de descontinuação: 22 de julho de 2026
  • gemini-2.5-flash-lite-preview-06-17
    • Fase de lançamento: pré-visualização pública
    • Data de lançamento: 17 de junho de 2025
    • Data de descontinuação: 21 de agosto de 2025
Controlos de segurança
Consulte os Controlos de segurança para mais informações.
Idiomas suportados Consulte os idiomas suportados.
Preços Consulte os preços.