Gemini 2.5 Flash

O Gemini 2.5 Flash é o nosso melhor modelo em termos de preço e desempenho, e oferece capacidades abrangentes. O Gemini 2.5 Flash é o nosso primeiro modelo Flash com capacidades de raciocínio, que lhe permite ver o processo de raciocínio pelo qual o modelo passa quando gera a sua resposta.

Para informações técnicas ainda mais detalhadas sobre o Gemini 2.5 Flash (como referências de desempenho, informações sobre os nossos conjuntos de dados de preparação, esforços em sustentabilidade, utilização e limitações pretendidas, e a nossa abordagem à ética e segurança), consulte o nosso relatório técnico sobre os nossos modelos Gemini 2.5 e o cartão do modelo do Gemini 2.5 Flash.

2.5 Flash

Experimentar na Vertex AI Ver no Model Garden (Pré-visualização) Implementar app de exemplo

Nota: para usar a funcionalidade "Implementar app de exemplo", precisa de um projeto do Google Cloud com a faturação e a API Vertex AI ativadas.
ID do modelo gemini-2.5-flash
Entradas e saídas suportadas
  • Entradas:
    Texto, Código, Imagens, Áudio, Vídeo
  • Resultados:
    Texto
Limites de tokens
  • Número máximo de tokens de entrada: 1 048 576
  • Tokens de saída máximos: 65 535 (predefinição)
Capacidades
Tipos de utilização
Limite de tamanho da entrada 500 MB
Especificações técnicas
Imagens
  • Número máximo de imagens por comando: 3000
  • Tamanho máximo da imagem: 7 MB
  • Tipos MIME suportados:
    image/png, image/jpeg, image/webp
Documentos
  • Número máximo de ficheiros por comando: 3000
  • Número máximo de páginas por ficheiro: 1000
  • Tamanho máximo do ficheiro por ficheiro para as importações da API ou do Google Cloud Storage: 50 MB
  • Tamanho máximo do ficheiro por ficheiro para carregamentos diretos através da consola: 7 MB
  • Tipos MIME suportados:
    application/pdf, text/plain
Vídeo
  • Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos
  • Duração máxima do vídeo (sem áudio): Aproximadamente 1 hora
  • Número máximo de vídeos por comando: 10
  • Tipos MIME suportados:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima do áudio por comando: Aproximadamente 8, 4 horas ou até 1 milhão de tokens
  • Número máximo de ficheiros de áudio por comando: 1
  • Compreensão da fala para: Resumo, transcrição e tradução de áudio
  • Tipos MIME suportados:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Predefinições de parâmetros
  • Temperatura: 0,0 a 2,0 (predefinição: 1,0)
  • topP: 0,0 a 1,0 (predefinição: 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1 a 8 (predefinição: 1)
Regiões suportadas

Disponibilidade do modelo

(Inclui a quota partilhada dinâmica e o débito aprovisionado)

  • Global
    • Global
  • Estados Unidos
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • Europa
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8

Processamento de ML

  • Estados Unidos
    • Multirregião
  • Canadá
    • northamerica-northeast1
  • Europa
    • Multirregião
    • europe-west2*
    • europe-west3*
  • Ásia-Pacífico
    • asia-northeast1*
    • asia-northeast3*
    • asia-south1*
    • asia-southeast1
    • australia-southeast1*
Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento Janeiro de 2025
Versões
  • gemini-2.5-flash
    • Fase de lançamento: GA
    • Data de lançamento: 17 de junho de 2025
    • Data de descontinuação: 17 de junho de 2026
  • gemini-live-2.5-flash
    • Fase de lançamento: GA privado
    • Data de lançamento: 17 de junho de 2025
  • gemini-2.5-flash-preview-05-20
    • Fase de lançamento: pré-visualização pública
    • Data de lançamento: 20 de maio de 2025
    • Data de descontinuação: 15 de julho de 2025
  • gemini-2.5-flash-preview-04-17
    • Fase de lançamento: pré-visualização pública
    • Data de lançamento: 17 de abril de 2025
    • Data de descontinuação: 15 de julho de 2025
Controlos de segurança
Consulte os Controlos de segurança para mais informações.
Idiomas suportados Consulte os idiomas suportados.
Preços Consulte os preços.
+ A otimização precisa supervisionada não é suportada
* Disponível apenas para a capacidade de resposta de 128 mil tokens

Imagem

Experimentar no Vertex AI (Pré-visualização) Implementar app de exemplo

Nota: para usar a funcionalidade "Implementar app de exemplo", precisa de um projeto do Google Cloud com a faturação e a API Vertex AI ativadas.
ID do modelo gemini-2.5-flash-image-preview
Entradas e saídas suportadas
  • Entradas:
    Texto, Imagens
  • Resultados:
    Texto e imagem
Limites de tokens
  • Máximo de tokens de entrada: 32 768
  • Máximo de tokens de saída: 32 768
Capacidades
Tipos de utilização
Limite de tamanho da entrada 500 MB
Especificações técnicas
Imagens
  • Número máximo de imagens por comando: 3
  • Tamanho máximo da imagem: 7 MB
  • Número máximo de imagens de saída por comando: 10
  • Tipos MIME suportados:
    image/png, image/jpeg, image/webp
Documentos
  • Número máximo de ficheiros por comando: 3
  • Número máximo de páginas por ficheiro: 3
  • Tamanho máximo do ficheiro por ficheiro: 50 MB
  • Tipos MIME suportados:
    application/pdf, text/plain
Predefinições de parâmetros
  • Temperatura: 0,0 a 2,0 (predefinição: 1,0)
  • topP: 0,0 a 1,0 (predefinição: 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1 a 8 (predefinição: 1)
Regiões suportadas

Disponibilidade do modelo

  • Global
    • Global
Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento Junho de 2025
Versões
  • gemini-2.5-flash-image-preview
    • Fase de lançamento: pré-visualização pública
    • Data de lançamento: 26 de agosto de 2025
Controlos de segurança
Consulte os Controlos de segurança para mais informações.
Idiomas suportados Consulte os idiomas suportados.
Preços Consulte os preços.

Áudio nativo da API Live

Gemini 2.5 Flash com funcionalidades de áudio nativas da API Live a nossa funcionalidade de áudio nativa de vanguarda para a API Live. Além das funcionalidades padrão da API Live, este modelo de pré-visualização inclui:

  • Qualidade de voz e adaptabilidade melhoradas: o áudio nativo da API Live oferece interações de voz mais ricas e naturais com 30 vozes HD em 24 idiomas.
  • Apresentamos o áudio proativo: quando o áudio proativo está ativado, o modelo só responde quando é relevante. O modelo gera transcrições de texto e respostas de áudio proativamente apenas para consultas dirigidas ao dispositivo e não responde a consultas não dirigidas ao dispositivo.
  • Apresentamos o diálogo afetivo: os modelos que usam o áudio nativo da API Live podem compreender e responder adequadamente às expressões emocionais dos utilizadores para conversas mais detalhadas.

Para mais informações sobre a API Live, consulte a nossa documentação autónoma da API Live.

Experimentar no Vertex AI

ID do modelo gemini-live-2.5-flash-preview-native-audio
Entradas e saídas suportadas
  • Entradas:
    Áudio, Vídeo
  • Saídas:
    Áudio
Limites de tokens
  • Número máximo de tokens de entrada: 1 048 576
  • Tokens de saída máximos: 128 000 (predefinição)
Capacidades
Tipos de utilização
Limite de tamanho da entrada 500 MB
Especificações técnicas
Vídeo
  • Duração máxima da partilha de ecrã: Aproximadamente 10 minutos
  • Tipos MIME suportados:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima da conversa: Aproximadamente 10 minutos
  • Compreensão da fala para: Resumo, transcrição e tradução de áudio
  • Tipos MIME suportados:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Predefinições de parâmetros
  • Temperatura: 0,0 a 2,0 (predefinição: 1,0)
  • topP: 0,0 a 1,0 (predefinição: 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1 a 8 (predefinição: 1)
Regiões suportadas

Disponibilidade do modelo

  • Estados Unidos
    • us-central1
Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento Janeiro de 2025
Versões
  • gemini-live-2.5-flash-preview-native-audio
    • Fase de lançamento: pré-visualização pública
    • Data de lançamento: 17 de junho de 2025
Controlos de segurança
Consulte os Controlos de segurança para mais informações.
Idiomas suportados Consulte os idiomas suportados.
Preços Consulte os preços.