A partir de 29 de abril de 2025, os modelos Gemini 1.5 Pro e Gemini 1.5 Flash não estão disponíveis em projetos que não tenham usado estes modelos anteriormente, incluindo novos projetos. Para ver detalhes, consulte o artigo Versões e ciclo de vida dos modelos.

Esta página foi traduzida pela API Cloud Translation.

Gemini 2.5 Flash

O Gemini 2.5 Flash é o nosso melhor modelo em termos de preço e desempenho, e oferece capacidades abrangentes. O Gemini 2.5 Flash é o nosso primeiro modelo Flash com capacidades de raciocínio, que lhe permite ver o processo de raciocínio pelo qual o modelo passa quando gera a sua resposta.

Para informações técnicas ainda mais detalhadas sobre o Gemini 2.5 Flash (como referências de desempenho, informações sobre os nossos conjuntos de dados de preparação, esforços em sustentabilidade, utilização e limitações pretendidas, e a nossa abordagem à ética e segurança), consulte o nosso relatório técnico sobre os nossos modelos Gemini 2.5 e o cartão do modelo do Gemini 2.5 Flash.

2.5 Flash

Nota: a versão gemini-live-2.5-flash do Gemini 2.5 Flash está disponível como uma oferta de disponibilidade geral privada. Contacte o representante da Equipa das Contas Google para pedir acesso.

Experimentar na Vertex AI Ver no Model Garden (Pré-visualização) Implementar app de exemplo

Nota: para usar a funcionalidade "Implementar app de exemplo", precisa de um projeto do Google Cloud com a faturação e a API Vertex AI ativadas.

Especificações técnicas
ID do modelo	`gemini-2.5-flash`
Entradas e saídas suportadas	Entradas: Texto, Código, Imagens, Áudio, Vídeo Resultados: Texto
Limites de tokens	Número máximo de tokens de entrada: 1 048 576 Tokens de saída máximos: 65 535 (predefinição)
Capacidades	Suportado Fundamentação com a Pesquisa Google Execução de código Ajuste Instruções do sistema Saída estruturada Chamada de funções Contagem de tokens API Live Funcionalidade de pré-visualização A pensar Colocação em cache do contexto Vertex AI RAG Engine Conclusões de chat Não suportado
Tipos de utilização	Suportado Débito aprovisionado Quota partilhada dinâmica Previsão em lote Não suportado Quota fixa
Tipos de utilização	Limite de tamanho da entrada	500 MB
	Imagens	Número máximo de imagens por comando: 3000 Tamanho máximo da imagem: 7 MB Tipos MIME suportados: `image/png`, `image/jpeg`, `image/webp`
	Documentos	Número máximo de ficheiros por comando: 3000 Número máximo de páginas por ficheiro: 1000 Tamanho máximo do ficheiro por ficheiro para as importações da API ou do Google Cloud Storage: 50 MB Tamanho máximo do ficheiro por ficheiro para carregamentos diretos através da consola: 7 MB Tipos MIME suportados: `application/pdf`, `text/plain`
	Vídeo	Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos Duração máxima do vídeo (sem áudio): Aproximadamente 1 hora Número máximo de vídeos por comando: 10 Tipos MIME suportados: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Áudio	Duração máxima do áudio por comando: Aproximadamente 8, 4 horas ou até 1 milhão de tokens Número máximo de ficheiros de áudio por comando: 1 Compreensão da fala para: Resumo, transcrição e tradução de áudio Tipos MIME suportados: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Predefinições de parâmetros	Temperatura: 0,0 a 2,0 (predefinição: 1,0) topP: 0,0 a 1,0 (predefinição: 0,95) topK: 64 (fixo) candidateCount: 1 a 8 (predefinição: 1)
Regiões suportadas
	Disponibilidade do modelo (Inclui a quota partilhada dinâmica e o débito aprovisionado)	Global Global Estados Unidos us-central1 us-east1 us-east4 us-east5 us-south1 us-west1 us-west4 Europa europe-central2 europe-north1 europe-southwest1 europe-west1 europe-west4 europe-west8
	Processamento de ML	Estados Unidos Multirregião Canadá northamerica-northeast1 Europa Multirregião europe-west2^* europe-west3^* Ásia-Pacífico asia-northeast1^* asia-northeast3^* asia-south1^* asia-southeast1 australia-southeast1^*
	Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento	Janeiro de 2025
Versões	`gemini-2.5-flash` Fase de lançamento: GA Data de lançamento: 17 de junho de 2025 Data de descontinuação: 17 de junho de 2026 `gemini-live-2.5-flash` Fase de lançamento: GA privado Data de lançamento: 17 de junho de 2025 `gemini-2.5-flash-preview-05-20` Fase de lançamento: pré-visualização pública Data de lançamento: 20 de maio de 2025 Data de descontinuação: 15 de julho de 2025 `gemini-2.5-flash-preview-04-17` Fase de lançamento: pré-visualização pública Data de lançamento: 17 de abril de 2025 Data de descontinuação: 15 de julho de 2025
Controlos de segurança
Controlos de segurança	Consulte os Controlos de segurança para mais informações.
Idiomas suportados	Consulte os idiomas suportados.
Preços	Consulte os preços.

+ A otimização precisa supervisionada não é suportada
* Disponível apenas para a capacidade de resposta de 128 mil tokens

Imagem

Pré-visualizar

Este produto ou funcionalidade é uma oferta de pré-visualização de IA generativa, sujeita aos "Termos das Ofertas de Pré-DG" dos Termos Específicos do Serviço da Google Cloud, bem como aos Termos Adicionais para Produtos de Pré-visualização de IA Generativa. Para esta oferta de pré-visualização de IA generativa, os clientes podem optar por utilizá-la para fins de produção ou comerciais, ou divulgar o resultado gerado a terceiros, e podem tratar dados pessoais conforme descrito na Alteração ao Tratamento de Dados do Cloud, sujeito às obrigações e restrições descritas no contrato ao abrigo do qual acede ao Google Cloud. Os produtos pré-GA estão disponíveis "tal como estão" e podem ter apoio técnico limitado. Para mais informações, consulte as descrições das fases de lançamento.

Experimentar no Vertex AI (Pré-visualização) Implementar app de exemplo

Nota: para usar a funcionalidade "Implementar app de exemplo", precisa de um projeto do Google Cloud com a faturação e a API Vertex AI ativadas.

Especificações técnicas
ID do modelo	`gemini-2.5-flash-image-preview`
Entradas e saídas suportadas	Entradas: Texto, Imagens Resultados: Texto e imagem
Limites de tokens	Máximo de tokens de entrada: 32 768 Máximo de tokens de saída: 32 768
Capacidades	Suportado Instruções do sistema Contagem de tokens Não suportado Fundamentação com a Pesquisa Google Execução de código Ajuste Chamada de funções API Live Funcionalidade de pré-visualização A pensar Colocação em cache do contexto Vertex AI RAG Engine Conclusões de chat
Tipos de utilização	Suportado Débito aprovisionado Quota partilhada dinâmica Não suportado Quota fixa Previsão em lote
Limite de tamanho da entrada	500 MB
	Imagens	Número máximo de imagens por comando: 3 Tamanho máximo da imagem: 7 MB Número máximo de imagens de saída por comando: 10 Tipos MIME suportados: `image/png`, `image/jpeg`, `image/webp`
	Documentos	Número máximo de ficheiros por comando: 3 Número máximo de páginas por ficheiro: 3 Tamanho máximo do ficheiro por ficheiro: 50 MB Tipos MIME suportados: `application/pdf`, `text/plain`
	Predefinições de parâmetros	Temperatura: 0,0 a 2,0 (predefinição: 1,0) topP: 0,0 a 1,0 (predefinição: 0,95) topK: 64 (fixo) candidateCount: 1 a 8 (predefinição: 1)
Regiões suportadas
	Disponibilidade do modelo	Global Global
	Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento	Junho de 2025
Versões	`gemini-2.5-flash-image-preview` Fase de lançamento: pré-visualização pública Data de lançamento: 26 de agosto de 2025
Controlos de segurança
Controlos de segurança	Consulte os Controlos de segurança para mais informações.
Idiomas suportados	Consulte os idiomas suportados.
Preços	Consulte os preços.

Áudio nativo da API Live

Gemini 2.5 Flash com funcionalidades de áudio nativas da API Live a nossa funcionalidade de áudio nativa de vanguarda para a API Live. Além das funcionalidades padrão da API Live, este modelo de pré-visualização inclui:

Qualidade de voz e adaptabilidade melhoradas: o áudio nativo da API Live oferece interações de voz mais ricas e naturais com 30 vozes HD em 24 idiomas.
Apresentamos o áudio proativo: quando o áudio proativo está ativado, o modelo só responde quando é relevante. O modelo gera transcrições de texto e respostas de áudio proativamente apenas para consultas dirigidas ao dispositivo e não responde a consultas não dirigidas ao dispositivo.
Apresentamos o diálogo afetivo: os modelos que usam o áudio nativo da API Live podem compreender e responder adequadamente às expressões emocionais dos utilizadores para conversas mais detalhadas.

Para mais informações sobre a API Live, consulte a nossa documentação autónoma da API Live.

Experimentar no Vertex AI

Especificações técnicas
ID do modelo	`gemini-live-2.5-flash-preview-native-audio`
Entradas e saídas suportadas	Entradas: Áudio, Vídeo Saídas: Áudio
Limites de tokens	Número máximo de tokens de entrada: 1 048 576 Tokens de saída máximos: 128 000 (predefinição)
Capacidades	Suportado Fundamentação com a Pesquisa Google Chamada de funções API Live Funcionalidade de pré-visualização Não suportado Execução de código Ajuste Instruções do sistema Saída estruturada A pensar Colocação em cache do contexto Vertex AI RAG Engine Conclusões de chat
Tipos de utilização	Suportado Quota fixa Não suportado Débito aprovisionado Quota partilhada dinâmica Previsão em lote
Limite de tamanho da entrada	500 MB
	Vídeo	Duração máxima da partilha de ecrã: Aproximadamente 10 minutos Tipos MIME suportados: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Áudio	Duração máxima da conversa: Aproximadamente 10 minutos Compreensão da fala para: Resumo, transcrição e tradução de áudio Tipos MIME suportados: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Predefinições de parâmetros	Temperatura: 0,0 a 2,0 (predefinição: 1,0) topP: 0,0 a 1,0 (predefinição: 0,95) topK: 64 (fixo) candidateCount: 1 a 8 (predefinição: 1)
Regiões suportadas
	Disponibilidade do modelo	Estados Unidos us-central1
	Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento	Janeiro de 2025
Versões	`gemini-live-2.5-flash-preview-native-audio` Fase de lançamento: pré-visualização pública Data de lançamento: 17 de junho de 2025
Controlos de segurança
Controlos de segurança	Consulte os Controlos de segurança para mais informações.
Idiomas suportados	Consulte os idiomas suportados.
Preços	Consulte os preços.

Gemini 2.5 Flash Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

2.5 Flash

Imagem

Áudio nativo da API Live

Gemini 2.5 Flash