Modelos do Gemini disponíveis

O Gemini é uma família de modelos que processam informações de várias modalidades, incluindo texto, imagens, áudio e vídeo. O Gemini pode explorar e analisar grandes quantidades de informações para compreender e processar facilmente estes tipos de dados multimodais. Para mais informações, consulte o artigo Vista geral do Gemini.

O Gemini 1.5 Flash é a versão leve, rápida e económica da família de modelos Gemini. O Gemini 1.5 Pro foi concebido para ser mais robusto.

Esta página descreve as especificações dos modelos Gemini que pode usar no Google Distributed Cloud (GDC) air-gapped.

Exemplos de utilização de modelos

A tabela seguinte resume os exemplos de utilização de modelos disponíveis na API Gemini.

Modelo Entradas Resultados Exemplo de utilização
Gemini 1.5 Pro Texto, código, imagens, áudio, vídeo, vídeo com áudio e documentos Texto Suporta aplicações que requerem uma qualidade de resposta melhorada.
Gemini 1.5 Flash Texto, código, imagens, áudio, vídeo, vídeo com áudio e documentos Texto Oferece velocidade e eficiência para aplicações económicas.

As informações seguintes fornecem detalhes para cada modelo Gemini.

Funcionalidade Gemini 1.5 Pro Gemini 1.5 Flash
Descrição Um modelo de uso geral para exemplos de utilização multimodal. Use quando precisar de um modelo que possa processar um grande número de pedidos e compreender o contexto longo. Uma versão leve, rápida e económica concebida para exemplos de utilização multimodal. Use quando precisar de um modelo que possa processar um grande número de pedidos e seja rentável.
Capacidades
  • Comandos de texto
  • Comandos multimodais:
    • Imagem
    • Áudio
    • Vídeo
    • Documentos
  • Comandos de texto
  • Comandos multimodais:
    • Imagem
    • Áudio
    • Vídeo
    • Documentos
Capacidade de resposta Até 32 000 tokens Até 32 000 tokens
Número máximo de imagens por comando 100 100
Tamanho máximo da imagem não processada 20 MB 20 MB
Tamanho máximo da imagem codificada em base64 7 MB 7 MB
Máximo de ficheiros de áudio por comando Sem limite Sem limite
Duração máxima do áudio 15 minutos 09 minutos
Número máximo de vídeos por comando 10 10
Duração máxima do vídeo (apenas frames) 120 segundos 120 segundos
Duração máxima do vídeo (frames e áudio) 100 segundos 100 segundos
Tamanho máximo do ficheiro de documento 50 MB 50 MB
Máximo de ficheiros de documentos por pedido 100 100
Número máximo de páginas por documento 100 100

Escolha um modelo e crie comandos

Tem de escolher o modelo a partir do qual quer gerar a resposta a pedidos de geração de conteúdo. O modelo que selecionar influencia o resultado e afeta o custo.

Os IDs dos pontos finais do modelo Gemini no GDC são os seguintes:

Nome ID do ponto final do modelo
Gemini Flash gemini-1.5-flash
Gemini Pro gemini-1.5-pro

Em seguida, tem de criar comandos para obter resultados de um modelo. Pode melhorar os resultados dando ao modelo instruções precisas, exemplos e o contexto ou as informações especializadas necessárias. Para saber mais sobre os comandos, consulte o artigo Introdução aos comandos.