O Gemini é uma família de modelos que processam informações de várias modalidades, incluindo texto, imagens, áudio e vídeo. O Gemini pode explorar e analisar grandes quantidades de informações para compreender e processar facilmente estes tipos de dados multimodais. Para mais informações, consulte o artigo Vista geral do Gemini.
O Gemini 1.5 Flash é a versão leve, rápida e económica da família de modelos Gemini. O Gemini 1.5 Pro foi concebido para ser mais robusto.
Esta página descreve as especificações dos modelos Gemini que pode usar no Google Distributed Cloud (GDC) air-gapped.
Exemplos de utilização de modelos
A tabela seguinte resume os exemplos de utilização de modelos disponíveis na API Gemini.
| Modelo | Entradas | Resultados | Exemplo de utilização |
|---|---|---|---|
| Gemini 1.5 Pro | Texto, código, imagens, áudio, vídeo, vídeo com áudio e documentos | Texto | Suporta aplicações que requerem uma qualidade de resposta melhorada. |
| Gemini 1.5 Flash | Texto, código, imagens, áudio, vídeo, vídeo com áudio e documentos | Texto | Oferece velocidade e eficiência para aplicações económicas. |
As informações seguintes fornecem detalhes para cada modelo Gemini.
| Funcionalidade | Gemini 1.5 Pro | Gemini 1.5 Flash |
|---|---|---|
| Descrição | Um modelo de uso geral para exemplos de utilização multimodal. Use quando precisar de um modelo que possa processar um grande número de pedidos e compreender o contexto longo. | Uma versão leve, rápida e económica concebida para exemplos de utilização multimodal. Use quando precisar de um modelo que possa processar um grande número de pedidos e seja rentável. |
| Capacidades |
|
|
| Capacidade de resposta | Até 32 000 tokens | Até 32 000 tokens |
| Número máximo de imagens por comando | 100 | 100 |
| Tamanho máximo da imagem não processada | 20 MB | 20 MB |
| Tamanho máximo da imagem codificada em base64 | 7 MB | 7 MB |
| Máximo de ficheiros de áudio por comando | Sem limite | Sem limite |
| Duração máxima do áudio | 15 minutos | 09 minutos |
| Número máximo de vídeos por comando | 10 | 10 |
| Duração máxima do vídeo (apenas frames) | 120 segundos | 120 segundos |
| Duração máxima do vídeo (frames e áudio) | 100 segundos | 100 segundos |
| Tamanho máximo do ficheiro de documento | 50 MB | 50 MB |
| Máximo de ficheiros de documentos por pedido | 100 | 100 |
| Número máximo de páginas por documento | 100 | 100 |
Escolha um modelo e crie comandos
Tem de escolher o modelo a partir do qual quer gerar a resposta a pedidos de geração de conteúdo. O modelo que selecionar influencia o resultado e afeta o custo.
Os IDs dos pontos finais do modelo Gemini no GDC são os seguintes:
| Nome | ID do ponto final do modelo |
|---|---|
| Gemini Flash | gemini-1.5-flash |
| Gemini Pro | gemini-1.5-pro |
Em seguida, tem de criar comandos para obter resultados de um modelo. Pode melhorar os resultados dando ao modelo instruções precisas, exemplos e o contexto ou as informações especializadas necessárias. Para saber mais sobre os comandos, consulte o artigo Introdução aos comandos.