Modelli Gemini disponibili

Gemini è una famiglia di modelli che elaborano informazioni provenienti da più modalità, tra cui testo, immagini, audio e video. Gemini può esplorare e analizzare grandi quantità di informazioni per comprendere ed elaborare senza problemi questi tipi di dati multimodali. Per maggiori informazioni, consulta la panoramica di Gemini.

Gemini 1.5 Flash è la versione leggera, veloce ed economica della famiglia di modelli Gemini. Gemini 1.5 Pro è progettato per essere più solido.

Questa pagina descrive le specifiche dei modelli Gemini che puoi utilizzare su Google Distributed Cloud (GDC) air-gapped.

Casi d'uso del modello

La tabella seguente riepiloga i casi d'uso dei modelli disponibili nell'API Gemini.

Modello Input Output Caso d'uso
Gemini 1.5 Pro Testo, codice, immagini, audio, video, video con audio, documenti Testo Supporta le applicazioni che richiedono una qualità della risposta migliorata.
Gemini 1.5 Flash Testo, codice, immagini, audio, video, video con audio, documenti Testo Offre velocità ed efficienza per applicazioni economiche.

Le seguenti informazioni forniscono dettagli su ciascun modello Gemini.

Funzionalità Gemini 1.5 Pro Gemini 1.5 Flash
Descrizione Un modello generico per casi d'uso multimodali. Utilizzalo quando hai bisogno di un modello in grado di gestire un numero elevato di richieste e la comprensione di contesti lunghi. Una versione leggera, veloce ed economica progettata per casi d'uso multimodali. Utilizzalo quando hai bisogno di un modello in grado di gestire un numero elevato di richieste e che sia conveniente.
Funzionalità
  • Prompt di testo
  • Prompt multimodali:
    • Immagine
    • Audio
    • Video
    • Documenti
  • Prompt di testo
  • Prompt multimodali:
    • Immagine
    • Audio
    • Video
    • Documenti
Finestra di contesto Fino a 32.000 token Fino a 32.000 token
Numero massimo di immagini per prompt 100 100
Dimensione massima immagine RAW 20 MB 20 MB
Dimensione massima dell'immagine con codifica Base64 7 MB 7 MB
Numero massimo di file audio per prompt Nessun limite Nessun limite
Durata audio max 15 minuti 09 minuti
Numero massimo di video per prompt 10 10
Durata massima del video (solo fotogrammi) 120 secondi 120 secondi
Durata massima del video (frame e audio) 100 secondi 100 secondi
Dimensione massima del file del documento 50 MB 50 MB
Numero massimo di file di documenti per richiesta 100 100
Numero massimo di pagine per documento 100 100

Scegliere un modello e creare prompt

Devi scegliere il modello da cui vuoi generare la risposta alle richieste di generazione di contenuti. Il modello selezionato influisce sull'output e sui costi.

Gli ID endpoint del modello Gemini in GDC sono i seguenti:

Nome ID endpoint modello
Gemini Flash gemini-1.5-flash
Gemini Pro gemini-1.5-pro

Poi, devi creare prompt per ottenere output da un modello. Puoi migliorare gli output fornendo al modello istruzioni precise, esempi e il contesto o le informazioni specializzate necessarie. Per saperne di più sui prompt, consulta la pagina Introduzione ai prompt.