Modelli Gemini disponibili

Gemini è una famiglia di modelli che elaborano informazioni provenienti da più modalità, tra cui testo, immagini, audio e video. Gemini può esplorare e analizzare grandi quantità di informazioni per comprendere ed elaborare senza problemi questi tipi di dati multimodali. Per maggiori informazioni, consulta la panoramica di Gemini.

Gemini 1.5 Flash è la versione leggera, veloce ed economica della famiglia di modelli Gemini. Gemini 1.5 Pro è progettato per essere più solido.

Questa pagina descrive le specifiche dei modelli Gemini che puoi utilizzare su Google Distributed Cloud (GDC) air-gapped.

Casi d'uso del modello

La tabella seguente riepiloga i casi d'uso dei modelli disponibili nell'API Gemini.

Modello	Input	Output	Caso d'uso
Gemini 1.5 Pro	Testo, codice, immagini, audio, video, video con audio, documenti	Testo	Supporta le applicazioni che richiedono una qualità della risposta migliorata.
Gemini 1.5 Flash	Testo, codice, immagini, audio, video, video con audio, documenti	Testo	Offre velocità ed efficienza per applicazioni economiche.

Le seguenti informazioni forniscono dettagli su ciascun modello Gemini.

Funzionalità	Gemini 1.5 Pro	Gemini 1.5 Flash
Descrizione	Un modello generico per casi d'uso multimodali. Utilizzalo quando hai bisogno di un modello in grado di gestire un numero elevato di richieste e la comprensione di contesti lunghi.	Una versione leggera, veloce ed economica progettata per casi d'uso multimodali. Utilizzalo quando hai bisogno di un modello in grado di gestire un numero elevato di richieste e che sia conveniente.
Funzionalità	Prompt di testo Prompt multimodali: Immagine Audio Video Documenti	Prompt di testo Prompt multimodali: Immagine Audio Video Documenti
Finestra di contesto	Fino a 32.000 token	Fino a 32.000 token
Numero massimo di immagini per prompt	100	100
Dimensione massima immagine RAW	20 MB	20 MB
Dimensione massima dell'immagine con codifica Base64	7 MB	7 MB
Numero massimo di file audio per prompt	Nessun limite	Nessun limite
Durata audio max	15 minuti	09 minuti
Numero massimo di video per prompt	10	10
Durata massima del video (solo fotogrammi)	120 secondi	120 secondi
Durata massima del video (frame e audio)	100 secondi	100 secondi
Dimensione massima del file del documento	50 MB	50 MB
Numero massimo di file di documenti per richiesta	100	100
Numero massimo di pagine per documento	100	100

Scegliere un modello e creare prompt

Devi scegliere il modello da cui vuoi generare la risposta alle richieste di generazione di contenuti. Il modello selezionato influisce sull'output e sui costi.

Gli ID endpoint del modello Gemini in GDC sono i seguenti:

Nome	ID endpoint modello
Gemini Flash	`gemini-1.5-flash`
Gemini Pro	`gemini-1.5-pro`

Poi, devi creare prompt per ottenere output da un modello. Puoi migliorare gli output fornendo al modello istruzioni precise, esempi e il contesto o le informazioni specializzate necessarie. Per saperne di più sui prompt, consulta la pagina Introduzione ai prompt.

Modelli Gemini disponibili Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Casi d'uso del modello

Scegliere un modello e creare prompt

Modelli Gemini disponibili