Gemini è una famiglia di modelli che elaborano informazioni provenienti da più modalità, tra cui testo, immagini, audio e video. Gemini può esplorare e analizzare grandi quantità di informazioni per comprendere ed elaborare senza problemi questi tipi di dati multimodali. Per maggiori informazioni, consulta la panoramica di Gemini.
Gemini 1.5 Flash è la versione leggera, veloce ed economica della famiglia di modelli Gemini. Gemini 1.5 Pro è progettato per essere più solido.
Questa pagina descrive le specifiche dei modelli Gemini che puoi utilizzare su Google Distributed Cloud (GDC) air-gapped.
Casi d'uso del modello
La tabella seguente riepiloga i casi d'uso dei modelli disponibili nell'API Gemini.
| Modello | Input | Output | Caso d'uso |
|---|---|---|---|
| Gemini 1.5 Pro | Testo, codice, immagini, audio, video, video con audio, documenti | Testo | Supporta le applicazioni che richiedono una qualità della risposta migliorata. |
| Gemini 1.5 Flash | Testo, codice, immagini, audio, video, video con audio, documenti | Testo | Offre velocità ed efficienza per applicazioni economiche. |
Le seguenti informazioni forniscono dettagli su ciascun modello Gemini.
| Funzionalità | Gemini 1.5 Pro | Gemini 1.5 Flash |
|---|---|---|
| Descrizione | Un modello generico per casi d'uso multimodali. Utilizzalo quando hai bisogno di un modello in grado di gestire un numero elevato di richieste e la comprensione di contesti lunghi. | Una versione leggera, veloce ed economica progettata per casi d'uso multimodali. Utilizzalo quando hai bisogno di un modello in grado di gestire un numero elevato di richieste e che sia conveniente. |
| Funzionalità |
|
|
| Finestra di contesto | Fino a 32.000 token | Fino a 32.000 token |
| Numero massimo di immagini per prompt | 100 | 100 |
| Dimensione massima immagine RAW | 20 MB | 20 MB |
| Dimensione massima dell'immagine con codifica Base64 | 7 MB | 7 MB |
| Numero massimo di file audio per prompt | Nessun limite | Nessun limite |
| Durata audio max | 15 minuti | 09 minuti |
| Numero massimo di video per prompt | 10 | 10 |
| Durata massima del video (solo fotogrammi) | 120 secondi | 120 secondi |
| Durata massima del video (frame e audio) | 100 secondi | 100 secondi |
| Dimensione massima del file del documento | 50 MB | 50 MB |
| Numero massimo di file di documenti per richiesta | 100 | 100 |
| Numero massimo di pagine per documento | 100 | 100 |
Scegliere un modello e creare prompt
Devi scegliere il modello da cui vuoi generare la risposta alle richieste di generazione di contenuti. Il modello selezionato influisce sull'output e sui costi.
Gli ID endpoint del modello Gemini in GDC sono i seguenti:
| Nome | ID endpoint modello |
|---|---|
| Gemini Flash | gemini-1.5-flash |
| Gemini Pro | gemini-1.5-pro |
Poi, devi creare prompt per ottenere output da un modello. Puoi migliorare gli output fornendo al modello istruzioni precise, esempi e il contesto o le informazioni specializzate necessarie. Per saperne di più sui prompt, consulta la pagina Introduzione ai prompt.