Modelli Google

Vertex AI include un elenco crescente di modelli di base che puoi testare, sottoporre a deployment e personalizzare per l'utilizzo nelle tue applicazioni basate sull'IA. I modelli di base sono ottimizzati per casi d'uso specifici e offerti a diversi prezzi consigliati. Questa pagina riassume i modelli disponibili nelle varie API e fornisce indicazioni su quali modelli scegliere in base al caso d'uso.

Per scoprire di più su tutti i modelli e le API di AI su Vertex AI, consulta Esplora i modelli e le API di AI.

Modelli Gemini

La seguente tabella riassume i modelli disponibili nell'API Gemini:

Nome modello Descrizione Specifiche
Gemini 1.5 Flash
(gemini-1.5-flash)
Modello multimodale progettato per applicazioni a basso costo e con volumi elevati. Gemini 1.5 Flash offre velocità ed efficienza per creare applicazioni rapide e a basso costo senza compromettere la qualità. Numero massimo di token totali (input e output): 1 M
Numero massimo di token di output: 8192
Dimensione massima delle immagini non elaborate: 20 MB
Dimensione massima dell'immagine con codifica Base64: 7 MB
Numero massimo di immagini per richiesta: 3000
Durata massima del video: 1 ora
Numero massimo di video per richiesta: 10
Dimensione massima dell'immagine non elaborata: 8,4 MB circa per l'addestramento del file PDF
Massimo 4 ore di addestramento per PDF
0
Gemini 1.5 Pro
(gemini-1.5-pro)
Modello multimodale che supporta l'aggiunta di file immagine, audio, video e PDF in prompt di testo o di chat per una risposta di testo o codice. Gemini 1.5 Pro supporta la comprensione del contesto lungo con un massimo di 1 milione di token. Massimo totale di token (input e output): 1 M
Numero massimo di token di output: 8192
Numero massimo di immagini per richiesta: 3000
Durata massima del video (solo frame): circa un'ora
Durata massima del video (frame e audio): circa 45 minuti
Durata massima dei video per richiesta: 10
Durata massima audio: circa 8,4 ore
Dimensioni audio massime per richiesta: 1 maggio per i PDF
0 Dati di addestramento
0
Gemini 1.0 Pro
(gemini-1.0-pro)
Il modello con le prestazioni migliori con funzionalità per una vasta gamma di attività di solo testo.

Supporta solo il testo come input.
Supporta l'ottimizzazione supervisionata.
Numero massimo di token totali (input e output): 32.760
Numero massimo di token di output: 8192
Dati di addestramento: fino a febbraio 2023
Gemini 1.0 Pro Vision
(gemini-1.0-pro-vision)
Il modello di comprensione di immagini/video con le migliori prestazioni per gestire una vasta gamma di applicazioni.

Sono supportati testo, immagini e video come input.
Numero massimo di token totali (input e output): 16.384
Numero massimo di token di output: 2048
Numero massimo di immagini per richiesta: 16
Durata massima del video: 2 minuti
Numero massimo di video per richiesta: 1
Dati di addestramento: fino a febbraio 2023
Gemini 1.0 Ultra (GA con lista consentita) Il modello di testo più potente di Google, ottimizzato per attività complesse, tra cui istruzioni, codice e ragionamento.

Supporta solo il testo come input.
Numero massimo di token inseriti: 8192
Output massimo di token: 2048
Gemini 1.0 Ultra Vision
(GA con elenco di autorizzazioni)
Il modello di visione multimodale più potente di Google, ottimizzato per supportare testi, immagini e input video congiunti. Numero massimo di token inseriti: 8192
Output massimo di token: 2048

Supporto dei linguaggi di Gemini

I modelli Gemini supportano le seguenti lingue:
arabo (ar), bengalese (bn), bulgaro (bg), cinese semplificato e tradizionale (zh), croato (hr), ceco (cs), danese (da), olandese (nl), inglese (en), estone (et), finlandese (fi), francese (fr), tedesco (de), greco (el), ebraico (iw), hindi (ungherese), hindi (hit),

Modelli di incorporamento

La tabella seguente riassume i modelli disponibili nell'API Embeddings.

Nome modello Descrizione Specifiche
Incorporamenti per il testo
(textembedding-gecko@001,
textembedding-gecko@002,
textembedding-gecko@003,
text-embedding-004
)
Restituisce gli incorporamenti per gli input di testo in inglese.

Supporta l'ottimizzazione supervisionata dei modelli "text-embedding-gecko", solo in inglese.
Numero massimo di token di input: 3072 (textembedding-gecko@001),
2048 (altri).

Dimensione di incorporamento: text-embedding-004: <=768
Altro: 768.
Incorporamenti per testo multilingue
(textembedding-gecko-multilingual@001,
text-multilingual-embedding-002)
Restituisce gli incorporamenti per gli input di testo di oltre 100 lingue

Supporta l'ottimizzazione supervisionata del modello text-multilingual-embedding-002.
supporta 100 lingue.
Numero massimo di token inseriti: 2048

Dimensione di incorporamento: text-multilingual-embedding-002: <=768
Altri: 768.
Incorporamenti per multimodali
(multimodalembedding)
Restituisce l'incorporamento per gli input di testo, immagine e video, al fine di confrontare i contenuti tra modelli diversi.

Converte testo, immagini e video nello stesso spazio vettoriale. I video supportano solo le dimensioni 1408.
Solo in inglese
Inserimento massimo di token: 32.
Dimensioni massime dell'immagine: 20 MB, Lunghezza massima del video: due minuti,

Dimensione di incorporamento: 128, 256, 512 o 1408 per l'input di testo e immagini, 1408 per l'input video.

Supporto del linguaggio degli incorporamenti

I modelli di incorporamento multilingua

Modello Imagen

La seguente tabella riassume i modelli disponibili nell'API Imagen:

Nome modello Descrizione Specifiche
Immagine 2
(imagegeneration@006)
Questo modello supporta la generazione e la modifica di immagini per creare immagini di alta qualità in pochi secondi.

La funzionalità di modifica supporta la rimozione e l'inserimento di oggetti, l'outpainting e la modifica dei prodotti
Output massimo delle immagini: quattro
Proporzioni (per la generazione): 1:1, 9:16, 16:9, 3:4, 4:3

Risoluzione: circa 1500 pixel (varia in base alle proporzioni)

Supporto dei linguaggi Imagen

Il modello Imagen supporta le seguenti lingue:
inglese, cinese (semplificato), cinese (tradizionale), hindi, giapponese, coreano, portoghese e spagnolo.

Modello di completamento del codice

La tabella seguente riassume i modelli disponibili nelle API Codey:

Nome modello Descrizione Specifiche
Codey per il completamento del codice
(code-gecko)
È un modello perfezionato per suggerire il completamento del codice in base al contesto nel codice scritto. Numero massimo di token di input: 2048
Numero massimo di token di output: 64

Modelli MedLM

La tabella seguente riassume i modelli disponibili nell'API MedLM:

Nome modello Descrizione Specifiche
MedLM-medio (medlm-medium) Una suite di modelli e API conformi alla normativa HIPAA e basata su Google Research.

Questo modello aiuta gli operatori sanitari a svolgere attività di domande e risposte mediche, nonché attività di riepilogo dei documenti sanitari e medici. Offre una velocità effettiva migliore e include dati più recenti rispetto al modello medlm-large.
Numero massimo di token (input + output): 32.768
Numero massimo di token di output: 8192
MedLM-large (medlm-large) Questo modello aiuta gli operatori sanitari a svolgere attività di domande e risposte mediche, nonché attività di riassunto dei documenti sanitari e medici. Numero massimo di token di input: 8192
Numero massimo di token di output: 1024

Versioni del modello e ciclo di vita

Ogni modello linguistico dell'IA generativa su Vertex AI è disponibile in una versione stabile e in una versione aggiornata automaticamente. Consulta gli argomenti seguenti per scoprire come funziona il controllo delle versioni dei modelli con i modelli Gemini. Per saperne di più sulle versioni dei modelli Imagen on Vertex AI e sul loro ciclo di vita, consulta Imagen sulle versioni e il ciclo di vita dei modelli di Imagen su Vertex AI.

Se ottimizzi un modello Gemini, il modello ottimizzato condivide la stessa data di interruzione del modello di base che hai utilizzato nel processo di ottimizzazione. Per maggiori informazioni, consulta Panoramica dell'ottimizzazione del modello per Gemini.

Versione stabile di Gemini

Una versione stabile di un modello Gemini non cambia e continua a essere disponibile fino alla data di interruzione. Consulta le tabelle nella sezione Versioni dei modelli Gemini stabili disponibili in questa pagina per scoprire le date di non disponibilità dei modelli Gemini. Se utilizzi uno stato stabile dopo la data di interruzione, devi passare a una versione stabile più recente disponibile. Puoi identificare la versione di un modello stabile dal numero di tre cifre aggiunto al nome del modello. Ad esempio, gemini-1.0-pro-001 è la versione numero uno della release stabile del modello Gemini 1.0 Pro.

Google rilascia versioni stabili con cadenza regolare. Puoi passare da una versione stabile a un'altra finché l'altra versione è ancora disponibile. Quando passi da una versione stabile a un'altra versione stabile, devi eseguire di nuovo i job di ottimizzazione perché potrebbero esserci prompt, output e altre differenze tra le versioni.

Per utilizzare la versione stabile di un modello Gemini, aggiungi al modello il numero di versione a tre cifre con un trattino (-). Ad esempio, per specificare il modello gemini-1.0-pro stabile della versione sei, aggiungi -006 al nome del modello:

https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.0-pro-006

Versioni del modello Gemini stabili disponibili

Per i modelli Gemini in disponibilità generale sono disponibili le seguenti versioni di modelli stabili:

Modello Flash Gemini 1.5 Data di uscita Data di interruzione
gemini-1.5-flash-001 24 maggio 2024 24 maggio 2025
Modello Gemini 1.5 Pro Data di uscita Data di interruzione
gemini-1.5-pro-001 24 maggio 2024 24 maggio 2025
Modello Gemini 1.0 Pro Vision Data di uscita Data di interruzione
gemini-1.0-pro-vision-001 15 febbraio 2024 15 febbraio 2025
Modello Gemini 1.0 Pro Data di uscita Data di interruzione
gemini-1.0-pro-001 15 febbraio 2024 15 febbraio 2025
gemini-1.0-pro-002 9 aprile 2024 9 aprile 2025

Versione aggiornata automaticamente di Gemini

La versione aggiornata automaticamente di un modello Gemini punta alla versione stabile più recente. Quando viene rilasciata una nuova versione stabile, la versione aggiornata automaticamente punta alla nuova versione. Ciò significa che se specifichi nel codice la versione aggiornata automaticamente di un modello Gemini, questo potrebbe comportarsi in modo diverso senza preavviso quando viene rilasciata la versione stabile successiva. Per questo motivo, usa con cautela la versione aggiornata automaticamente se ottimizzi il modello.

Per utilizzare la versione aggiornata automaticamente di un modello, non aggiungere nulla al nome del modello. Ad esempio, quanto segue utilizza la versione aggiornata automaticamente del modello gemini-1.0-pro-vision:

https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.0-pro-vision

Modelli Gemini aggiornati automaticamente

La tabella seguente mostra le versioni del modello Gemini aggiornate automaticamente e la versione stabile a cui fa riferimento.

Nome modello Nome aggiornato automaticamente Versione stabile a cui viene fatto riferimento
Gemini 1.0 Pro Vision gemini-1.0-pro-vision gemini-1.0-pro-vision-001
Gemini 1.0 Pro gemini-1.0-pro gemini-1.0-pro-002

Versione di anteprima di Gemini

La versione di anteprima di un modello Gemini è un modello in anteprima e non disponibile pubblicamente (GA). Una versione di anteprima di un modello contiene funzionalità non incluse nella versione più recente o aggiornata automaticamente di un modello. Poiché una versione del modello di anteprima non è stabile, ne sconsiglia l'uso in produzione.

Ogni modello preview include la sua data di rilascio come parte del nome del modello utilizzato nel codice. Il pattern del nome utilizzato da un modello preview è model_name-preview-MMDD. Ad esempio, gemini-1.5-pro-preview-0409 è la prima versione di anteprima del modello Gemini 1.5 Pro ed è stata rilasciata il 9 aprile. Quando viene rilasciata una nuova versione di anteprima di un modello, quella precedente viene aggiornata in modo da puntare alla nuova versione di anteprima ed è disponibile fino alla data di interruzione.

Modelli di anteprima di Gemini

La tabella seguente mostra le versioni del modello Gemini disponibili in anteprima e la versione di anteprima a cui fa riferimento.

Nome modello Nome anteprima Data di interruzione
Gemini 1.5 Flash (anteprima) gemini-1.5-flash-preview-0514 24 giugno 2024
Gemini 1.5 Pro (anteprima) gemini-1.5-pro-preview-0514 24 giugno 2024
Gemini 1.5 Pro (anteprima) gemini-1.5-pro-preview-0409 (rimanda e utilizza gemini-1.5-pro-preview-0514) 14 giugno 2024

Versioni di modelli stabili con completamento del codice

Le seguenti versioni di modelli stabili sono disponibili per i modelli di IA generativa in disponibilità generale:

modello code-gecko Data di uscita Data di interruzione
codice-gecko@002 6 dicembre 2023 9 ottobre 2024
codice-gecko@001 29 giugno 2023 6 luglio 2024

Versioni di modelli stabili per gli incorporamenti

Le seguenti versioni di modelli stabili sono disponibili per i modelli di IA generativa in disponibilità generale:

modello textembedding-gecko Data di uscita Data di interruzione
incorporamento-testo-004 14 maggio 2024 14 maggio 2025
text-embedding-preview-0409 9 aprile 2024 27 giugno 2024
text-multilingual-embedding-002 14 maggio 2024 14 maggio 2025
text-multilingual-embedding-preview-0409 9 aprile 2024 27 giugno 2024
textembedding-gecko@003 12 dicembre 2023 12 dicembre 2024
textembedding-gecko-multilingual@001 2 novembre 2023 12 dicembre 2024
textembedding-gecko@002
(pregresso, ma ancora supportato)
2 novembre 2023 9 ottobre 2024
textembedding-gecko@001 7 giugno 2023 9 ottobre 2024
multimodalembedding@001 12 febbraio 2024 12 febbraio 2025

Supporto delle lingue MedLM

Il modello MedLM supporta la lingua inglese.

Esplora tutti i modelli in Model Garden

Model Garden è una piattaforma che ti aiuta a scoprire, testare, personalizzare ed eseguire il deployment di modelli e asset OSS di proprietà di Google e selezionati. Per esplorare i modelli di IA generativa e le API disponibili su Vertex AI, vai a Model Garden nella console Google Cloud.

Vai a Model Garden

Per scoprire di più su Model Garden, inclusi i modelli e le funzionalità disponibili, consulta Esplorare i modelli AI in Model Garden.

Passaggi successivi