Modelli Google

Vertex AI offre un elenco crescente di modelli di base che puoi testare, eseguire il deployment e personalizzare per l'uso nelle tue applicazioni basate sull'IA. I modelli di base sono ottimizzati per casi d'uso specifici e offerti a diversi prezzi consigliati. Questa pagina riassume i modelli disponibili nelle varie API e offre indicazioni sui modelli da scegliere in base al caso d'uso.

Per saperne di più su tutti i modelli IA e le API su Vertex AI, consulta Esplorare modelli IA e API.

Modelli Gemini

La seguente tabella riassume i modelli disponibili nell'API Gemini:

Nome del modello Descrizione Specifiche
Flash Gemini 1.5
(gemini-1.5-flash)
Modello multimodale progettato per applicazioni convenienti e in volumi elevati. Gemini 1.5 Flash offre velocità ed efficienza per creare applicazioni rapide e a basso costo senza compromettere la qualità. Numero massimo di token totali (input e output): 1 milione
Numero massimo di token di output: 8192
Dimensioni massime delle immagini non elaborate: 20 MB
Dimensioni massime delle immagini codificate in Base64: 7 MB
Numero massimo di immagini per prompt: 3000
Durata massima del video: 1 ora
Lunghezza massima dell'audio per prompt: 10
Lunghezza massima dell'audio: circa 8,4 ore
3 MB

Gemini 1.5 Pro
(gemini-1.5-pro)
Modello multimodale che supporta l'aggiunta di file immagine, audio, video e PDF in prompt di testo o chat per fornire una risposta di testo o codice. Gemini 1.5 Pro supporta la comprensione di contesto lungo con un massimo di 1 milione di token. Numero massimo di token (input e output): 1 milione
Numero massimo di token di output: 8192
Numero massimo di immagini per prompt: 3000
Lunghezza massima del video (solo fotogrammi): circa un'ora
Lunghezza massima del video (frame e audio): circa 45 minuti
Lunghezza massima dei video per prompt: 10
Durata massima dell'audio: circa 8,4 ore
Dimensioni massime dell'audio per prompt: 1 MB

Gemini 1.0 Pro
(gemini-1.0-pro)
Il modello con le prestazioni migliori, con funzionalità per una vasta gamma di attività di solo testo.

Supporta solo testo come input.
Supporta l'ottimizzazione supervisionata.
Numero massimo di token di output (input e output): 32.760
Numero massimo di token di output: 8192
Dati di addestramento: fino a febbraio 2023
Gemini 1.0 Pro Vision
(gemini-1.0-pro-vision)
Il modello di comprensione di immagini/video con le migliori prestazioni per gestire una vasta gamma di applicazioni.

Supporta testo, immagini e video come input.
Numero massimo di token totali (input e output): 16.384
Numero massimo di token di output: 2048
Numero massimo di immagini per prompt: 16
Durata massima video: 2 minuti
Numero massimo di video per prompt: 1
Dati di addestramento: fino a febbraio 2023
Gemini 1.0 Ultra (GA con lista consentita) Il modello di testo più avanzato di Google, ottimizzato per attività complesse, tra cui istruzioni, codice e ragionamento.

Supporta solo testo come input.
Numero massimo di token di input: 8192
Numero massimo di token di output: 2048
Gemini 1.0 Ultra Vision
(GA con lista consentita)
Il miglior modello di visione artificiale multimodale di Google, ottimizzato per supportare input di testo, immagini e video congiunti. Numero massimo di token di input: 8192
Numero massimo di token di output: 2048

Supporto della lingua Gemini

I modelli Gemini supportano le seguenti lingue:
arabo (ar), bengalese (bn), bulgaro (bg), cinese semplificato e tradizionale (zh), croato (hr), ceco (cs), danese (da), olandese (nl), inglese (en), estone (et), finlandese (fi), inglese (en), estone (et), olandese (nl), francese (fr), tedesco (de), greco (el), slovacco (slovacco), svizzero (slovacco), svizzero (slovacco), indonesiano (slovacco), indonesiano (slovacco),

Modelli di incorporamento

La tabella seguente riassume i modelli disponibili nell'API Embeddings.

Nome del modello Descrizione Specifiche
Incorporamenti per il testo
(textembedding-gecko@001,
textembedding-gecko@002,
textembedding-gecko@003,
text-embedding-004
)
Restituisce incorporamenti per gli input di testo in inglese.

Supporta l'ottimizzazione supervisionata dei modelli "text-embedding-gecko", solo in inglese.
Input massimo di token: 3072 (textembedding-gecko@001),
2048 (altri).

Dimensione di incorporamento: text-embedding-004: <=768
Altre: 768.
Incorporamenti per il testo multilingue
(textembedding-gecko-multilingual@001,
text-multilingual-embedding-002)
Restituisce incorporamenti per input di testo di oltre 100 lingue.

Supporta l'ottimizzazione supervisionata del modello text-multilingual-embedding-002.
Supporta 100 lingue.
Input massimo di token: 2048

Dimensione di incorporamento: text-multilingual-embedding-002: <=768
Altri: 768.
Incorporamenti per multimodali
(multimodalembedding)
Restituisce l'incorporamento per input di testo, immagini e video per confrontare i contenuti in diversi modelli.

Converti testo, immagini e video nello stesso spazio vettoriale. Il video supporta solo le dimensioni 1408.
Solo in inglese
Input token massimo: 32,
Dimensione massima immagine: 20 MB, Durata video massima: due minuti,

Dimensione di incorporamento: 128, 256, 512 o 1408 per l'input di testo e immagine, 1408 per l'input video.

Supporto delle lingue per gli incorporamenti


Modello Imagen

La seguente tabella riassume i modelli disponibili nell'API Imagen:

Nome del modello Descrizione Specifiche
Immagine 2
(imagegeneration@006)
Questo modello supporta la generazione e la modifica delle immagini per creare immagini di alta qualità in pochi secondi.

La funzionalità di modifica supporta la rimozione e l'inserimento degli oggetti, l'outpainting e la modifica dei prodotti
Output massimo delle immagini: quattro
Proporzioni (per la generazione): 1:1, 9:16, 16:9, 3:4, 4:3

Risoluzione: ~1500 pixel (varia in base alle proporzioni)

Supporto per le lingue Imagen

Il modello Imagen supporta le seguenti lingue:
inglese, cinese (semplificato), cinese (tradizionale), hindi, giapponese, coreano, portoghese e spagnolo.

Modello di completamento del codice

La seguente tabella riassume i modelli disponibili nelle API Codey:

Nome del modello Descrizione Specifiche
Codey per il completamento del codice
(code-gecko)
un modello perfezionato per suggerire il completamento del codice in base al contesto. Numero massimo di token di input: 2048
Numero massimo di token di output: 64

Modelli MedLM

La seguente tabella riassume i modelli disponibili nell'API MedLM:

Nome del modello Descrizione Specifiche
MedLM-medium (medlm-medium) Una suite di API e modelli ottimizzati dal punto di vista medico basata sulla normativa HIPAA basata su Google Research.

Questo modello aiuta gli operatori sanitari con le attività di domande e risposte e di riepilogo per i documenti sanitari e medici. Offre una velocità effettiva migliore e include dati più recenti rispetto al modello medlm-large.
Numero massimo di token (input + output): 32.768
Numero massimo di token di output: 8192
MedLM-large (medlm-large) Questo modello aiuta gli operatori sanitari con le attività di domande e risposte mediche e le attività di riepilogo per i documenti sanitari e medici. Numero massimo di token di input: 8192
Numero massimo di token di output: 1024

Versioni e ciclo di vita del modello

Ogni modello linguistico di IA generativa su Vertex AI è disponibile in una versione stabile e una versione aggiornata automaticamente. Consulta i seguenti argomenti per scoprire come funziona il controllo delle versioni dei modelli con i modelli Gemini. Per saperne di più sulle versioni dei modelli di Vertex AI e sul loro ciclo di vita, consulta Imagen sulle versioni e sul ciclo di vita dei modelli di Vertex AI.

Se ottimizzi un modello Gemini, il modello ottimizzato condivide la stessa data di interruzione del modello di base utilizzato nel processo di ottimizzazione. Per ulteriori informazioni, consulta la Panoramica dell'ottimizzazione del modello per Gemini.

Versione stabile Gemini

Una versione stabile di un modello Gemini non cambia e continua a essere disponibile fino alla data di ritiro. Consulta le tabelle in Versioni stabili disponibili di Gemini in questa pagina per conoscere le date di ritiro dei modelli Gemini. Se utilizzi una versione stabile dopo la data di interruzione, devi passare a una versione stabile disponibile più recente. Puoi identificare la versione di un modello stabile dal numero di tre cifre aggiunto al nome del modello. Ad esempio, gemini-1.0-pro-001 è la versione numero uno della release stabile del modello Gemini 1.0 Pro.

Google rilascia le versioni stabili con cadenza regolare. Puoi passare da una versione stabile a un'altra versione, purché l'altra versione sia ancora disponibile. Quando passi da una versione stabile a un'altra versione stabile, devi eseguire di nuovo i job di ottimizzazione perché potrebbero verificarsi differenze in termini di prompt, output e di altro tipo tra le versioni.

Per utilizzare la versione stabile di un modello Gemini, aggiungi al modello il numero di versione a tre cifre con un trattino (-). Ad esempio, per specificare il modello gemini-1.0-pro stabile nella versione 6, aggiungi -006 al nome del modello:

https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.0-pro-006

Versioni del modello stabile Gemini disponibili

Per i modelli Gemini disponibili a livello generale sono disponibili le seguenti versioni stabili:

Modello Flash Gemini 1.5 Data di uscita Data di interruzione
gemini-1.5-flash-001 24 maggio 2024 24 maggio 2025
Modello Gemini 1.5 Pro Data di uscita Data di interruzione
gemini-1.5-pro-001 24 maggio 2024 24 maggio 2025
Modello Gemini 1.0 Pro Vision Data di uscita Data di interruzione
gemini-1.0-pro-vision-001 15 febbraio 2024 15 febbraio 2025
Modello Gemini 1.0 Pro Data di uscita Data di interruzione
gemini-1.0-pro-001 15 febbraio 2024 15 febbraio 2025
gemini-1.0-pro-002 9 aprile 2024 9 aprile 2025

Versione aggiornata automaticamente Gemini

La versione aggiornata automaticamente di un modello Gemini rimanda alla versione stabile più recente. Quando viene rilasciata una nuova versione stabile, la versione aggiornata automaticamente rimanda alla nuova versione. Ciò significa che se specifichi la versione aggiornata automaticamente di un modello Gemini nel tuo codice, questo potrebbe comportarsi in modo diverso senza preavviso quando verrà rilasciata la versione stabile successiva. Per questo motivo, se ottimizzi il modello, usa con cautela la versione aggiornata automaticamente.

Per utilizzare la versione aggiornata automaticamente di un modello, non aggiungere nulla al nome del modello. Ad esempio, quanto segue utilizza la versione aggiornata automaticamente del modello gemini-1.0-pro-vision:

https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.0-pro-vision

Gemini

La seguente tabella mostra le versioni dei modelli Gemini disponibili aggiornate automaticamente e la versione stabile a cui ogni riferimento è stabile.

Nome modello Nome aggiornato automaticamente Versione stabile a cui viene fatto riferimento
Gemini 1.0 Pro Vision gemini-1.0-pro-vision gemini-1.0-pro-vision-001
Gemini 1.0 Pro gemini-1.0-pro gemini-1.0-pro-002

Versione di anteprima di Gemini

La versione di anteprima di un modello Gemini è un modello in anteprima e non in disponibilità generale (GA). Una versione di anteprima di un modello contiene funzionalità non presenti nella versione più recente o aggiornata automaticamente di un modello. Poiché la versione di un modello di anteprima non è stabile, ne sconsiglia l'utilizzo in produzione.

Ogni modello di anteprima include la relativa data di rilascio come parte del nome del modello utilizzato nel codice. Il pattern del nome utilizzato da un modello di anteprima è model_name-preview-MMDD. Ad esempio, gemini-1.5-pro-preview-0409 è la prima versione di anteprima del modello Gemini 1.5 Pro ed è stata rilasciata il 9 aprile. Quando viene rilasciata una nuova versione di anteprima di un modello, la versione precedente viene aggiornata in modo da puntare alla nuova versione di anteprima ed è disponibile fino alla data di ritiro.

Gemini

La seguente tabella mostra le versioni di anteprima dei modelli Gemini disponibili e la versione di anteprima a cui fa riferimento ciascun modello.

Nome modello Nome anteprima Data di interruzione
Gemini 1.5 Flash (anteprima) gemini-1.5-flash-preview-0514 24 giugno 2024
Gemini 1.5 Pro (anteprima) gemini-1.5-pro-preview-0514 24 giugno 2024
Gemini 1.5 Pro (anteprima) gemini-1.5-pro-preview-0409 (rimanda a e utilizza gemini-1.5-pro-preview-0514) 14 giugno 2024

Versioni del modello di completamento del codice stabili

Le seguenti versioni stabili sono disponibili per i modelli di IA generativa in disponibilità generale:

modello code-gecko Data di uscita Data di interruzione
code-gecko@002 6 dicembre 2023 9 ottobre 2024
code-gecko@001 29 giugno 2023 6 luglio 2024

Versioni del modello stabili per gli incorporamenti

Le seguenti versioni stabili sono disponibili per i modelli di IA generativa in disponibilità generale:

modello textembedding-gecko Data di uscita Data di interruzione
testo-incorporamento-004 14 maggio 2024 14 maggio 2025
text-embedding-preview-0409 9 aprile 2024 27 giugno 2024
text-multilingual-embedding-002 14 maggio 2024 14 maggio 2025
text-multilingual-embedding-preview-0409 9 aprile 2024 27 giugno 2024
testoembedding-gecko@003 12 dicembre 2023 12 dicembre 2024
textembedding-gecko-multilingual@001 2 novembre 2023 12 dicembre 2024
textembedding-gecko@002
(pregresso, ma ancora supportato)
2 novembre 2023 9 ottobre 2024
testoembedding-gecko@001 7 giugno 2023 9 ottobre 2024
incorporamento multimodale@001 12 febbraio 2024 12 febbraio 2025

Supporto linguistico MedLM

Il modello MedLM supporta la lingua inglese.

Esplora tutti i modelli in Model Garden

Model Garden è una piattaforma che consente di scoprire, testare, personalizzare ed eseguire il deployment di modelli e asset OSS di proprietà di Google e selezionati. Per esplorare le API e i modelli di IA generativa disponibili su Vertex AI, vai a Model Garden nella console Google Cloud.

Vai a Model Garden

Per scoprire di più su Model Garden, inclusi i modelli e le funzionalità disponibili, consulta Esplorazione dei modelli di IA in Model Garden.

Passaggi successivi