Vertex AI offre un elenco crescente di modelli di base che puoi testare, eseguire il deployment e personalizzare per l'uso nelle tue applicazioni basate sull'IA. I modelli di base sono ottimizzati per casi d'uso specifici e offerti a diversi prezzi consigliati. Questa pagina riassume i modelli disponibili nelle varie API e offre indicazioni sui modelli da scegliere in base al caso d'uso.
Per saperne di più su tutti i modelli IA e le API su Vertex AI, consulta Esplorare modelli IA e API.
Modelli Gemini
La seguente tabella riassume i modelli disponibili nell'API Gemini:
Nome del modello | Descrizione | Specifiche |
---|---|---|
Flash Gemini 1.5 ( gemini-1.5-flash ) |
Modello multimodale progettato per applicazioni convenienti e in volumi elevati. Gemini 1.5 Flash offre velocità ed efficienza per creare applicazioni rapide e a basso costo senza compromettere la qualità. | Numero massimo di token totali (input e output): 1 milione Numero massimo di token di output: 8192 Dimensioni massime delle immagini non elaborate: 20 MB Dimensioni massime delle immagini codificate in Base64: 7 MB Numero massimo di immagini per prompt: 3000 Durata massima del video: 1 ora Lunghezza massima dell'audio per prompt: 10 Lunghezza massima dell'audio: circa 8,4 ore 3 MB |
Gemini 1.5 Pro ( gemini-1.5-pro ) |
Modello multimodale che supporta l'aggiunta di file immagine, audio, video e PDF in prompt di testo o chat per fornire una risposta di testo o codice. Gemini 1.5 Pro supporta la comprensione di contesto lungo con un massimo di 1 milione di token. | Numero massimo di token (input e output): 1 milione Numero massimo di token di output: 8192 Numero massimo di immagini per prompt: 3000 Lunghezza massima del video (solo fotogrammi): circa un'ora Lunghezza massima del video (frame e audio): circa 45 minuti Lunghezza massima dei video per prompt: 10 Durata massima dell'audio: circa 8,4 ore Dimensioni massime dell'audio per prompt: 1 MB |
Gemini 1.0 Pro ( gemini-1.0-pro ) |
Il modello con le prestazioni migliori, con funzionalità per una vasta gamma di attività di solo testo.
Supporta solo testo come input. Supporta l'ottimizzazione supervisionata. |
Numero massimo di token di output (input e output): 32.760 Numero massimo di token di output: 8192 Dati di addestramento: fino a febbraio 2023 |
Gemini 1.0 Pro Vision ( gemini-1.0-pro-vision ) |
Il modello di comprensione di immagini/video con le migliori prestazioni per gestire una vasta
gamma di applicazioni.
Supporta testo, immagini e video come input. |
Numero massimo di token totali (input e output): 16.384 Numero massimo di token di output: 2048 Numero massimo di immagini per prompt: 16 Durata massima video: 2 minuti Numero massimo di video per prompt: 1 Dati di addestramento: fino a febbraio 2023 |
Gemini 1.0 Ultra (GA con lista consentita) | Il modello di testo più avanzato di Google, ottimizzato per attività complesse,
tra cui istruzioni, codice e ragionamento.
Supporta solo testo come input. |
Numero massimo di token di input: 8192 Numero massimo di token di output: 2048 |
Gemini 1.0 Ultra Vision (GA con lista consentita) |
Il miglior modello di visione artificiale multimodale di Google, ottimizzato per supportare input di testo, immagini e video congiunti. | Numero massimo di token di input: 8192 Numero massimo di token di output: 2048 |
Supporto della lingua Gemini
I modelli Gemini supportano le seguenti lingue:
arabo (ar), bengalese (bn), bulgaro (bg), cinese semplificato e tradizionale (zh), croato (hr), ceco (cs), danese (da), olandese (nl), inglese (en), estone (et), finlandese (fi), inglese (en), estone (et), olandese (nl), francese (fr), tedesco (de), greco (el), slovacco (slovacco), svizzero (slovacco), svizzero (slovacco), indonesiano (slovacco), indonesiano (slovacco),
Modelli di incorporamento
La tabella seguente riassume i modelli disponibili nell'API Embeddings.
Nome del modello | Descrizione | Specifiche |
---|---|---|
Incorporamenti per il testo ( ) |
Restituisce incorporamenti per gli input di testo in inglese.
Supporta l'ottimizzazione supervisionata dei modelli "text-embedding-gecko", solo in inglese. |
Input massimo di token: 3072 (textembedding-gecko@001), 2048 (altri). Dimensione di incorporamento: text-embedding-004 : <=768 Altre: 768. |
Incorporamenti per il testo multilingue(textembedding-gecko-multilingual@001,
|
Restituisce incorporamenti per input di testo di oltre 100 lingue.
Supporta l'ottimizzazione supervisionata del modello text-multilingual-embedding-002 . Supporta 100 lingue. |
Input massimo di token: 2048 Dimensione di incorporamento: text-multilingual-embedding-002 : <=768 Altri: 768. |
Incorporamenti per multimodali(multimodalembedding) |
Restituisce l'incorporamento per input di testo, immagini e video per confrontare i contenuti in diversi modelli.
Converti testo, immagini e video nello stesso spazio vettoriale. Il video supporta solo le dimensioni 1408. Solo in inglese |
Input token massimo: 32, Dimensione massima immagine: 20 MB, Durata video massima: due minuti, Dimensione di incorporamento: 128, 256, 512 o 1408 per l'input di testo e immagine, 1408 per l'input video. |
Supporto delle lingue per gli incorporamenti
Modello Imagen
La seguente tabella riassume i modelli disponibili nell'API Imagen:
Nome del modello | Descrizione | Specifiche |
---|---|---|
Immagine 2 ( imagegeneration@006) |
Questo modello supporta la generazione e la modifica delle immagini per creare immagini di alta qualità in pochi secondi.
La funzionalità di modifica supporta la rimozione e l'inserimento degli oggetti, l'outpainting e la modifica dei prodotti |
Output massimo delle immagini: quattro Proporzioni (per la generazione): 1:1, 9:16, 16:9, 3:4, 4:3 Risoluzione: ~1500 pixel (varia in base alle proporzioni) |
Supporto per le lingue Imagen
Il modello Imagen supporta le seguenti lingue:
inglese, cinese (semplificato), cinese (tradizionale), hindi, giapponese, coreano,
portoghese e spagnolo.
Modello di completamento del codice
La seguente tabella riassume i modelli disponibili nelle API Codey:
Nome del modello | Descrizione | Specifiche |
---|---|---|
Codey per il completamento del codice ( code-gecko ) |
un modello perfezionato per suggerire il completamento del codice in base al contesto. | Numero massimo di token di input: 2048 Numero massimo di token di output: 64 |
Modelli MedLM
La seguente tabella riassume i modelli disponibili nell'API MedLM:
Nome del modello | Descrizione | Specifiche |
---|---|---|
MedLM-medium (medlm-medium ) |
Una suite di API e modelli ottimizzati dal punto di vista medico basata sulla normativa HIPAA basata su Google Research. Questo modello aiuta gli operatori sanitari con le attività di domande e risposte e di riepilogo per i documenti sanitari e medici. Offre una velocità effettiva migliore e include dati più recenti rispetto al modello medlm-large . |
Numero massimo di token (input + output): 32.768 Numero massimo di token di output: 8192 |
MedLM-large (medlm-large ) |
Questo modello aiuta gli operatori sanitari con le attività di domande e risposte mediche e le attività di riepilogo per i documenti sanitari e medici. | Numero massimo di token di input: 8192 Numero massimo di token di output: 1024 |
Versioni e ciclo di vita del modello
Ogni modello linguistico di IA generativa su Vertex AI è disponibile in una versione stabile e una versione aggiornata automaticamente. Consulta i seguenti argomenti per scoprire come funziona il controllo delle versioni dei modelli con i modelli Gemini. Per saperne di più sulle versioni dei modelli di Vertex AI e sul loro ciclo di vita, consulta Imagen sulle versioni e sul ciclo di vita dei modelli di Vertex AI.
Se ottimizzi un modello Gemini, il modello ottimizzato condivide la stessa data di interruzione del modello di base utilizzato nel processo di ottimizzazione. Per ulteriori informazioni, consulta la Panoramica dell'ottimizzazione del modello per Gemini.
Versione stabile Gemini
Una versione stabile di un modello Gemini non cambia e continua a essere disponibile fino alla data di ritiro. Consulta le tabelle in Versioni stabili disponibili di Gemini in questa pagina per conoscere le date di ritiro dei modelli Gemini. Se utilizzi una versione stabile dopo la data di interruzione, devi passare a una versione stabile disponibile più recente. Puoi identificare la versione di un modello stabile dal numero di tre cifre aggiunto al nome del modello. Ad esempio, gemini-1.0-pro-001
è la versione numero uno della release stabile del modello Gemini 1.0 Pro.
Google rilascia le versioni stabili con cadenza regolare. Puoi passare da una versione stabile a un'altra versione, purché l'altra versione sia ancora disponibile. Quando passi da una versione stabile a un'altra versione stabile, devi eseguire di nuovo i job di ottimizzazione perché potrebbero verificarsi differenze in termini di prompt, output e di altro tipo tra le versioni.
Per utilizzare la versione stabile di un modello Gemini, aggiungi al modello il numero di versione a tre cifre con un trattino (-
). Ad esempio, per specificare il modello gemini-1.0-pro
stabile nella versione 6, aggiungi -006
al nome del modello:
https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.0-pro-006
Versioni del modello stabile Gemini disponibili
Per i modelli Gemini disponibili a livello generale sono disponibili le seguenti versioni stabili:
Modello Flash Gemini 1.5 | Data di uscita | Data di interruzione |
---|---|---|
gemini-1.5-flash-001 | 24 maggio 2024 | 24 maggio 2025 |
Modello Gemini 1.5 Pro | Data di uscita | Data di interruzione |
---|---|---|
gemini-1.5-pro-001 | 24 maggio 2024 | 24 maggio 2025 |
Modello Gemini 1.0 Pro Vision | Data di uscita | Data di interruzione |
---|---|---|
gemini-1.0-pro-vision-001 | 15 febbraio 2024 | 15 febbraio 2025 |
Modello Gemini 1.0 Pro | Data di uscita | Data di interruzione |
---|---|---|
gemini-1.0-pro-001 | 15 febbraio 2024 | 15 febbraio 2025 |
gemini-1.0-pro-002 | 9 aprile 2024 | 9 aprile 2025 |
Versione aggiornata automaticamente Gemini
La versione aggiornata automaticamente di un modello Gemini rimanda alla versione stabile più recente. Quando viene rilasciata una nuova versione stabile, la versione aggiornata automaticamente rimanda alla nuova versione. Ciò significa che se specifichi la versione aggiornata automaticamente di un modello Gemini nel tuo codice, questo potrebbe comportarsi in modo diverso senza preavviso quando verrà rilasciata la versione stabile successiva. Per questo motivo, se ottimizzi il modello, usa con cautela la versione aggiornata automaticamente.
Per utilizzare la versione aggiornata automaticamente di un modello, non aggiungere nulla al nome del modello.
Ad esempio, quanto segue utilizza la versione aggiornata automaticamente del modello gemini-1.0-pro-vision
:
https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.0-pro-vision
Gemini
La seguente tabella mostra le versioni dei modelli Gemini disponibili aggiornate automaticamente e la versione stabile a cui ogni riferimento è stabile.
Nome modello | Nome aggiornato automaticamente | Versione stabile a cui viene fatto riferimento |
---|---|---|
Gemini 1.0 Pro Vision | gemini-1.0-pro-vision |
gemini-1.0-pro-vision-001 |
Gemini 1.0 Pro | gemini-1.0-pro |
gemini-1.0-pro-002 |
Versione di anteprima di Gemini
La versione di anteprima di un modello Gemini è un modello in anteprima e non in disponibilità generale (GA). Una versione di anteprima di un modello contiene funzionalità non presenti nella versione più recente o aggiornata automaticamente di un modello. Poiché la versione di un modello di anteprima non è stabile, ne sconsiglia l'utilizzo in produzione.
Ogni modello di anteprima include la relativa data di rilascio come parte del nome del modello utilizzato nel codice. Il pattern del nome utilizzato da un modello di anteprima è model_name-preview-MMDD
. Ad esempio, gemini-1.5-pro-preview-0409
è la
prima versione di anteprima del
modello Gemini 1.5 Pro ed è stata rilasciata il 9 aprile. Quando viene rilasciata una nuova versione di anteprima di un modello, la versione precedente viene aggiornata in modo da puntare alla nuova versione di anteprima ed è disponibile fino alla data di ritiro.
Gemini
La seguente tabella mostra le versioni di anteprima dei modelli Gemini disponibili e la versione di anteprima a cui fa riferimento ciascun modello.
Nome modello | Nome anteprima | Data di interruzione |
---|---|---|
Gemini 1.5 Flash (anteprima) | gemini-1.5-flash-preview-0514 |
24 giugno 2024 |
Gemini 1.5 Pro (anteprima) | gemini-1.5-pro-preview-0514 |
24 giugno 2024 |
Gemini 1.5 Pro (anteprima) | gemini-1.5-pro-preview-0409 (rimanda a e utilizza
gemini-1.5-pro-preview-0514 ) |
14 giugno 2024 |
Versioni del modello di completamento del codice stabili
Le seguenti versioni stabili sono disponibili per i modelli di IA generativa in disponibilità generale:
modello code-gecko | Data di uscita | Data di interruzione |
---|---|---|
code-gecko@002 | 6 dicembre 2023 | 9 ottobre 2024 |
code-gecko@001 | 29 giugno 2023 | 6 luglio 2024 |
Versioni del modello stabili per gli incorporamenti
Le seguenti versioni stabili sono disponibili per i modelli di IA generativa in disponibilità generale:
modello textembedding-gecko | Data di uscita | Data di interruzione |
---|---|---|
testo-incorporamento-004 | 14 maggio 2024 | 14 maggio 2025 |
text-embedding-preview-0409 | 9 aprile 2024 | 27 giugno 2024 |
text-multilingual-embedding-002 | 14 maggio 2024 | 14 maggio 2025 |
text-multilingual-embedding-preview-0409 | 9 aprile 2024 | 27 giugno 2024 |
testoembedding-gecko@003 | 12 dicembre 2023 | 12 dicembre 2024 |
textembedding-gecko-multilingual@001 | 2 novembre 2023 | 12 dicembre 2024 |
textembedding-gecko@002 (pregresso, ma ancora supportato) |
2 novembre 2023 | 9 ottobre 2024 |
testoembedding-gecko@001 | 7 giugno 2023 | 9 ottobre 2024 |
incorporamento multimodale@001 | 12 febbraio 2024 | 12 febbraio 2025 |
Supporto linguistico MedLM
Il modello MedLM supporta la lingua inglese.
Esplora tutti i modelli in Model Garden
Model Garden è una piattaforma che consente di scoprire, testare, personalizzare ed eseguire il deployment di modelli e asset OSS di proprietà di Google e selezionati. Per esplorare le API e i modelli di IA generativa disponibili su Vertex AI, vai a Model Garden nella console Google Cloud.
Per scoprire di più su Model Garden, inclusi i modelli e le funzionalità disponibili, consulta Esplorazione dei modelli di IA in Model Garden.
Passaggi successivi
- Prova un tutorial di avvio rapido con Vertex AI Studio o l'API Vertex AI.
- Scopri come testare i prompt di testo.
- Scopri come testare le richieste di chat.
- Esplora i modelli preaddestrati in Model Garden.
- Scopri come ottimizzare un modello di base.
- Scopri le best practice per l'IA responsabile e i filtri di sicurezza di Vertex AI.