Vertex AI include un elenco crescente di modelli di base che puoi testare, sottoporre a deployment e personalizzare per l'utilizzo nelle tue applicazioni basate sull'IA. I modelli di base sono ottimizzati per casi d'uso specifici e offerti a diversi prezzi consigliati. Questa pagina riassume i modelli disponibili nelle varie API e fornisce indicazioni su quali modelli scegliere in base al caso d'uso.
Per scoprire di più su tutti i modelli e le API di AI su Vertex AI, consulta Esplora i modelli e le API di AI.
Modelli Gemini
La seguente tabella riassume i modelli disponibili nell'API Gemini:
Nome modello | Descrizione | Specifiche |
---|---|---|
Gemini 1.5 Flash ( gemini-1.5-flash ) |
Modello multimodale progettato per applicazioni a basso costo e con volumi elevati. Gemini 1.5 Flash offre velocità ed efficienza per creare applicazioni rapide e a basso costo senza compromettere la qualità. | Numero massimo di token totali (input e output): 1 M Numero massimo di token di output: 8192 Dimensione massima delle immagini non elaborate: 20 MB Dimensione massima dell'immagine con codifica Base64: 7 MB Numero massimo di immagini per richiesta: 3000 Durata massima del video: 1 ora Numero massimo di video per richiesta: 10 Dimensione massima dell'immagine non elaborata: 8,4 MB circa per l'addestramento del file PDF Massimo 4 ore di addestramento per PDF 0 |
Gemini 1.5 Pro ( gemini-1.5-pro ) |
Modello multimodale che supporta l'aggiunta di file immagine, audio, video e PDF in prompt di testo o di chat per una risposta di testo o codice. Gemini 1.5 Pro supporta la comprensione del contesto lungo con un massimo di 1 milione di token. | Massimo totale di token (input e output): 1 M Numero massimo di token di output: 8192 Numero massimo di immagini per richiesta: 3000 Durata massima del video (solo frame): circa un'ora Durata massima del video (frame e audio): circa 45 minuti Durata massima dei video per richiesta: 10 Durata massima audio: circa 8,4 ore Dimensioni audio massime per richiesta: 1 maggio per i PDF 0 Dati di addestramento 0 |
Gemini 1.0 Pro ( gemini-1.0-pro ) |
Il modello con le prestazioni migliori con funzionalità per una vasta gamma di attività di solo testo.
Supporta solo il testo come input. Supporta l'ottimizzazione supervisionata. |
Numero massimo di token totali (input e output): 32.760 Numero massimo di token di output: 8192 Dati di addestramento: fino a febbraio 2023 |
Gemini 1.0 Pro Vision ( gemini-1.0-pro-vision ) |
Il modello di comprensione di immagini/video con le migliori prestazioni per gestire una vasta gamma di applicazioni.
Sono supportati testo, immagini e video come input. |
Numero massimo di token totali (input e output): 16.384 Numero massimo di token di output: 2048 Numero massimo di immagini per richiesta: 16 Durata massima del video: 2 minuti Numero massimo di video per richiesta: 1 Dati di addestramento: fino a febbraio 2023 |
Gemini 1.0 Ultra (GA con lista consentita) | Il modello di testo più potente di Google, ottimizzato per attività complesse, tra cui istruzioni, codice e ragionamento.
Supporta solo il testo come input. |
Numero massimo di token inseriti: 8192 Output massimo di token: 2048 |
Gemini 1.0 Ultra Vision (GA con elenco di autorizzazioni) |
Il modello di visione multimodale più potente di Google, ottimizzato per supportare testi, immagini e input video congiunti. | Numero massimo di token inseriti: 8192 Output massimo di token: 2048 |
Supporto dei linguaggi di Gemini
I modelli Gemini supportano le seguenti lingue:
arabo (ar), bengalese (bn), bulgaro (bg),
cinese semplificato e tradizionale (zh), croato (hr),
ceco (cs), danese (da), olandese (nl), inglese (en), estone (et), finlandese (fi),
francese (fr), tedesco (de), greco (el), ebraico (iw), hindi (ungherese), hindi (hit),
Modelli di incorporamento
La tabella seguente riassume i modelli disponibili nell'API Embeddings.
Nome modello | Descrizione | Specifiche |
---|---|---|
Incorporamenti per il testo ( ) |
Restituisce gli incorporamenti per gli input di testo in inglese.
Supporta l'ottimizzazione supervisionata dei modelli "text-embedding-gecko", solo in inglese. |
Numero massimo di token di input: 3072 (textembedding-gecko@001), 2048 (altri). Dimensione di incorporamento: text-embedding-004 : <=768 Altro: 768. |
Incorporamenti per testo multilingue(textembedding-gecko-multilingual@001,
|
Restituisce gli incorporamenti per gli input di testo di oltre 100 lingue
Supporta l'ottimizzazione supervisionata del modello text-multilingual-embedding-002 . supporta 100 lingue. |
Numero massimo di token inseriti: 2048 Dimensione di incorporamento: text-multilingual-embedding-002 : <=768 Altri: 768. |
Incorporamenti per multimodali(multimodalembedding) |
Restituisce l'incorporamento per gli input di testo, immagine e video, al fine di confrontare i contenuti tra modelli diversi.
Converte testo, immagini e video nello stesso spazio vettoriale. I video supportano solo le dimensioni 1408. Solo in inglese |
Inserimento massimo di token: 32. Dimensioni massime dell'immagine: 20 MB, Lunghezza massima del video: due minuti, Dimensione di incorporamento: 128, 256, 512 o 1408 per l'input di testo e immagini, 1408 per l'input video. |
Supporto del linguaggio degli incorporamenti
I modelli di incorporamento multilingua
Modello Imagen
La seguente tabella riassume i modelli disponibili nell'API Imagen:
Nome modello | Descrizione | Specifiche |
---|---|---|
Immagine 2 ( imagegeneration@006) |
Questo modello supporta la generazione e la modifica di immagini per creare immagini di alta qualità in pochi secondi.
La funzionalità di modifica supporta la rimozione e l'inserimento di oggetti, l'outpainting e la modifica dei prodotti |
Output massimo delle immagini: quattro Proporzioni (per la generazione): 1:1, 9:16, 16:9, 3:4, 4:3 Risoluzione: circa 1500 pixel (varia in base alle proporzioni) |
Supporto dei linguaggi Imagen
Il modello Imagen supporta le seguenti lingue:
inglese, cinese (semplificato), cinese (tradizionale), hindi, giapponese, coreano,
portoghese e spagnolo.
Modello di completamento del codice
La tabella seguente riassume i modelli disponibili nelle API Codey:
Nome modello | Descrizione | Specifiche |
---|---|---|
Codey per il completamento del codice ( code-gecko ) |
È un modello perfezionato per suggerire il completamento del codice in base al contesto nel codice scritto. | Numero massimo di token di input: 2048 Numero massimo di token di output: 64 |
Modelli MedLM
La tabella seguente riassume i modelli disponibili nell'API MedLM:
Nome modello | Descrizione | Specifiche |
---|---|---|
MedLM-medio (medlm-medium ) |
Una suite di modelli e API conformi alla normativa HIPAA e basata su Google Research. Questo modello aiuta gli operatori sanitari a svolgere attività di domande e risposte mediche, nonché attività di riepilogo dei documenti sanitari e medici. Offre una velocità effettiva migliore e include dati più recenti rispetto al modello medlm-large . |
Numero massimo di token (input + output): 32.768 Numero massimo di token di output: 8192 |
MedLM-large (medlm-large ) |
Questo modello aiuta gli operatori sanitari a svolgere attività di domande e risposte mediche, nonché attività di riassunto dei documenti sanitari e medici. | Numero massimo di token di input: 8192 Numero massimo di token di output: 1024 |
Versioni del modello e ciclo di vita
Ogni modello linguistico dell'IA generativa su Vertex AI è disponibile in una versione stabile e in una versione aggiornata automaticamente. Consulta gli argomenti seguenti per scoprire come funziona il controllo delle versioni dei modelli con i modelli Gemini. Per saperne di più sulle versioni dei modelli Imagen on Vertex AI e sul loro ciclo di vita, consulta Imagen sulle versioni e il ciclo di vita dei modelli di Imagen su Vertex AI.
Se ottimizzi un modello Gemini, il modello ottimizzato condivide la stessa data di interruzione del modello di base che hai utilizzato nel processo di ottimizzazione. Per maggiori informazioni, consulta Panoramica dell'ottimizzazione del modello per Gemini.
Versione stabile di Gemini
Una versione stabile di un modello Gemini non cambia e continua a essere
disponibile fino alla data di interruzione. Consulta le tabelle nella sezione Versioni dei modelli Gemini stabili disponibili in questa pagina per scoprire le date di non disponibilità dei modelli Gemini. Se utilizzi uno stato stabile dopo la data di interruzione, devi passare a una versione stabile più recente disponibile. Puoi identificare la versione di un modello stabile dal numero di tre cifre aggiunto al nome del modello. Ad esempio,
gemini-1.0-pro-001
è la versione numero uno della release stabile del modello Gemini 1.0 Pro.
Google rilascia versioni stabili con cadenza regolare. Puoi passare da una versione stabile a un'altra finché l'altra versione è ancora disponibile. Quando passi da una versione stabile a un'altra versione stabile, devi eseguire di nuovo i job di ottimizzazione perché potrebbero esserci prompt, output e altre differenze tra le versioni.
Per utilizzare la versione stabile di un modello Gemini, aggiungi al modello il numero di versione a tre cifre con un trattino (-
). Ad esempio, per specificare il modello gemini-1.0-pro
stabile della versione sei, aggiungi -006
al nome del modello:
https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.0-pro-006
Versioni del modello Gemini stabili disponibili
Per i modelli Gemini in disponibilità generale sono disponibili le seguenti versioni di modelli stabili:
Modello Flash Gemini 1.5 | Data di uscita | Data di interruzione |
---|---|---|
gemini-1.5-flash-001 | 24 maggio 2024 | 24 maggio 2025 |
Modello Gemini 1.5 Pro | Data di uscita | Data di interruzione |
---|---|---|
gemini-1.5-pro-001 | 24 maggio 2024 | 24 maggio 2025 |
Modello Gemini 1.0 Pro Vision | Data di uscita | Data di interruzione |
---|---|---|
gemini-1.0-pro-vision-001 | 15 febbraio 2024 | 15 febbraio 2025 |
Modello Gemini 1.0 Pro | Data di uscita | Data di interruzione |
---|---|---|
gemini-1.0-pro-001 | 15 febbraio 2024 | 15 febbraio 2025 |
gemini-1.0-pro-002 | 9 aprile 2024 | 9 aprile 2025 |
Versione aggiornata automaticamente di Gemini
La versione aggiornata automaticamente di un modello Gemini punta alla versione stabile più recente. Quando viene rilasciata una nuova versione stabile, la versione aggiornata automaticamente punta alla nuova versione. Ciò significa che se specifichi nel codice la versione aggiornata automaticamente di un modello Gemini, questo potrebbe comportarsi in modo diverso senza preavviso quando viene rilasciata la versione stabile successiva. Per questo motivo, usa con cautela la versione aggiornata automaticamente se ottimizzi il modello.
Per utilizzare la versione aggiornata automaticamente di un modello, non aggiungere nulla al nome del modello.
Ad esempio, quanto segue utilizza la versione aggiornata automaticamente del modello
gemini-1.0-pro-vision
:
https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.0-pro-vision
Modelli Gemini aggiornati automaticamente
La tabella seguente mostra le versioni del modello Gemini aggiornate automaticamente e la versione stabile a cui fa riferimento.
Nome modello | Nome aggiornato automaticamente | Versione stabile a cui viene fatto riferimento |
---|---|---|
Gemini 1.0 Pro Vision | gemini-1.0-pro-vision |
gemini-1.0-pro-vision-001 |
Gemini 1.0 Pro | gemini-1.0-pro |
gemini-1.0-pro-002 |
Versione di anteprima di Gemini
La versione di anteprima di un modello Gemini è un modello in anteprima e non disponibile pubblicamente (GA). Una versione di anteprima di un modello contiene funzionalità non incluse nella versione più recente o aggiornata automaticamente di un modello. Poiché una versione del modello di anteprima non è stabile, ne sconsiglia l'uso in produzione.
Ogni modello preview include la sua data di rilascio come parte del nome del modello
utilizzato nel codice. Il pattern del nome utilizzato da un modello preview è
model_name-preview-MMDD
. Ad esempio, gemini-1.5-pro-preview-0409
è la
prima versione di anteprima del
modello Gemini 1.5 Pro ed è stata rilasciata il 9 aprile. Quando viene rilasciata una nuova versione di anteprima di un modello, quella precedente viene aggiornata in modo da puntare alla nuova versione di anteprima ed è disponibile fino alla data di interruzione.
Modelli di anteprima di Gemini
La tabella seguente mostra le versioni del modello Gemini disponibili in anteprima e la versione di anteprima a cui fa riferimento.
Nome modello | Nome anteprima | Data di interruzione |
---|---|---|
Gemini 1.5 Flash (anteprima) | gemini-1.5-flash-preview-0514 |
24 giugno 2024 |
Gemini 1.5 Pro (anteprima) | gemini-1.5-pro-preview-0514 |
24 giugno 2024 |
Gemini 1.5 Pro (anteprima) | gemini-1.5-pro-preview-0409 (rimanda e utilizza
gemini-1.5-pro-preview-0514 ) |
14 giugno 2024 |
Versioni di modelli stabili con completamento del codice
Le seguenti versioni di modelli stabili sono disponibili per i modelli di IA generativa in disponibilità generale:
modello code-gecko | Data di uscita | Data di interruzione |
---|---|---|
codice-gecko@002 | 6 dicembre 2023 | 9 ottobre 2024 |
codice-gecko@001 | 29 giugno 2023 | 6 luglio 2024 |
Versioni di modelli stabili per gli incorporamenti
Le seguenti versioni di modelli stabili sono disponibili per i modelli di IA generativa in disponibilità generale:
modello textembedding-gecko | Data di uscita | Data di interruzione |
---|---|---|
incorporamento-testo-004 | 14 maggio 2024 | 14 maggio 2025 |
text-embedding-preview-0409 | 9 aprile 2024 | 27 giugno 2024 |
text-multilingual-embedding-002 | 14 maggio 2024 | 14 maggio 2025 |
text-multilingual-embedding-preview-0409 | 9 aprile 2024 | 27 giugno 2024 |
textembedding-gecko@003 | 12 dicembre 2023 | 12 dicembre 2024 |
textembedding-gecko-multilingual@001 | 2 novembre 2023 | 12 dicembre 2024 |
textembedding-gecko@002 (pregresso, ma ancora supportato) |
2 novembre 2023 | 9 ottobre 2024 |
textembedding-gecko@001 | 7 giugno 2023 | 9 ottobre 2024 |
multimodalembedding@001 | 12 febbraio 2024 | 12 febbraio 2025 |
Supporto delle lingue MedLM
Il modello MedLM supporta la lingua inglese.
Esplora tutti i modelli in Model Garden
Model Garden è una piattaforma che ti aiuta a scoprire, testare, personalizzare ed eseguire il deployment di modelli e asset OSS di proprietà di Google e selezionati. Per esplorare i modelli di IA generativa e le API disponibili su Vertex AI, vai a Model Garden nella console Google Cloud.
Per scoprire di più su Model Garden, inclusi i modelli e le funzionalità disponibili, consulta Esplorare i modelli AI in Model Garden.
Passaggi successivi
- Prova un tutorial della guida rapida utilizzando Vertex AI Studio o l'API Vertex AI.
- Scopri come testare i prompt di testo.
- Scopri come testare i prompt di chat.
- Esplora i modelli preaddestrati in Model Garden.
- Scopri come ottimizzare un modello di base.
- Scopri di più sulle best practice per l'IA responsabile e sui filtri di sicurezza di Vertex AI.