Questa pagina è stata tradotta dall'API Cloud Translation.

Modelli Google

Modelli Gemini in evidenza

2.5 Pro

Il nostro modello Gemini di ragionamento più avanzato, creato per risolvere problemi complessi

Ideale per la comprensione multimodale
In grado di elaborare prompt complessi e fornire risposte complete
Ideale per la programmazione, in particolare per lo sviluppo web

2.5 Flash

Il nostro miglior modello in termini di rapporto prezzo/prestazioni, che offre funzionalità complete

Supporto per l'API Live incluso per alcuni endpoint
Visualizzare il ragionamento del modello nella risposta
Equilibrio tra prezzo e prestazioni

2.5 Flash-Lite

Il nostro modello più conveniente che supporta attività con un throughput elevato

Il modello più veloce della linea 2.5
È dotato di una finestra contestuale da 1 milione di token e di input multimodale, come 2.5 Flash
Supera 2.0 Flash nella maggior parte dei benchmark di valutazione

Modelli Gemini disponibili a livello generale

diamond Gemini 2.5 Pro Il nostro modello di ragionamento più avanzato finora

spark Gemini 2.5 Flash Il nostro miglior modello in termini di rapporto prezzo/prestazioni, che offre funzionalità complete

performance_auto Gemini 2.5 Flash-Lite Il nostro modello più conveniente che supporta attività a elevato throughput

spark Gemini 2.0 Flash Il nostro modello multimodale più recente, con funzionalità di nuova generazione e capacità migliorate

performance_auto Gemini 2.0 Flash-Lite Un modello Gemini 2.0 Flash ottimizzato per l'efficienza dei costi e la bassa latenza

Visualizzare l'anteprima dei modelli Gemini

photo_spark Anteprima di Gemini 2.5 Flash Image Il nostro modello standard aggiornato per workflow rapidi e creativi con funzionalità di generazione di immagini e di modifica conversazionale in più passaggi. basati sull'IA più ovvi.

Modelli Gemma

Gemma 3n Gli ultimi modelli aperti, progettati per un'esecuzione efficiente su dispositivi con poche risorse, in grado di gestire input multimodali, testo, immagini, video e audio, generare output di testo e addestrati con dati in oltre 140 lingue parlate

Gemma 3 La terza generazione dei nostri modelli aperti, in grado di risolvere un'ampia gamma di attività con input di testo e immagini, supporta oltre 140 lingue e una finestra contestuale lunga 128.000 token

Gemma 2 La seconda generazione dei nostri modelli aperti, in grado di generare, riassumere ed estrarre testo

Gemma Un modello aperto leggero e di piccole dimensioni che supporta la generazione, il riepilogo e l'estrazione di testo

ShieldGemma 2 Modelli ottimizzati per le istruzioni per valutare la sicurezza di testo e immagini in base a un insieme di norme di sicurezza definite

PaliGemma Il nostro modello aperto multimodale che combina SigLIP e Gemma

CodeGemma Modello aperto potente e leggero in grado di svolgere una serie di attività di programmazione, come il completamento del codice, la generazione di codice, la comprensione del linguaggio naturale, il ragionamento matematico e il rispetto delle istruzioni

TxGemma Genera previsioni, classificazioni o testo in base a dati correlati alla terapia e può essere utilizzato per creare in modo efficiente modelli di AI per attività correlate alla terapia con meno dati e meno risorse di calcolo

MedGemma Raccolta di varianti di Gemma 3 addestrate per le prestazioni di comprensione di testo e immagini di natura medica

MedSigLIP Variante di SigLIP addestrata per codificare immagini e testo di natura medica in uno spazio di incorporamento comune

T5Gemma Una famiglia di modelli di ricerca encoder-decoder leggeri ma potenti di Google

Modelli di embedding

width_normal Embeddings per il testo Converte i dati di testo in rappresentazioni vettoriali per la ricerca semantica, la classificazione, il clustering e attività simili

width_normal Incorporamenti multimodali Genera vettori basati su immagini, che possono essere utilizzati per attività downstream come la classificazione delle immagini, la ricerca di immagini e altro ancora

Modelli Imagen disponibili a livello generale

photo_spark Imagen 4 per la generazione Usa prompt di testo per generare nuove immagini con una qualità superiore rispetto ai nostri precedenti modelli di generazione di immagini

photo_spark Imagen 4 per la generazione rapida Usa prompt di testo per generare nuove immagini con una qualità superiore e una latenza inferiore rispetto ai nostri precedenti modelli di generazione di immagini

photo_spark Imagen 4 per la generazione Ultra Usa prompt di testo per generare nuove immagini con una qualità superiore e una migliore aderenza ai prompt rispetto ai nostri precedenti modelli di generazione di immagini

photo_spark Imagen 3 per la generazione Usa prompt di testo per generare nuove immagini

image_edit_auto Imagen 3 per la modifica e la personalizzazione Usa prompt di testo per modificare le immagini di input esistenti o parti di un'immagine con una maschera o generare nuove immagini in base al contesto fornito dalle immagini di riferimento di input

photo_spark Imagen 3 per la generazione rapida Usa prompt di testo per generare nuove immagini con una latenza inferiore rispetto agli altri nostri modelli di generazione di immagini

subtitles Imagen per la generazione di sottotitoli codificati e VQA Usa prompt di testo per generare nuove immagini, modificare quelle esistenti, modificare parti di un'immagine con una maschera e altro ancora

Visualizzare l'anteprima dei modelli Imagen

photo_spark Prova virtuale Genera immagini di persone che indossano prodotti di abbigliamento.

image_edit_auto Riconfigurazione del prodotto Imagen su Vertex AI Utilizza prompt di testo per modificare le immagini dei prodotti in scene o sfondi diversi.

Modelli Veo

movie Veo 2 Usa prompt di testo e immagini per generare video originali

movie Veo 3 Usa prompt di testo e immagini per generare video originali di qualità superiore rispetto al nostro precedente modello di generazione video

movie Veo 3 Fast Usa prompt di testo e immagini per generare video originali di qualità superiore e con latenza inferiore rispetto al nostro precedente modello di generazione video

Visualizzare l'anteprima dei modelli Veo

movie Anteprima di Veo 3 Utilizza prompt di testo e immagini per generare video originali di qualità superiore rispetto al nostro precedente modello di generazione video

movie Anteprima di Veo 3 Fast Utilizza prompt di testo e immagini per generare video originali di qualità superiore e con latenza inferiore rispetto al nostro precedente modello di generazione video

Modelli Veo sperimentali

Film Veo 2 sperimentale Un modello sperimentale, con funzionalità in fase di test.

Modelli MedLM

medical_information MedLM-medium Suite di modelli con messa a punto medica conformi a HIPAA progettati per aiutare i professionisti sanitari con attività di domande e risposte mediche e di riepilogo per documenti sanitari e medici

clinical_notes MedLM-large-large Suite di modelli con messa a punto medica conformi a HIPAA progettati per aiutare i professionisti sanitari con attività di domande e risposte mediche e di riepilogo per documenti sanitari e medici

Supporto dei linguaggi

Gemini

Tutti i modelli Gemini possono comprendere e rispondere nelle seguenti lingue:

afrikaans (af), albanese (sq), amarico (am), arabo (ar), armeno (hy), assamese (as), azerbaigiano (az), basco (eu), bielorusso (be), bengalese (bn), bosniaco (bs), bulgaro (bg), catalano (ca), cebuano (ceb), cinese (semplificato e tradizionale) (zh), corso (co), croato (hr), ceco (cs), danese (da), dhivehi (dv), olandese (nl), inglese (en), esperanto (eo), estone (et), filippino (tagalog) (fil), finlandese (fi), francese (fr), frisone (fy), galiziano (gl), georgiano (ka), tedesco (de), greco (el), gujarati (gu), creolo haitiano (ht), hausa (ha), hawaiano (haw), ebraico (iw), hindi (hi), hmong (hmn), ungherese (hu), islandese (is), igbo (ig), indonesiano (id), irlandese (ga), italiano (it), giapponese (ja), giavanese (jv), kannada (kn), kazako (kk), khmer (km), coreano (ko), krio (kri), curdo (ku), kirghiso (ky), laotiano (lo), latino (la), lettone (lv), lituano (lt), lussemburghese (lb), macedone (mk), malgascio (mg), malese (ms), malayalam (ml), maltese (mt), maori (mi), marathi (mr), meiteilon (manipuri) (mni-Mtei), mongolo (mn), myanmar (birmano) (my), nepalese (ne), norvegese (no), nyanja (chichewa) (ny), odia (oriya) (or), pashto (ps), persiano (fa), polacco (pl), portoghese (pt), punjabi (pa), rumeno (ro), russo (ru), samoano (sm), gaelico scozzese (gd), serbo (sr), sesotho (st), shona (sn), sindhi (sd), singalese (si), slovacco (sk), sloveno (sl), somalo (so), spagnolo (es), sundanese (su), swahili (sw), svedese (sv), tagiko (tg), tamil (ta), telugu (te), thailandese (th), turco (tr), ucraino (uk), urdu (ur), uiguro (ug), uzbeko (uz), vietnamita (vi), gallese (cy), xhosa (xh), yiddish (yi), yoruba (yo), e zulu (zu).

Gemma

Gemma e Gemma 2 supportano solo la lingua inglese (en). Gemma 3 e Gemma 3n forniscono supporto multilingue in oltre 140 lingue.

Incorporamenti

I modelli di incorporamento di testo multilingue supportano le seguenti lingue:

Afrikaans (af), albanese (sq), amarico (am), arabo (ar), armeno (hy), azero (az), basco (eu), bielorusso (be), bengalese (bn), bulgaro (bg), catalano (ca), cebuano (ceb), cinese (semplificato e tradizionale) (zh), corso (co), ceco (cs), danese (da), olandese (nl), inglese (en), esperanto (eo), estone (et), filippino (tagalog) (fil), finlandese (fi), francese (fr), frisone (fy), galiziano (gl), georgiano (ka), tedesco (de), greco (el), gujarati (gu), creolo haitiano (ht), hausa (ha), hawaiano (haw), ebraico (iw), hindi (hi), hmong (hmn), ungherese (hu), islandese (is), igbo (ig), indonesiano (id), irlandese (ga), italiano (it), giapponese (ja), giavanese (jv), kannada (kn), kazako (kk), khmer (km), coreano (ko), curdo (ku), kirghiso (ky), laotiano (lo), latino (la), lettone (lv), lituano (lt), lussemburghese (lb), macedone (mk), malgascio (mg), malese (ms), malayalam (ml), maltese (mt), maori (mi), marathi (mr), mongolo (mn), myanmar (birmano) (my), nepalese (ne), nyanja (chichewa) (ny), norvegese (no), pashto (ps), persiano (fa), polacco (pl), portoghese (pt), punjabi (pa), rumeno (ro), russo (ru), samoano (sm), gaelico scozzese (gd), serbo (sr), sesotho (st), shona (sn), sindhi (sd), singalese (si), slovacco (sk), sloveno (sl), somalo (so), spagnolo (es), sundanese (su), swahili (sw), svedese (sv), tagiko (tg), tamil (ta), telugu (te), thailandese (th), turco (tr), ucraino (uk), urdu (ur), uzbeko (uz), vietnamita (vi), gallese (cy), xhosa (xh), yiddish (yi), yoruba (yo), e zulu (zu).

Imagen 3

Imagen 3 supporta le seguenti lingue:

Inglese (en), cinese (semplificato e tradizionale) (zh), hindi (hi), giapponese (ja), coreano (ko), portoghese (pt) e spagnolo (es).

MedLM

Il modello MedLM supporta la lingua inglese (en).

Esplora tutti i modelli in Model Garden

Model Garden è una piattaforma che ti aiuta a scoprire, testare, personalizzare ed eseguire il deployment di modelli e asset proprietari di Google e OSS selezionati. Per esplorare i modelli di AI generativa e le API disponibili su Vertex AI, vai a Model Garden nella Google Cloud console.

Vai a Model Garden

Per saperne di più su Model Garden, inclusi i modelli e le funzionalità disponibili, consulta Esplora i modelli di AI in Model Garden.

Versioni modello

Per visualizzare tutte le versioni del modello, inclusi i modelli legacy e ritirati, consulta Versioni e ciclo di vita del modello.

Passaggi successivi

Prova un tutorial rapido utilizzando Vertex AI Studio o l'API Vertex AI.
Esplora i modelli preaddestrati in Model Garden.
Scopri come controllare l'accesso a modelli specifici in Model Garden utilizzando un criterio dell'organizzazione Model Garden.
Scopri di più sui prezzi.