Ogni modello di immagine di IA generativa di Vertex AI è disponibile in versioni distinte. I modelli di immagini includono modelli di generazione e di testo, come
imagegeneration
e imagetext
. Le versioni differiscono in base alle funzionalità offerte.
Generazione, modifica e personalizzazione di immagini
Visualizzare la scheda del modello Imagen per la generazione
Visualizzare la scheda del modello Imagen per la modifica e la personalizzazione
Per le attività di generazione e modifica delle immagini sono disponibili le seguenti versioni del modello di generazione di immagini.
Imagen 3 | Imagen 2 (v.006, predefinito) | Imagen 2 (v.005) | Imagen (v.002) | |
---|---|---|---|---|
Nome e versione del modello |
Imagen 3:imagen-3.0-generate-002 (modello più recente)imagen-3.0-generate-001 Imagen 3 Fast: imagen-3.0-fast-generate-001 Si tratta di una variante del modello a bassa latenza che puoi utilizzare per prototyping o casi d'uso a bassa latenza. Personalizzazione e modifica di Imagen 3: imagen-3.0-capability-001
|
imagegeneration@006 |
imagegeneration@005 |
imagegeneration@002 |
Generazione di immagini | Disponibilità generale | Disponibilità generale (utenti approvati) | Disponibilità generale (utenti approvati) | Disponibilità generale (utenti approvati) |
Personalizzazione delle immagini (apprendimento few-shot) | Disponibilità generale (utenti approvati)
|
Non supportata | Non supportata | Non supportata |
Modifica delle immagini |
|
|
Non supportato. Il supporto delle funzionalità per questo modello è soggetto a modifiche e aggiornamenti futuri. |
|
Filigrana digitale e verifica (generazione di immagini) | Supportato (abilitato per impostazione predefinita) | Supportato (abilitato per impostazione predefinita) | Supportato (non abilitato per impostazione predefinita) | Supportato (non abilitato per impostazione predefinita) |
Impostazioni di sicurezza configurabili dall'utente |
|
|
Non supportata | Non supportata |
Miglioramento dei prompt mediante il riscrittore di prompt | Disponibile come parametro facoltativo per il modello imagen-3.0-generate-002 .
|
Non supportata | Non supportata | Non supportata |
Upscaling delle immagini | Non supportata | Non supportata | Non supportata | Supportato (2x o 4x) |
Proporzioni e risoluzione |
|
|
|
|
Lingue | Disponibilità generale:
Anteprima:
|
Disponibilità generale:
Anteprima:
|
Disponibilità generale:
Anteprima:
|
Disponibilità generale:
|
Ottimizzazione del modello | Non supportato. Il supporto delle funzionalità per questo modello è soggetto a modifiche e aggiornamenti futuri. |
Non supportata | Non supportata | Disponibilità dell'ottimizzazione del modello:
|
Didascalie visive e Visual Question Answering (VQA)
Visualizzare la scheda del modello Imagen per la trascrizione codificata e la VQA
Per le attività di trascrizione codificata delle immagini e di risposta a domande visive (VQA) sono disponibili le seguenti versioni del modello imagetext
.
Versione del modello:imagetext@001 (predefinita) |
|
---|---|
Didascalie visive (formato breve) | Token: 32 (~32 parole) Lingue: inglese, spagnolo, francese, tedesco, italiano |
Visual Question Answering, VQA (forma abbreviata) | Token (richiesta): 80 Token (risposta): 64 Lingue: inglese |
Come specificare la versione di un modello di immagini
Per utilizzare una versione di un modello di visione, aggiungi il numero di versione di tre cifre al
modello. Ad esempio, per specificare una versione del modello imagegeneration
, aggiungi la versione del modello (ad esempio @006
) al nome del modello:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@006:predict
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagetext@001:predict
Tuttavia, questo formato non si applica ai modelli Imagen 3.
Devi sempre specificare una versione del modello stabile per l'utilizzo in produzione, in quanto l'utilizzo dell'opzione predefinita senza una versione del modello specificata può comportare modifiche nel comportamento del modello.
Se ometti la versione del modello, Imagen utilizza la versione predefinita:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration:predict
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagetext:predict
Come best practice, specifica sempre una versione del modello. Se scegli di utilizzare il nome del modello senza una versione, assicurati che si trovi in un ambiente di test.
Passaggi successivi
- Scopri come inviare richieste a modelli specifici:
- Scopri di più sui parametri del modello utilizzando la documentazione di riferimento dell'API:
- Generazione di immagini (modello
imagegeneration
) - Didascalie delle immagini (modello
imagetext
) - Visual Question Answering (VQA) (modello
imagetext
)
- Generazione di immagini (modello