IA da testo a immagine

Crea immagini a partire dal testo senza scrivere una sola riga di codice

Genera immagini da descrizioni testuali in pochi secondi utilizzando la generazione di immagini basata sull'AI di Google Cloud con le API disponibili nei linguaggi di programmazione Python, Java e Go. 

I nuovi clienti ricevono fino a 300 $ di crediti gratuiti per generare immagini e altro utilizzando Imagen su Vertex AI. 

Panoramica

Che cos'è l'IA da testo a immagine?

L'IA da testo a immagine è un tipo di intelligenza artificiale in grado di generare immagini da descrizioni testuali. Questa tecnologia ha il potenziale per trasformare il modo in cui interagiamo con i contenuti visivi e ne creiamo i contenuti. Gli strumenti e le risorse di Google Cloud per la conversione da testo all'IA, inclusi modelli di IA preaddestrati come Imagen, Parti e Muse, disponibili in Vertex AI, sono progettati per aiutare gli sviluppatori a implementare facilmente la generazione da testo a immagine nelle loro applicazioni. Inoltre, con AutoML, puoi personalizzare i modelli di IA per applicazioni specifiche del dominio.

Come viene utilizzato la conversione da testo a immagine nello sviluppo di applicazioni?

L'IA da testo a immagine può essere utilizzata nello sviluppo di applicazioni per generare prototipi, illustrazioni, dati di test, contenuti didattici e visualizzazioni per il debug. Vertex AI e l'API Cloud Vision di Google Cloud consentono agli sviluppatori di accedere a una suite di funzionalità di elaborazione delle immagini, tra cui rilevamento di testo, rilevamento di oggetti e classificazione delle immagini. Document AI può essere utilizzato per estrarre testo dai documenti scansionati per generare immagini descrittive del testo.

Quali modelli vengono utilizzati per la generazione da testo a immagine?

Imagen, Parti e Muse sono modelli principali di conversione da testo a immagine. Imagen è un modello di diffusione con un elevato grado di fotorealismo. Il modello Pathways Autoregressive Text-to-Image (Parti) supporta una sintesi ricca di contenuti che include composizioni complesse e conoscenze del mondo. Muse è un modello Transformer per prestazioni elevate di generazione di immagini. Inoltre, Gemini amplia le possibilità con un modello in grado di comprendere praticamente qualsiasi input e generare quasi tutti gli output, inclusi testo, immagini, audio, video e codice.

In che modo questi modelli sono diversi tra loro?

Imagen, un modello di diffusione, è ottimo per il fotorealismo con un profondo livello di comprensione del linguaggio. Parti, un modello autoregressivo, è ottimo per uno stile e un tema coerenti e per generare immagini in uno stile particolare. Muse, un modello Transformer, è in grado di generare immagini con più oggetti e composizioni complesse. Ognuno di essi offre punti di forza unici: Imagen eccelle nel fotorealismo, Parti in contenuti avanzati e Muse per la velocità e gli strumenti di editing. Sono tutti facili da usare e non richiedono alcuna conoscenza di programmazione.

Che cos'è Imagen 3?

Imagen 3 è l'ultimo modello di generazione di immagini di Google. Offre una qualità dell'immagine eccezionale insieme a diversi miglioramenti rispetto a Imagen 2, tra cui una generazione più rapida di oltre il 40% per prototipazione e iterazione rapide; una migliore comprensione del prompt e una migliore capacità di seguire le istruzioni; permette generazioni fotorealistiche, inclusi gruppi di persone; e un maggiore controllo sul rendering del testo all'interno di un'immagine. 

Disponibile per i clienti di Vertex AI con accesso in anteprima, Imagen 3 include anche supporto multilingue, funzionalità di sicurezza integrate come la filigrana digitale di SynthID di Google DeepMind e supporto di più formati.

Come posso utilizzare questi modelli di Google?

Puoi accedere a questi modelli di IA da testo a immagine tramite Vertex AI su Google Cloud o tramite un provider di API di terze parti. Per utilizzare i modelli, è sufficiente fornire un prompt di testo, selezionare i parametri (alcuni modelli consentono di selezionare i parametri che controllano lo stile, la creatività e l'accuratezza dell'immagine generata) e infine generare l'immagine. 

Come funziona

L'IA da testo a immagine utilizza l'elaborazione del linguaggio naturale (NLP) per convertire la descrizione testuale in un formato leggibile dalle macchine. Una volta convertito in un formato leggibile dal computer, il modello di machine learning viene addestrato su un enorme set di dati di testo e immagini, impara a identificare i pattern e a utilizzarli per generare nuove immagini. L'IA da testo a immagine di Google Cloud utilizza un modello di deep learning chiamato Imagen, un modello all'avanguardia in grado di generare immagini fotorealistiche da descrizioni testuali.

UI del prodotto di IA generativa
Genera e modifica immagini con Vertex AI Studio

Utilizzi comuni

Genera immagini usando l'IA

Genera immagini utilizzando prompt di testo

Scopri come utilizzare la funzionalità di generazione da testo a immagine di Imagen su Vertex AI ed esportare una versione migliorata di un'immagine generata. Questa guida rapida mostra come utilizzare la generazione di immagini Imagen nella console Google Cloud.

Inizia
Immagine generata di un cane che legge un giornale nel prodotto Vertex AI

Genera immagini utilizzando prompt di testo

Scopri come utilizzare la funzionalità di generazione da testo a immagine di Imagen su Vertex AI ed esportare una versione migliorata di un'immagine generata. Questa guida rapida mostra come utilizzare la generazione di immagini Imagen nella console Google Cloud.

Inizia
Immagine generata di un cane che legge un giornale nel prodotto Vertex AI

Modifica immagini con l'IA

Modificare le immagini tramite prompt di testo

Utilizza Imagen per modificare le immagini generate o esistenti. Puoi utilizzare un prompt di testo per aggiornare l'intera immagine (modifica senza maschera) oppure puoi specificare una parte dell'immagine da modificare in aggiunta alla descrizione testuale degli aggiornamenti (modifica di base).

Inizia a modificare le immagini con prompt di testo
Modificare le immagini in Vertex AI

Modificare le immagini tramite prompt di testo

Utilizza Imagen per modificare le immagini generate o esistenti. Puoi utilizzare un prompt di testo per aggiornare l'intera immagine (modifica senza maschera) oppure puoi specificare una parte dell'immagine da modificare in aggiunta alla descrizione testuale degli aggiornamenti (modifica di base).

Inizia a modificare le immagini con prompt di testo
Modificare le immagini in Vertex AI

Didascalie visive con l'IA

Ottenere le descrizioni delle immagini usando le didascalie visive

Genera descrizioni pertinenti per le immagini, inclusi metadati dettagliati, sottotitoli automatici e descrizioni rapide di prodotti e risorse visive.

Inizia a generare didascalie per le tue immagini
UI del prodotto didascalia dell'immagine

Ottenere le descrizioni delle immagini usando le didascalie visive

Genera descrizioni pertinenti per le immagini, inclusi metadati dettagliati, sottotitoli automatici e descrizioni rapide di prodotti e risorse visive.

Inizia a generare didascalie per le tue immagini
UI del prodotto didascalia dell'immagine

Inizia la tua proof of concept

I nuovi clienti ricevono fino a 300 $ di crediti gratuiti per generare immagini e altro in Vertex AI

Hai un progetto di grandi dimensioni?

Scopri quali tipi di immagini puoi creare

Scopri come generare immagini utilizzando i prompt di testo

Scopri come generare e verificare le filigrane immagine

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Console
Google Cloud