Guida ai prompt per la generazione di video di Vertex AI

Questa guida fornisce esempi dei tipi di video che puoi creare utilizzando Veo e mostra come modificare parti specifiche di un prompt per ottenere risultati diversi.

Panoramica della guida ai prompt

Vertex AI Veo è un modello di generazione di testo in video e di immagini in video.Per utilizzare Veo, devi fornire un prompt, ovvero una descrizione testuale di ciò che vuoi che generi il tuo modello di AI generativa.

Filtri di sicurezza

Veo applica filtri di sicurezza a Vertex AI per contribuire ad assicurare che i video generati e le foto caricate non contengano contenuti offensivi. Ad esempio, i prompt che violano le linee guida sull'AI responsabile sono bloccati.

Se sospetti un abuso di Veo o di qualsiasi output generato che contenga materiale inappropriato o informazioni imprecise, utilizza il modulo per segnalare un presunto abuso su Google Cloud.

Nozioni di base per scrivere i prompt

I prompt efficaci sono descrittivi e chiari. Per avvicinare il video generato a ciò che vuoi, inizia identificando l'idea di base e poi perfezionala aggiungendo parole chiave e modificatori.

Il prompt deve includere i seguenti elementi:

  1. Soggetto: l'oggetto, la persona, l'animale o lo scenario che vuoi inserire nel video.
  2. Contesto: lo sfondo o il contesto in cui è posizionato il soggetto.
  3. Azione: cosa sta facendo il soggetto (ad esempio camminare, correre o girare la testa).
  4. Stile: può essere generico o molto specifico. Valuta la possibilità di utilizzare parole chiave specifiche per lo stile cinematografico, ad esempio film horror, film noir o stili di animazione come il rendering nello stile cartoon.
  5. Movimento della videocamera: (Facoltativo) Azione della videocamera, ad esempio vista aerea, livello occhi, dall'alto verso il basso o dall'alto verso il basso.
  6. Composizione: (facoltativo) inquadratura dell'inquadratura, ad esempio immagine ampia, primo piano o primo piano estremo.
  7. Ambiente: (facoltativo) il modo in cui il colore e la luce contribuiscono alla scena, ad esempio tonalità blu, notturne o calde.

Esempi di prompt e output generato

Questa sezione presenta diversi prompt e spiega in che modo il livello di dettaglio fornito in ciascun prompt ti consente di avvicinarti a ciò che vuoi nel tuo video.

Ghiaccioli

Questo video mostra come utilizzare ciascuno degli elementi del prompt.

Prompt Output generato
Primo piano (composizione) di ghiaccioli che si sciolgono (soggetto) su una parete di roccia ghiacciata (contesto) con tonalità blu fredde (atmosfera), zoomato (movimento della fotocamera) mantenendo i dettagli in primo piano delle gocce d'acqua (azione). Cascate di ghiaccio su sfondo blu.

Uomo al telefono

Questi video mostrano come puoi rivedere il prompt con dettagli più specifici sul video che vuoi che Veo generi.

Prompt Output generato Analisi
La fotocamera si sposta per mostrare un primo piano di un uomo disperato in un trench verde che sta effettuando una chiamata su una cornetta da parete con una luce al neon verde e una scena di un film. Uomo che parla al telefono. Questo è il primo video generato in base al prompt.
Un primo piano cinematografico segue un uomo disperato in un impermeabile verde sbiadito mentre compone un numero su una cornetta montata su una parete di mattoni ruvida, immersa nell'inquietante bagliore di una insegna al neon verde. La videocamera si avvicina, rivelando la tensione della mascella e la disperazione stampata sul suo viso mentre cerca di effettuare la chiamata. La profondità di campo ridotta si concentra sulla fronte corrugata e sul telefono rotativo nero, sfocando lo sfondo in un mare di colori neon e ombre indistinte, creando un senso di urgenza e isolamento. Uomo che parla al telefono Un prompt più dettagliato consente di creare un video più incentrato e con un ambiente più ricco.
Un video con movimenti fluidi che si avvicina a un uomo disperato in un trench verde, che utilizza un telefono a rotazione vintage contro una parete immersa in un'inquietante luce al neon verde. La videocamera inizia da una distanza media, avvicinandosi lentamente al volto dell'uomo, rivelando la sua espressione frenetica e il sudore sulla fronte mentre compone il numero di telefono con urgenza. L'attenzione è sulle mani dell'uomo, le sue dita che maneggiano il quadrante mentre cerca disperatamente di connettersi. La luce al neon verde proietta ombre lunghe sulla parete, contribuendo a creare un'atmosfera tesa. La scena è inquadrata in modo da sottolineare l'isolamento e la disperazione dell'uomo, mettendo in evidenza il netto contrasto tra il bagliore vibrante del neon e la determinazione ostinata dell'uomo. Uomo che parla al telefono. L'aggiunta di più dettagli ha dato al soggetto un'espressione realistica e ha creato una scena intensa e vibrante.

Leopardo delle nevi

Questo prompt mostra l'output che Veo potrebbe generare.

Prompt Output generato
Una creatura carina con pelliccia simile a quella del leopardo delle nevi cammina nella foresta invernale, rendering in stile cartone animato 3D. Il leopardo delle nevi è apatico.

Leopardo delle nevi in corsa

Questo prompt è più dettagliato e mostra un output generato che potrebbe essere più vicino a ciò che vuoi nel tuo video.

Prompt Output generato
Crea una breve scena animata 3D in uno stile allegro da cartone animato. Una creatura graziosa con una pelliccia simile a quella del leopardo delle nevi, grandi occhi espressivi e una forma amichevole e arrotondata galoppa felicemente in una foresta invernale stravagante. La scena deve includere alberi arrotondati coperti di neve, fiocchi di neve che cadono dolcemente e la luce calda del sole che filtra tra i rami. I movimenti vivaci e il sorriso smagliante della creatura devono trasmettere pura gioia. Scegli un tono allegro e positivo con colori vivaci e allegri e animazioni giocose. Valuta la possibilità di aggiungere effetti sonori sottili e stravaganti per migliorare l'atmosfera gioiosa dell'inverno. Leopardo delle nevi è in esecuzione più velocemente.

Altri suggerimenti per scrivere i prompt

I seguenti suggerimenti ti aiutano a scrivere prompt che generano i tuoi video:

  • Utilizza un linguaggio descrittivo: usa aggettivi e avverbi per descrivere in modo chiaro la situazione a Veo.
  • Fornisci il contesto: se necessario, includi informazioni di contesto per aiutare il modello a capire cosa vuoi.
  • Fai riferimento a stili artistici specifici: se hai in mente un'estetica particolare, fai riferimento a stili artistici o movimenti artistici specifici.
  • Utilizza gli strumenti di prompt engineering: valuta la possibilità di esplorare strumenti o risorse di prompt engineering per perfezionare i prompt e ottenere risultati ottimali. Per ulteriori informazioni, consulta la sezione Introduzione ai prompt.
  • Migliora i dettagli del viso nelle immagini personali e di gruppo: specifica i dettagli del viso come punto focale della foto, ad esempio utilizzando la parola ritratto nel prompt.

Aggiungere ulteriori dettagli ai prompt

Questi esempi mostrano come perfezionare i prompt per generare i video.

Descrizione del soggetto

Questo esempio mostra come specificare una descrizione dell'oggetto.

Descrizione dell'oggetto Prompt Output generato
Questa descrizione può includere un soggetto, più soggetti e azioni, ad esempio "condominio in cemento bianco". Un rendering architettonico di un condominio in cemento bianco con forme organiche fluide, che si fondono perfettamente con una vegetazione lussureggiante ed elementi futuristici Segnaposto.

Contesto

Questo esempio mostra come specificare il contesto.

Contesto Prompt Output generato
Lo sfondo o il contesto in cui verrà inserito l'oggetto è molto importante. Prova a posizionare il soggetto in vari sfondi, ad esempio su una strada trafficata o nello spazio cosmico Un satellite che fluttua nello spazio con la luna e alcune stelle sullo sfondo. Satellite che galleggia nell'atmosfera.

Azione

Questo esempio mostra come specificare l'azione.

Azione Prompt Output generato
Azione del soggetto, ad esempio camminare, correre o girare la testa. Un'inquadratura ampia di una donna che cammina lungo la spiaggia, con un'espressione soddisfatta e rilassata, mentre guarda verso l'orizzonte al tramonto. Il tramonto è assolutamente meraviglioso.

Stile

Questo esempio mostra come specificare lo stile.

Stile Prompt Output generato
Puoi aggiungere parole chiave per migliorare la qualità della generazione e indirizzarla verso uno stile più simile a quello previsto, ad esempio sfocatura, foto di film, minimalista, surreale, vintage, futuristico, doppia esposizione. Stile noir, uomo e donna che camminano per strada, mistero, cinema, bianco e nero. Lo stile noir è assolutamente meraviglioso.

Movimento della videocamera

Questo esempio mostra come specificare il movimento della videocamera.

Rilevamento di movimento della videocamera Prompt Output generato
Inquadratura in prima persona, vista aerea, inquadratura con drone in movimento, inquadratura in movimento Una ripresa in POV di un'auto d'epoca che guida sotto la pioggia, Canada di notte, cinematografico. Il tramonto è assolutamente meraviglioso.

Composizione

Questo esempio mostra come specificare la composizione.

Composizione Prompt Output generato
L'inquadratura della foto (campo lungo, primo piano, angolazione bassa) Primo piano estremo di un occhio con la città riflessa al suo interno. Il tramonto è assolutamente meraviglioso.
L'inquadratura della foto (campo lungo, primo piano, angolazione bassa) Crea un video di un'inquadratura ampia di un surfista che cammina su una spiaggia con una tavola da surf, tramonto stupendo, stile cinematografico. Il tramonto è assolutamente meraviglioso.

Atmosfera

Questo esempio mostra come specificare l'atmosfera.

Atmosfera Prompt Output generato
L'aggiunta di colori ha contribuito a rendere l'immagine unica e a trasmettere le emozioni desiderate: "toni caldi arancioni attenuati", "luce naturale", "alba / tramonto". Le palette di colori svolgono un ruolo fondamentale nella fotografia, influenzando l'atmosfera e l'impatto emotivo di un'immagine e rendendo coerente lo stile dell'immagine. Ad esempio, una tavolozza calda e dorata può infondere un'atmosfera romantica e suggestiva a una fotografia. Esempi di tavolozze di colori: "toni pastello blu e rosa", "illuminazione ambientale soffusa", "toni freddi e attenuati" Primo piano di una ragazza che tiene in braccio un adorabile cucciolo di golden retriever nel parco, luce del sole. Un cucciolo tra le braccia di una ragazzina.
L'aggiunta di colori ha contribuito a rendere l'immagine unica e a trasmettere le emozioni desiderate: "toni caldi arancioni attenuati", "luce naturale", "alba / tramonto". Le palette di colori svolgono un ruolo fondamentale nella fotografia, influenzando l'atmosfera e l'impatto emotivo di un'immagine e rendendo coerente lo stile dell'immagine. Ad esempio, una tavolozza calda e dorata può infondere un'atmosfera romantica e suggestiva a una fotografia. Esempi di tavolozze di colori: "toni pastello blu e rosa", "illuminazione ambientale soffusa", "toni freddi e attenuati" Primo piano cinematografico di una donna triste che viaggia su un autobus sotto la pioggia, toni blu freddi, atmosfera triste. Una donna che si sente triste su un autobus.

Utilizzare immagini di riferimento per generare video

Puoi dare vita alle immagini utilizzando la funzionalità di conversione di immagini in video di Veo e utilizzare i tuoi asset esistenti o Imagen per creare qualcosa di nuovo.

Prompt Output generato
Coniglio con una barretta di cioccolato. Bunny sta scappando.
Il coniglietto scappa. Bunny sta scappando.

Prompt negativi

I prompt negativi possono essere uno strumento efficace per specificare quali elementi escludere dal video. Descrivi ciò che vuoi scoraggiare il modello a generare descrivendone ciò che vuoi che generi. Segui questi suggerimenti:

  • ❌ Non utilizzare un linguaggio didattico o parole come no o non. Ad esempio, "Nessuna parete" o "Non mostrare le pareti".

  • ✅ Descrivi ciò che non vuoi vedere. Ad esempio, "muro, inquadratura", il che significa che non vuoi che nel video siano presenti una parete o una cornice.

Prompt Output generato
Genera un'animazione breve e stilizzata di una grande quercia solitaria con le foglie che volano vigorosamente in un forte vento. L'albero deve avere una forma leggermente esagerata e stravagante, con rami dinamici e fluenti. Le foglie devono mostrare una varietà di colori autunnali, roteando e danzando nel vento. L'animazione deve avere una traccia audio delicata e suggestiva e utilizzare una tavolozza di colori calda e invitante. Albero con parole.
Genera un'animazione breve e stilizzata di una grande quercia solitaria con le foglie che volano vigorosamente in un forte vento. L'albero deve avere una forma leggermente esagerata e stravagante, con rami dinamici e fluenti. Le foglie devono mostrare una varietà di colori autunnali, roteando e danzando nel vento. L'animazione deve avere una traccia audio delicata e suggestiva e utilizzare una tavolozza di colori calda e invitante.

Con prompt negativo: sfondo urbano, strutture create dall'uomo, atmosfera buia, tempestosa o minacciosa.
Albero senza parole chiave escluse.

Proporzioni

La generazione di video Vertex AI Veo supporta i seguenti due rapporti di aspetto:

Proporzioni Descrizione
Widescreen o 16:9 Ha sostituito il formato 4:3 ed è il formato più comune per televisioni, monitor e schermi di cellulari (orizzontale). Utilizzala quando vuoi catturare più dello sfondo, ad esempio paesaggi panoramici.
Verticale o 9:16 Formato widescreen, ma con rotazione. Si tratta di un formato relativamente nuovo, che è stato reso popolare dalle applicazioni di video nel formato breve, come YouTube Shorts. Utilizzalo per ritratti o oggetti alti con forti orientamenti verticali, come edifici, alberi, cascate o edifici.

Widescreen: proporzioni 16:9

Questo è un esempio di prompt widescreen con proporzioni 16:9.

Prompt Output generato
Crea un video con una vista da un drone in movimento di un uomo che guida un'auto decappottabile rossa a Palm Springs, anni '70, luce del sole calda, ombre lunghe. La cascata è assolutamente meravigliosa.

Verticale: proporzioni 9:16

Questo è un esempio di prompt verticale con proporzioni 9:16.

Prompt Output generato
Crea un video con un movimento fluido di una maestosa cascata hawaiana immersa in una rigogliosa foresta pluviale. Concentrati su un flusso d'acqua realistico, fogliame dettagliato e illuminazione naturale per trasmettere tranquillità. Scatta foto dell'acqua che scorre, dell'atmosfera nebbiosa e della luce del sole che filtra attraverso la fitta canopia. Utilizza movimenti fluidi e cinematografici della fotocamera per mettere in evidenza la cascata e i suoi dintorni. Mira a un tono tranquillo e realistico, che trasporti lo spettatore nella bellezza serena della foresta pluviale hawaiana. La cascata è assolutamente meravigliosa.