Veo on Vertex AI video generation prompt guide

Este guia oferece exemplos dos tipos de vídeos que pode criar com o Veo e mostra-lhe como modificar partes específicas de um comando para produzir resultados diferentes.

Vista geral do guia de comandos

O Vertex AI Veo é um modelo de geração de texto para vídeo e de imagem para vídeo. Para usar o Veo, tem de fornecer um comando, que é uma descrição de texto do que quer que o seu modelo de IA generativa gere.

Filtros de segurança

O Veo aplica filtros de segurança no Vertex AI para ajudar a garantir que os vídeos gerados e as fotos carregadas não contêm conteúdo ofensivo. Por exemplo, os comandos que violam as diretrizes de IA responsável são bloqueados.

Se suspeitar de abuso do Veo ou de qualquer resultado gerado que contenha material impróprio ou informações imprecisas, use o formulário de denúncia de suspeita de abuso noGoogle Cloud.

Noções básicas para escrever comandos

Os bons comandos são descritivos e claros. Para aproximar o vídeo gerado do que quer, comece por identificar a sua ideia principal e, em seguida, refine-a adicionando palavras-chave e modificadores.

Os seguintes elementos devem ser incluídos no comando:

  1. Assunto: o objeto, a pessoa, o animal ou o cenário que quer no vídeo.
  2. Contexto: o fundo ou o contexto em que o objeto está inserido.
  3. Ação: o que o objeto está a fazer (por exemplo, caminhar, correr ou virar a cabeça).
  4. Estilo: pode ser geral ou muito específico. Considere usar palavras-chave específicas de estilos de filmes, como filme de terror, filme noir ou estilos animados, como a renderização no estilo de desenho animado.
  5. Movimento da câmara: opcional: o que a câmara está a fazer, como vista aérea, ao nível dos olhos, foto de cima para baixo ou foto em ângulo baixo.
  6. Composição: opcional: como a imagem é enquadrada, como plano geral, primeiro plano ou primeiro plano extremo.
  7. Ambiente: opcional: como a cor e a luz contribuem para a cena, como tons azuis, noite ou tons quentes.

Exemplos de comandos e resultados gerados

Esta secção apresenta vários comandos e como o nível de detalhe fornecido em cada comando lhe permite aproximar-se do que quer no seu vídeo.

Sincelos

Este vídeo demonstra como pode usar cada um dos elementos no seu comando.

Comando Resultados gerados
Foto em grande plano (composição) de estalactites a derreter (objeto) numa parede de rocha gelada (contexto) com tons azuis frios (ambiente), com zoom (movimento da câmara) a manter os detalhes em grande plano das gotas de água (ação). Estalactites a pingar com um fundo azul.

Homem ao telefone

Estes vídeos demonstram como pode rever o seu comando com detalhes mais específicos sobre o vídeo que quer que o Veo gere.

Comando Resultados gerados Análise
A câmara move-se para mostrar um grande plano de um homem desesperado com uma gabardina verde a fazer uma chamada num telefone de parede de disco com uma luz de néon verde e uma cena de filme. Homem a falar ao telemóvel. Este é o primeiro vídeo gerado com base no comando.
Um plano cinematográfico em grande plano segue um homem desesperado com uma gabardina verde desgastada enquanto marca um número num telefone de disco montado numa parede de tijolo áspera, banhada pelo brilho sinistro de um sinal de néon verde. A câmara aproxima-se, revelando a tensão no maxilar e o desespero gravado no rosto enquanto se esforça para fazer a chamada. A profundidade de campo reduzida foca-se na sua testa franzida e no telefone rotativo preto, esbatendo o fundo num mar de cores néon e sombras indistintas, criando uma sensação de urgência e isolamento. Homem a falar ao telemóvel Um comando mais detalhado resulta num vídeo mais focado com um ambiente mais rico.
Um vídeo com movimento suave que se aproxima de um homem desesperado com uma gabardina verde a usar um telefone de disco vintage junto a uma parede banhada num brilho de néon verde assustador. A câmara começa a uma distância média e aproxima-se lentamente do rosto do homem, revelando a sua expressão frenética e o suor na testa enquanto marca urgentemente um número no telemóvel. O foco está nas mãos do homem, com os dedos a mexer no disco enquanto tenta desesperadamente estabelecer ligação. A luz de néon verde projeta longas sombras na parede, o que contribui para a atmosfera tensa. A cena é enquadrada para enfatizar o isolamento e o desespero do homem, realçando o forte contraste entre o brilho vibrante do néon e a determinação sombria do homem. Homem a falar ao telemóvel. Adicionar mais detalhes deu ao objeto uma expressão realista e criou uma cena intensa e vibrante.

Leopardo-das-neves

Este comando demonstra o resultado que o Veo pode gerar.

Comando Resultados gerados
Uma criatura fofa com pelo semelhante ao de um leopardo-das-neves a caminhar numa floresta de inverno, renderização em estilo de desenho animado 3D. O leopardo-das-neves está letárgico.

Leopardo-das-neves a correr

Este comando tem mais detalhes e demonstra o resultado gerado que pode estar mais próximo do que quer no seu vídeo.

Comando Resultados gerados
Cria uma cena animada 3D curta num estilo de desenho animado alegre. Uma criatura fofa com pelo semelhante ao de um leopardo-das-neves, olhos grandes e expressivos, e uma forma amigável e arredondada salta alegremente por uma floresta de inverno caprichosa. A cena deve apresentar árvores arredondadas cobertas de neve, flocos de neve a cair suavemente e luz solar quente a filtrar-se pelos ramos. Os movimentos saltitantes da criatura e o sorriso largo devem transmitir puro deleite. Opte por um tom animado e reconfortante com cores alegres e vivas, e animação divertida. Considere adicionar efeitos sonoros subtis e caprichosos para melhorar a atmosfera alegre do inverno. O Snow Leopard está a funcionar mais rapidamente.

Mais sugestões para escrever comandos

As seguintes sugestões ajudam a escrever comandos que geram os seus vídeos:

  • Use linguagem descritiva: use adjetivos e advérbios para dar uma imagem clara ao Veo.
  • Forneça contexto: se necessário, inclua informações gerais para ajudar o modelo a compreender o que quer.
  • Referencie estilos artísticos específicos: se tiver uma estética específica em mente, referencie estilos artísticos ou movimentos artísticos específicos.
  • Use ferramentas de engenharia de comandos: considere explorar ferramentas ou recursos de engenharia de comandos para ajudar a refinar os seus comandos e alcançar resultados ideais. Para mais informações, consulte o artigo Introdução aos comandos.
  • Melhore os detalhes faciais nas suas imagens pessoais e de grupo: especifique os detalhes faciais como foco da foto, como usar a palavra retrato no comando.

Adicione mais detalhes aos comandos

Estes exemplos mostram como refinar os seus comandos para gerar os vídeos.

Descrição do assunto

Este exemplo mostra como especificar uma descrição do assunto.

Descrição do assunto Comando Resultados gerados
Esta descrição pode incluir um objeto, vários objetos e ações, como "prédio de apartamentos de betão branco". Uma renderização arquitetónica de um prédio de apartamentos de betão branco com formas orgânicas fluidas, que se misturam perfeitamente com a vegetação exuberante e os elementos futuristas Marcador de posição.

Contexto

Este exemplo mostra como especificar o contexto.

Contexto Comando Resultados gerados
O fundo ou o contexto em que o objeto vai ser colocado é muito importante. Experimente colocar o objeto em vários fundos, como numa rua movimentada ou no espaço sideral Um satélite a flutuar no espaço com a lua e algumas estrelas ao fundo. Satélite a flutuar na atmosfera.

Ação

Este exemplo mostra como especificar a ação.

Ação Comando Resultados gerados
O que o objeto está a fazer, como caminhar, correr ou virar a cabeça. Uma imagem ampla de uma mulher a caminhar ao longo da praia, com um aspeto feliz e descontraído, e a olhar para o horizonte ao pôr do sol. O pôr do sol é absolutamente lindo.

Estilo

Este exemplo mostra como especificar o estilo.

Estilo Comando Resultados gerados
Pode adicionar palavras-chave para melhorar a qualidade da geração e direcioná-la para um estilo mais próximo do pretendido, como profundidade de campo reduzida, fotograma de filme, minimalista, surreal, vintage, futurista ou dupla exposição. Estilo film noir, homem e mulher a caminhar na rua, mistério, cinematográfico, preto e branco. O estilo film noir é absolutamente maravilhoso.

Movimento da câmara

Este exemplo mostra como especificar o movimento da câmara.

Movimento da câmara Comando Resultados gerados
Plano POV, vista aérea, vista de drone de acompanhamento, plano de acompanhamento Uma perspetiva em primeira pessoa de um carro vintage a conduzir à chuva, no Canadá à noite, com um estilo cinematográfico. O pôr do sol é absolutamente lindo.

Composição

Este exemplo mostra como especificar a composição.

Composição Comando Resultados gerados
Como a cena é enquadrada (plano amplo, grande plano, ângulo baixo) Close-up extremo de um olho com a cidade refletida nele. O pôr do sol é absolutamente lindo.
Como a cena é enquadrada (plano amplo, grande plano, ângulo baixo) Cria um vídeo com uma vista ampla de um surfista a caminhar numa praia com uma prancha de surf, um pôr do sol bonito e um estilo cinematográfico. O pôr do sol é absolutamente lindo.

Atmosfera

Este exemplo mostra como especificar o ambiente.

Atmosfera Comando Resultados gerados
A adição de cores ajudou a tornar a imagem única e a transmitir as emoções pretendidas: "tons quentes de laranja esbatidos", "luz natural", "nascer / pôr do sol". As paletas de cores desempenham um papel vital na fotografia, influenciando o ambiente e o impacto emocional de uma imagem, e tornando o estilo da imagem consistente. Por exemplo, uma paleta dourada e quente pode dar um toque romântico e atmosférico a uma fotografia. Exemplos de paletas de cores: "tons pastel de azul e rosa", "iluminação ambiente fraca", "tons frios esbatidos" Um grande plano de uma menina a segurar um adorável cachorro golden retriever no parque, à luz do sol. Um cachorro nos braços de uma jovem.
A adição de cores ajudou a tornar a imagem única e a transmitir as emoções pretendidas: "tons quentes de laranja esbatidos", "luz natural", "nascer / pôr do sol". As paletas de cores desempenham um papel vital na fotografia, influenciando o ambiente e o impacto emocional de uma imagem, e tornando o estilo da imagem consistente. Por exemplo, uma paleta dourada e quente pode dar um toque romântico e atmosférico a uma fotografia. Exemplos de paletas de cores: "tons pastel de azul e rosa", "iluminação ambiente fraca", "tons frios esbatidos" Plano cinematográfico em grande plano de uma mulher triste a andar de autocarro à chuva, com tons azuis frios e um ambiente triste. Uma mulher a andar de autocarro que se sente triste.

Áudio

O áudio é suportado pelo veo-3.0-generate-001 na pré-visualização.

Especifique claramente se quer áudio. Recomendamos que use frases separadas no comando para descrever o áudio. Seguem-se alguns exemplos de áudio descrito como parte de um comando:

  • Efeitos sonoros:

    • O áudio inclui o som de água a salpicar em segundo plano.
    • Adicionar música suave em segundo plano.
  • Voz:

    • O homem com o chapéu vermelho diz: "Onde está o coelho?" Em seguida, a mulher com o vestido verde junto a ele responde: "Ali, no bosque."

Use imagens de referência para gerar vídeos

Pode dar vida às imagens usando a capacidade de conversão de imagem em vídeo do Veo e usar os seus recursos existentes ou o Imagen para gerar algo novo.

Comando Resultados gerados
Coelhinho com uma barra de chocolate. O coelho está a fugir.
O coelho foge. O coelho está a fugir.

Quando usar a funcionalidade de imagem para vídeo, recomendamos o seguinte:

  • Certifique-se de que as ações e as descrições de voz estão alinhadas com cada objeto presente na imagem de entrada.

  • Quando existem vários motivos na imagem de entrada, especifique claramente que personagem está a realizar uma ação ou a falar. Para distinguir entre vários carateres numa imagem de entrada, use os detalhes descritivos mais distintivos disponíveis. Por exemplo:

    • O homem com o chapéu vermelho.
    • A mulher com o vestido azul.

Comandos negativos

Os comandos negativos podem ser uma ferramenta poderosa que ajuda a especificar que elementos manter fora do vídeo. Descreva o que quer impedir que o modelo gere descrevendo o que quer que o modelo gere. Siga estas sugestões:

  • ❌ Não use linguagem instrutiva nem palavras como não. Por exemplo, "Sem paredes" ou "não mostrar paredes".

  • ✅ Descreva o que não quer ver. Por exemplo, "parede, moldura", o que significa que não quer uma parede nem uma moldura no vídeo.

Comando Resultados gerados
Gera uma animação curta e estilizada de um grande carvalho solitário com folhas a flutuar vigorosamente num vento forte. A árvore deve ter uma forma ligeiramente exagerada e caprichosa, com ramos dinâmicos e fluidos. As folhas devem apresentar uma variedade de cores de outono, a rodopiar e a dançar ao vento. A animação deve incluir uma banda sonora suave e atmosférica, e usar uma paleta de cores quente e convidativa. Árvore com palavras.
Gera uma animação curta e estilizada de um grande carvalho solitário com folhas a flutuar vigorosamente num vento forte. A árvore deve ter uma forma ligeiramente exagerada e caprichosa, com ramos dinâmicos e fluidos. As folhas devem apresentar uma variedade de cores de outono, a rodopiar e a dançar ao vento. A animação deve incluir uma banda sonora suave e atmosférica, e usar uma paleta de cores quente e convidativa.

Com o comando negativo: fundo urbano, estruturas feitas pelo homem, atmosfera escura, tempestuosa ou ameaçadora.
Árvore sem palavras negativas.

Formatos

A geração de vídeos do Vertex AI Veo suporta os seguintes dois formatos:

Formato Descrição
Ecrã panorâmico ou 16:9 O formato 16:9 é o mais comum para televisões, monitores e ecrãs de telemóveis (horizontal). Use esta opção quando quiser captar mais do fundo, como paisagens.
Vertical ou 9:16

Ecrã panorâmico rodado. Este formato é popularizado por aplicações de vídeo de formato curto, como o YouTube Shorts. Use este formato para retratos ou objetos altos com orientações verticais fortes, como edifícios, árvores, quedas de água ou edifícios.

Ecrã panorâmico: formato de 16:9

Este é um exemplo de comando do formato panorâmico com um formato de 16:9.

Comando Resultados gerados
Crie um vídeo com uma vista de drone de seguimento de um homem a conduzir um carro descapotável vermelho em Palm Springs, anos 70, luz solar quente, sombras longas. A cascata é absolutamente deslumbrante.

Vertical: formato de 9:16

Este é um exemplo de comando de retrato com um formato de 9:16.

Comando Resultados gerados
Cria um vídeo com um movimento suave de uma majestosa cascata havaiana numa floresta tropical luxuriante. Foque-se no fluxo de água realista, na folhagem detalhada e na iluminação natural para transmitir tranquilidade. Capture a água corrente, a atmosfera nebulosa e a luz solar salpicada que passa pelo denso dossel. Use movimentos de câmara suaves e cinematográficos para realçar a cascata e a área envolvente. Procure um tom pacífico e realista, transportando o visitante para a beleza serena da floresta tropical havaiana. A cascata é absolutamente deslumbrante.