Guia de comandos de geração de vídeos da Vertex AI

Este guia apresenta exemplos dos tipos de vídeos que podem ser criados usando o Veo e mostra como modificar partes específicas de uma solicitação para produzir resultados diferentes.

Visão geral do guia de comandos

O Vertex AI Veo é um modelo de geração de texto para vídeo e de imagem para vídeo.Para usar o Veo, é necessário fornecer um comando, que é uma descrição em texto do que você quer que o modelo de IA generativa gere.

Filtros de segurança

O Veo aplica filtros de segurança em toda a Vertex AI para garantir que vídeos gerados e fotos enviadas não contenham conteúdo ofensivo. Por exemplo, comandos que violam as diretrizes de IA responsável são bloqueados.

Se você suspeitar de abuso do Veo ou de qualquer saída gerada que contenha material inadequado ou informações imprecisas, use o formulário Google Cloudpara denunciar suspeita de abuso.

Noções básicas para escrever comandos

Boas instruções são descritivas e claras. Para que o vídeo gerado fique mais próximo do que você quer, comece identificando sua ideia principal e, em seguida, refine adicionando palavras-chave e modificadores.

Os seguintes elementos precisam ser incluídos no comando:

  1. Assunto: o objeto, a pessoa, o animal ou o cenário que você quer no vídeo.
  2. Contexto: o plano de fundo ou o contexto em que o assunto está inserido.
  3. Ação: o que o sujeito está fazendo (por exemplo, andar, correr ou virar a cabeça).
  4. Estilo: pode ser geral ou muito específico. Considere usar palavras-chave específicas de estilo de filme, como filme de terror, filme noir ou estilos animados como renderização de estilo cartum.
  5. Movimento da câmera: opcional: o que a câmera está fazendo, como vista aérea, nível dos olhos, vista de cima para baixo ou ângulo baixo.
  6. Composição: opcional. Como a imagem é enquadrada, como plano geral, primeiro plano ou plano de detalhe.
  7. Ambiente: opcional. Como a cor e a luz contribuem para a cena, como tons azuis, noturnos ou quentes.

Exemplos de comandos e saída gerada

Esta seção apresenta várias sugestões e como o nível de detalhes fornecido em cada uma delas permite que você se aproxime do que quer no seu vídeo.

Sinos

Este vídeo demonstra como usar cada um dos elementos no comando.

Comando Saída gerada
Foto de perto (composição) de pingentes derretidos (sujeito) em uma parede de rocha congelada (contexto) com tons azuis frios (ambiente), com zoom (movimento da câmera) mantendo os detalhes de perto de pingos de água (ação). Pingos de água com um fundo azul.

Homem no telefone

Esses vídeos demonstram como revisar a solicitação com detalhes mais específicos sobre o vídeo que você quer que o Veo gere.

Comando Saída gerada Análise
A câmera se aproxima para mostrar um homem desesperado em um sobretudo verde que está fazendo uma ligação em um telefone de parede com discagem giratória, com uma luz de néon verde e uma cena de filme. Homem falando ao telefone. Este é o primeiro vídeo gerado com base no comando.
Um close cinematográfico mostra um homem desesperado em um sobretudo verde enquanto ele disca um telefone de disco montado em uma parede de tijolos ásperos, banhado pelo brilho sinistro de um letreiro de néon verde. A câmera se aproxima, revelando a tensão na mandíbula dele e o desespero estampado no rosto dele enquanto ele luta para fazer a ligação. A profundidade de campo rasa foca na testa franzida e no telefone rotativo preto, desfocando o plano de fundo em um mar de cores neon e sombras indistintas, criando uma sensação de urgência e isolamento. Homem falando ao telefone Um comando mais detalhado resulta em um vídeo mais focado e com um ambiente mais rico.
Um vídeo com movimento suave que mostra um homem desesperado com um sobretudo verde, usando um telefone rotativo vintage em uma parede com um brilho verde neon sinistro. A câmera começa a gravar de uma distância média, se aproximando lentamente do rosto do homem, revelando a expressão frenética e o suor na testa dele enquanto ele disca o número com urgência. O foco está nas mãos do homem, com os dedos mexendo no disco enquanto ele tenta se conectar desesperadamente. A luz verde de néon projeta sombras longas na parede, aumentando a atmosfera tensa. A cena é montada para enfatizar o isolamento e o desespero do homem, destacando o contraste entre o brilho vibrante do neon e a determinação sombria do homem. Homem falando ao telefone. Adicionar mais detalhes deu ao assunto uma expressão realista e criou uma cena intensa e vibrante.

Leopardo-das-neves

Essa solicitação demonstra a saída que o Veo pode gerar.

Comando Saída gerada
Uma criatura fofa com pelo semelhante a um leopardo da neve está caminhando na floresta no inverno, renderização em estilo desenho animado 3D. O leopardo-das-neves está letárgico.

Leopardo-das-neves correndo

Esse comando tem mais detalhes e mostra a saída gerada que pode estar mais próxima do que você quer no vídeo.

Comando Saída gerada
Crie uma cena animada 3D curta em um estilo alegre de desenho animado. Uma criatura fofa com pelo parecido com um leopardo da neve, olhos grandes e expressivos e uma forma arredondada e amigável desfila feliz por uma floresta de inverno fantástica. A cena precisa mostrar árvores cobertas de neve, flocos de neve caindo suavemente e luz solar quente filtrando pelos galhos. Os movimentos saltitantes e o sorriso largo da criatura devem transmitir puro prazer. Procure um tom otimista e caloroso com cores brilhantes e alegres e uma animação divertida. Considere adicionar efeitos sonoros sutis e inusitados para melhorar a atmosfera alegre do inverno. O leopardo-das-neves está mais rápido.

Mais dicas para escrever comandos

As dicas a seguir ajudam você a escrever comandos que geram seus vídeos:

  • Use linguagem descritiva: use adjetivos e advérbios para dar uma ideia clara para a Veo.
  • Fornecer contexto: se necessário, inclua informações de contexto para ajudar o modelo a entender o que você quer.
  • Referências a estilos artísticos específicos: se você tem uma estética em mente, faça referência a estilos ou movimentos artísticos específicos.
  • Use ferramentas de engenharia de comando: considere usar ferramentas ou recursos de engenharia de comando para refinar seus comandos e alcançar resultados ideais. Para mais informações, consulte Introdução às sugestões.
  • Aprimore os detalhes faciais nas suas imagens pessoais e em grupo: especifique detalhes faciais como foco da foto, como usar a palavra retrato no comando.

Adicionar mais detalhes aos comandos

Esses exemplos mostram como refinar as instruções para gerar vídeos.

Descrição do assunto

Este exemplo mostra como especificar uma descrição do assunto.

Descrição do assunto Comando Saída gerada
Essa descrição pode incluir um tema, vários temas e ações, como "prédio de apartamentos de concreto branco". Renderização arquitetônica de um edifício de apartamentos de concreto branco com formas orgânicas fluidas, que se misturam perfeitamente com vegetação exuberante e elementos futuristas Marcador.

Contexto

Este exemplo mostra como especificar o contexto.

Contexto Comando Saída gerada
O plano de fundo ou o contexto em que o assunto será colocado é muito importante. Tente colocar o objeto em vários planos de fundo, como em uma rua movimentada ou no espaço sideral. Um satélite flutuando pelo espaço sideral com a lua e algumas estrelas ao fundo. Satélite flutuando na atmosfera.

Ação

Este exemplo mostra como especificar a ação.

Ação Comando Saída gerada
O que o sujeito está fazendo, como caminhar, correr ou virar a cabeça. Uma imagem ampla de uma mulher caminhando pela praia, parecendo contente e relaxada e olhando para o horizonte ao pôr do sol. O pôr do sol é absolutamente lindo.

Estilo

Este exemplo mostra como especificar o estilo.

Estilo Comando Saída gerada
É possível adicionar palavras-chave para melhorar a qualidade da geração e direcioná-la para o estilo desejado, como profundidade de campo rasa, foto de filme, minimalismo, surrealismo, vintage, futurismo, dupla exposição. Estilo de filme noir, homem e mulher caminhando na rua, mistério, cinematográfico, preto e branco. O estilo noir é absolutamente lindo.

Movimento da câmera

Este exemplo mostra como especificar o movimento da câmera.

Movimento da câmera Comando Saída gerada
Plano de detalhe, vista aérea, vista de drone com rastreamento, plano de detalhe com rastreamento Uma cena em primeira pessoa de um carro antigo dirigindo na chuva, no Canadá à noite, cinematográfica. O pôr do sol é absolutamente lindo.

Composição

Este exemplo mostra como especificar a composição.

Composição Comando Saída gerada
Como a foto é enquadrada (plano geral, close-up, ângulo baixo) Close-up extremo de um olho com a cidade refletida nele. O pôr do sol é absolutamente lindo.
Como a foto é enquadrada (plano geral, close-up, ângulo baixo) Criar um vídeo de uma tomada ampla de um surfista caminhando em uma praia com uma prancha, um pôr do sol bonito, cinematográfico. O pôr do sol é absolutamente lindo.

Atmosfera

Este exemplo mostra como especificar o ambiente.

Ambiente Comando Saída gerada
Adicionar cores ajudou a imagem a parecer única e transmitir as emoções pretendidas "tons quentes de laranja suaves", "luz natural", "nascer / pôr do sol". As paletas de cores têm um papel vital na fotografia, influenciando o humor e o impacto emocional de uma imagem e tornando o estilo da imagem consistente. Por exemplo, uma paleta dourada e quente pode transmitir uma sensação romântica e atmosférica a uma fotografia. Exemplos de paletas de cores: "tons pastel de azul e rosa", "iluminação ambiente fraca", "tons frios e suaves" Um close de uma garota segurando um adorável filhote de golden retriever no parque, com luz do sol. Um filhote de cachorro nos braços de uma menina.
Adicionar cores ajudou a imagem a parecer única e transmitir as emoções pretendidas "tons quentes de laranja suaves", "luz natural", "nascer / pôr do sol". As paletas de cores têm um papel vital na fotografia, influenciando o humor e o impacto emocional de uma imagem e tornando o estilo da imagem consistente. Por exemplo, uma paleta dourada e quente pode transmitir uma sensação romântica e atmosférica a uma fotografia. Exemplos de paletas de cores: "tons pastel de azul e rosa", "iluminação ambiente fraca", "tons frios e suaves" Plano fechado cinematográfico de uma mulher triste em um ônibus na chuva, tons azuis frios, clima triste. Uma mulher em um ônibus que está triste.

Usar imagens de referência para gerar vídeos

Você pode dar vida às imagens usando a capacidade de conversão de imagem em vídeo da Veo e usar seus recursos ou o Imagen para gerar algo novo.

Comando Saída gerada
Coelho com uma barra de chocolate. O coelho está fugindo.
O coelho foge. O coelho está fugindo.

Solicitações negativas

As solicitações negativas podem ser uma ferramenta poderosa que ajuda a especificar quais elementos manter fora do vídeo. Descreva o que você quer que o modelo não gere para evitar que ele gere. Siga estas dicas:

  • ❌ Não use linguagem instrutiva ou palavras como não ou não faça. Por exemplo, "Sem paredes" ou "não mostrar paredes".

  • ✅ Descreva o que você não quer que seja mostrado. Por exemplo, "wall, frame", que significa que você não quer uma parede ou um frame no vídeo.

Comando Saída gerada
Gerar uma animação curta e estilizada de uma árvore de carvalho grande e solitária com folhas balançando vigorosamente em um vento forte. A árvore precisa ter uma forma ligeiramente exagerada e inusitada, com galhos dinâmicos e fluidos. As folhas devem mostrar uma variedade de cores de outono, girando e dançando ao vento. A animação deve ter uma trilha sonora suave e atmosférica e usar uma paleta de cores acolhedora. Árvore com palavras.
Gerar uma animação curta e estilizada de uma árvore de carvalho grande e solitária com folhas balançando vigorosamente em um vento forte. A árvore precisa ter uma forma ligeiramente exagerada e inusitada, com galhos dinâmicos e fluidos. As folhas devem mostrar uma variedade de cores de outono, girando e dançando ao vento. A animação precisa ter uma trilha sonora suave e atmosférica e usar uma paleta de cores acolhedora.

Com um comando negativo: cenário urbano, estruturas artificiais, atmosfera escura, tempestuosa ou ameaçadora.
Árvore sem palavras negativas.

Proporções

A geração de vídeo da Vertex AI Veo oferece suporte às duas proporções a seguir:

Proporção Descrição
Widescreen ou 16:9 Substituiu a proporção 4:3 e é a proporção mais comum para televisões, monitores e telas de smartphones (paisagem). Use essa opção quando quiser capturar mais do plano de fundo, como paisagens panorâmicas.
Retrato ou 9:16 Tela widescreen, mas girada. Essa é uma proporção relativamente nova que ficou conhecida por apps de vídeos mais curtos, como o YouTube Shorts. Use essa opção para retratos ou objetos altos com fortes orientações verticais, como edifícios, árvores, cachoeiras ou edifícios.

Tela widescreen: proporção de 16:9

Este é um exemplo de comando de tela widescreen com uma proporção de 16:9.

Comando Saída gerada
Criar um vídeo com uma vista de drone de um homem dirigindo um carro conversível vermelho em Palm Springs, década de 1970, com luz solar quente e sombras longas. A cachoeira é absolutamente linda.

Retrato: proporção de 9:16

Este é um exemplo de comando de modo retrato com uma proporção de 9:16.

Comando Saída gerada
Crie um vídeo com um movimento suave de uma majestosa cachoeira havaiana em uma floresta tropical exuberante. Foque no fluxo realista da água, na folhagem detalhada e na iluminação natural para transmitir tranquilidade. Capture a água corrente, a atmosfera nebulosa e a luz do sol filtrada pela copa densa. Use movimentos suaves e cinematográficos da câmera para mostrar a cachoeira e os arredores. Procure um tom tranquilo e realista, que transporte o espectador para a beleza serena da floresta tropical havaiana. A cachoeira é absolutamente linda.