Guía de peticiones de generación de vídeo de Veo en Vertex AI

En esta guía se ofrecen ejemplos de los tipos de vídeos que puedes crear con Veo y se muestra cómo modificar partes específicas de una petición para obtener resultados diferentes.

Información general sobre la guía de peticiones

Vertex AI Veo es un modelo de generación de texto a vídeo e imagen a vídeo. Para usar Veo, debes proporcionar una petición, que es una descripción de texto de lo que quieres que genere tu modelo de IA generativa.

Filtros de seguridad

Veo aplica filtros de seguridad en Vertex AI para asegurarse de que los vídeos generados y las fotos subidas no contengan contenido ofensivo. Por ejemplo, se bloquean las peticiones que infringen las directrices de IA responsable.

Si sospechas que se está haciendo un uso inadecuado de Veo o que se ha generado contenido inapropiado o información inexacta, utiliza el formulario para denunciar un presunto abuso enGoogle Cloud.

Aspectos básicos para escribir peticiones

Las buenas peticiones son descriptivas y claras. Para que el vídeo generado se ajuste más a lo que quieres, empieza por identificar la idea principal y, después, afínala añadiendo palabras clave y modificadores.

Tu petición debe incluir los siguientes elementos:

  1. Tema: el objeto, la persona, el animal o el paisaje que quieras que aparezca en el vídeo.
  2. Contexto: el fondo o el contexto en el que se coloca el sujeto.
  3. Acción: lo que está haciendo el sujeto (por ejemplo, caminar, correr o girar la cabeza).
  4. Estilo: puede ser general o muy específico. Usa palabras clave específicas de estilos cinematográficos, como película de terror, cine negro o estilos de animación como dibujos animados.
  5. Movimiento de la cámara: opcional. Indica qué hace la cámara, como una vista aérea, una vista a la altura de los ojos, una toma desde arriba o una toma desde abajo.
  6. Composición: opcional. Cómo se encuadra la toma; por ejemplo, plano general, primer plano o primer plano extremo.
  7. Ambiente: opcional. Indica cómo contribuyen el color y la luz a la escena, como los tonos azules, la noche o los tonos cálidos.

Ejemplos de peticiones y resultados generados

En esta sección se muestran varias peticiones y cómo el nivel de detalle que se proporciona en cada una de ellas te permite acercarte a lo que quieres en tu vídeo.

Carámbanos

En este vídeo se muestra cómo puedes usar cada uno de los elementos de tu petición.

Petición Resultados generados
Primer plano (composición) de carámbanos derritiéndose (sujeto) en una pared de roca helada (contexto) con tonos azules fríos (ambiente), con zoom (movimiento de la cámara) que mantiene el detalle del primer plano de las gotas de agua (acción). Estalactitas goteando con un fondo azul.

Hombre al teléfono

En estos vídeos se muestra cómo puedes revisar tu petición con detalles más específicos sobre el vídeo que quieres que genere Veo.

Petición Resultados generados Análisis
La cámara se desplaza para mostrar un primer plano de un hombre desesperado con una gabardina verde que está haciendo una llamada en un teléfono de pared rotatorio clásico con una luz de neón verde. Es una escena de película. Un hombre habla por teléfono. Este es el primer vídeo generado a partir de la petición.
Un primer plano cinematográfico sigue a un hombre desesperado con una gabardina verde desgastada mientras marca un número en un teléfono rotatorio montado en una pared de ladrillo áspera, bañada por el brillo misterioso de un letrero de neón verde. La cámara se acerca y muestra la tensión de su mandíbula y la desesperación grabada en su rostro mientras intenta hacer la llamada. La poca profundidad de campo se centra en su ceño fruncido y en el teléfono de disco negro, mientras que el fondo se difumina en un mar de colores fluorescentes y sombras indistintas, lo que crea una sensación de urgencia y aislamiento. Hombre hablando por teléfono Cuanto más detallada sea la petición, más centrado será el vídeo y más rico será el entorno.
Un vídeo con movimiento fluido que se acerca a un hombre desesperado, vestido con una gabardina verde, usando un teléfono rotatorio antiguo contra una pared bañada por un inquietante resplandor de neón verde. La cámara empieza a una distancia media y se acerca lentamente a la cara del hombre, mostrando su expresión frenética y el sudor de su frente mientras marca el número de teléfono con urgencia. El foco está en las manos del hombre, cuyos dedos buscan el dial mientras intenta desesperadamente conectarse. La luz de neón verde proyecta largas sombras en la pared, lo que aumenta la tensión del ambiente. La escena se enmarca para enfatizar el aislamiento y la desesperación del hombre, destacando el marcado contraste entre el brillo vibrante del neón y la sombría determinación del hombre. Un hombre habla por teléfono. Al añadir más detalles, el sujeto tenía una expresión realista y se creó una escena intensa y vibrante.

Leopardo de las nieves

Esta petición muestra el resultado que podría generar Veo.

Petición Resultados generados
Una criatura adorable con pelaje de leopardo de las nieves camina por un bosque invernal. Renderizado con estilo de dibujos animados en 3D. El leopardo de las nieves está aletargado.

Leopardo de las nieves corriendo

Esta petición tiene más detalles y muestra un resultado generado que puede acercarse más a lo que quieres en tu vídeo.

Petición Resultados generados
Crea una escena corta de animación en 3D con un estilo de dibujos animados alegre. Una criatura adorable con pelaje de leopardo de las nieves, ojos grandes y expresivos, y una forma redondeada y amigable corretea felizmente por un bosque invernal caprichoso. La escena debe incluir árboles redondeados cubiertos de nieve, copos de nieve cayendo suavemente y luz cálida del sol filtrándose entre las ramas. Los movimientos ágiles y la amplia sonrisa de la criatura deben transmitir pura alegría. El objetivo es conseguir un tono alegre y emotivo con colores vivos y alegres, y animaciones divertidas. Puedes añadir efectos de sonido sutiles y caprichosos para potenciar el ambiente invernal alegre. El leopardo de las nieves corre más rápido.

Más consejos para escribir peticiones

Los siguientes consejos te ayudarán a escribir peticiones que generen tus vídeos:

  • Usa un lenguaje descriptivo: utiliza adjetivos y adverbios para que Veo se haga una idea clara.
  • Proporciona contexto: si es necesario, incluye información general para ayudar al modelo a entender lo que quieres.
  • Hacer referencia a estilos artísticos específicos: si tienes una estética concreta en mente, haz referencia a estilos o movimientos artísticos específicos.
  • Utiliza herramientas de ingeniería de peticiones: explora herramientas o recursos de ingeniería de peticiones que te ayuden a mejorar tus peticiones y conseguir resultados óptimos. Para obtener más información, consulta Introducción a las peticiones.
  • Mejora los detalles faciales de tus imágenes personales y de grupo: especifica los detalles faciales como foco de la foto. Por ejemplo, usa la palabra retrato en la petición.

Añadir más detalles a las peticiones

En estos ejemplos se muestra cómo perfeccionar tus peticiones para generar tus vídeos.

Descripción del asunto

En este ejemplo se muestra cómo especificar una descripción del asunto.

Descripción del asunto Petición Resultados generados
Esta descripción puede incluir un tema, varios temas y acciones, como "edificio de apartamentos de hormigón blanco". Renderización arquitectónica de un edificio de apartamentos de hormigón blanco con formas orgánicas fluidas, que se integra a la perfección con una exuberante vegetación y elementos futuristas Marcador de posición.

Contexto

En este ejemplo se muestra cómo especificar el contexto.

Contexto Petición Resultados generados
El fondo o el contexto en el que se colocará el sujeto es muy importante. Prueba a colocar al sujeto en diferentes fondos, como una calle concurrida o el espacio exterior. Un satélite flotando por el espacio exterior con la luna y algunas estrellas al fondo. Satélite flotando en la atmósfera.

Acción

En este ejemplo se muestra cómo especificar una acción.

Acción Petición Resultados generados
Qué está haciendo el sujeto (por ejemplo, caminar, correr o girar la cabeza). Imagen panorámica de una mujer caminando por la playa, con aspecto tranquilo y relajado, mirando hacia el horizonte al atardecer. La puesta de sol es preciosa.

Estilo

En este ejemplo se muestra cómo especificar el estilo.

Estilo Petición Resultados generados
Puedes añadir palabras clave para mejorar la calidad de la generación y orientarla hacia el estilo que quieras, como profundidad de campo reducida, fotograma de película, minimalista, surrealista, vintage, futurista o doble exposición. Estilo de cine negro, hombre y mujer caminando por la calle, misterio, cinematográfico, blanco y negro. El estilo del cine negro es absolutamente precioso.

Movimiento de la cámara

En este ejemplo se muestra cómo especificar el movimiento de la cámara.

Movimiento de la cámara Petición Resultados generados
Toma subjetiva, vista aérea, vista de dron de seguimiento, plano de seguimiento Toma subjetiva desde un coche antiguo que circula bajo la lluvia en Canadá por la noche, con un estilo cinematográfico. La puesta de sol es preciosa.

Composición

En este ejemplo se muestra cómo especificar la composición.

Composición Petición Resultados generados
Cómo se encuadra la toma (plano general, primer plano, plano desde abajo) Primer plano extremo de un ojo en el que se refleja una ciudad. La puesta de sol es preciosa.
Cómo se encuadra la toma (plano general, primer plano, plano desde abajo) Crea un vídeo con un plano general de un surfista caminando por una playa con una tabla de surf, un hermoso atardecer y un estilo cinematográfico. La puesta de sol es preciosa.

Ambiente

En este ejemplo se muestra cómo especificar el ambiente.

Ambiente Petición Resultados generados
Añadir colores ayudó a que la imagen tuviera un aspecto único y transmitiera las emociones deseadas: "tonos cálidos anaranjados apagados", "luz natural" y "amanecer o atardecer". Las paletas de colores desempeñan un papel fundamental en la fotografía, ya que influyen en el ambiente y el impacto emocional de una imagen, y hacen que el estilo de la imagen sea coherente. Por ejemplo, una paleta cálida y dorada puede dar un toque romántico y atmosférico a una fotografía. Ejemplos de paletas de colores: "tonos pastel azules y rosas", "iluminación ambiental tenue", "tonos fríos y apagados" Primer plano de una chica sosteniendo un adorable cachorro de golden retriever en el parque, con luz solar. Un cachorro en brazos de una niña.
Añadir colores ayudó a que la imagen tuviera un aspecto único y transmitiera las emociones deseadas: "tonos cálidos anaranjados apagados", "luz natural" y "amanecer o atardecer". Las paletas de colores desempeñan un papel fundamental en la fotografía, ya que influyen en el ambiente y el impacto emocional de una imagen, y hacen que el estilo de la imagen sea coherente. Por ejemplo, una paleta cálida y dorada puede dar un toque romántico y atmosférico a una fotografía. Ejemplos de paletas de colores: "tonos pastel azules y rosas", "iluminación ambiental tenue", "tonos fríos y apagados" Primer plano cinematográfico de una mujer triste viajando en autobús bajo la lluvia, con tonos azules fríos y un ambiente triste. Una mujer que va en un autobús y parece triste.

Audio

El audio es compatible con veo-3.0-generate-001 en la versión Preliminar.

Especifica claramente si quieres audio. Te recomendamos que uses frases independientes en tu petición para describir el audio. Estos son algunos ejemplos de audio descrito como parte de una petición:

  • Efectos de sonido:

    • En el audio se oye el chapoteo del agua de fondo.
    • Añade música suave de fondo.
  • Voz:

    • El hombre con el sombrero rojo dice: "¿Dónde está el conejo?" Entonces, la mujer del vestido verde que está a su lado responde: "Allí, en el bosque".

Usar imágenes de referencia para generar vídeos

Puedes dar vida a las imágenes con la función de conversión de imagen a vídeo de Veo y usar tus recursos o Imagen para generar algo nuevo.

Petición Resultados generados
Conejo con una barra de chocolate. Bunny está huyendo.
Bunny huye. Bunny está huyendo.

Cuando uses la función de convertir imágenes en vídeos, te recomendamos lo siguiente:

  • Asegúrate de que las acciones y las descripciones de voz se correspondan con cada elemento presente en la imagen de entrada.

  • Si hay varios sujetos en la imagen de entrada, especifica claramente qué personaje está realizando una acción o hablando. Para diferenciar entre varios caracteres de una imagen de entrada, usa los detalles descriptivos más distintivos que tengas. Por ejemplo:

    • El hombre del sombrero rojo.
    • La mujer del vestido azul.

Peticiones negativas

Las peticiones negativas pueden ser una herramienta muy útil para especificar qué elementos no deben aparecer en el vídeo. Describe lo que quieres evitar que genere el modelo describiendo lo que quieres que genere. Sigue estos consejos:

  • ❌ No utilices un lenguaje instructivo ni palabras como no o no hagas. Por ejemplo, "Sin paredes" o "No mostrar paredes".

  • ✅ Describe lo que no quieres ver. Por ejemplo, "pared, marco", lo que significa que no quieres que aparezca una pared ni un marco en el vídeo.

Petición Resultados generados
Genera una animación corta y estilizada de un roble grande y solitario con hojas que se mueven vigorosamente con un viento fuerte. El árbol debe tener una forma ligeramente exagerada y caprichosa, con ramas dinámicas y fluidas. Las hojas deben mostrar una variedad de colores otoñales, girando y bailando con el viento. La animación debe incluir una banda sonora suave y evocadora, y usar una paleta de colores cálida y acogedora. Árbol con palabras.
Genera una animación corta y estilizada de un roble grande y solitario con hojas que se mueven vigorosamente con un viento fuerte. El árbol debe tener una forma ligeramente exagerada y caprichosa, con ramas dinámicas y fluidas. Las hojas deben mostrar una variedad de colores otoñales, girando y bailando con el viento. La animación debe incluir una banda sonora suave y evocadora, y usar una paleta de colores cálida y acogedora.

Petición negativa: fondo urbano, estructuras artificiales, ambiente oscuro, tormentoso o amenazante.
Árbol sin palabras negativas.

Relaciones de aspecto

La generación de vídeo de Vertex AI Veo admite las dos relaciones de aspecto siguientes:

Relación de aspecto Descripción
Panorámico o 16:9 La relación de aspecto 16:9 es la más habitual en televisiones, monitores y pantallas de teléfonos móviles (en horizontal). Úsalo cuando quieras capturar más del fondo, como paisajes.
Vertical o 9:16

Pantalla panorámica girada. Esta relación de aspecto se ha popularizado gracias a las aplicaciones de vídeos cortos, como YouTube Shorts. Usa esta relación de aspecto para retratos u objetos altos con una orientación vertical marcada, como edificios, árboles o cascadas.

Panorámico: relación de aspecto de 16:9

Este es un ejemplo de petición de pantalla panorámica con una relación de aspecto de 16:9.

Petición Resultados generados
Crea un vídeo con una vista de dron de seguimiento de un hombre conduciendo un coche descapotable rojo en Palm Springs en los años 70. Hay luz cálida y sombras largas. La cascada es preciosa.

Vertical (relación de aspecto de 9:16)

Este es un ejemplo de petición de un retrato con una relación de aspecto de 9:16.

Petición Resultados generados
Crea un vídeo con un movimiento fluido de una majestuosa cascada hawaiana en una exuberante selva tropical. Céntrate en el flujo de agua realista, el follaje detallado y la iluminación natural para transmitir tranquilidad. Captura el agua que fluye, el ambiente brumoso y la luz del sol que se filtra entre la densa cubierta vegetal. Usa movimientos de cámara suaves y cinematográficos para mostrar la cascada y su entorno. El objetivo es conseguir un tono tranquilo y realista que transporte al espectador a la serena belleza de la selva tropical de Hawái. La cascada es preciosa.