Guía de instrucciones para la generación de videos con Vertex AI

En esta guía, se proporcionan ejemplos de los tipos de videos que puedes crear con Veo y se muestra cómo modificar partes específicas de una instrucción para obtener diferentes resultados.

Descripción general de la guía de instrucciones

Vertex AI Veo es un modelo de generación de texto a video y de imagen a video.Para usar Veo, debes proporcionar una instrucción, que es una descripción de texto de lo que deseas que genere tu modelo de IA generativa.

Filtros de seguridad

Veo aplica filtros de seguridad en Vertex AI para ayudar a garantizar que los videos generados y las fotos subidas no contengan contenido ofensivo. Por ejemplo, se bloquean las instrucciones que incumplen los lineamientos de IA responsable.

Si sospechas que se está haciendo un abuso de Veo o que algún resultado generado contiene material inapropiado o información imprecisa, usa el formulario para denunciar sospechas de abuso enGoogle Cloud.

Conceptos básicos para escribir instrucciones

Las buenas instrucciones son descriptivas y claras. Para que el video generado se acerque más a lo que deseas, comienza por identificar tu idea principal y, luego, agrega palabras clave y modificadores para definirla mejor.

Debes incluir los siguientes elementos en tu instrucción:

  1. Asunto: Es el objeto, la persona, el animal o el paisaje que quieres en tu video.
  2. Contexto: Es el fondo o el contexto en el que se coloca el sujeto.
  3. Acción: Qué está haciendo el sujeto (por ejemplo, caminar, correr o girar la cabeza).
  4. Estilo: Puede ser general o muy específico. Considera usar palabras clave específicas de estilo de película, como película de terror, film noir o estilos animados, como la renderización de estilo dibujos animados.
  5. Movimiento de la cámara: Opcional: Indica lo que está haciendo la cámara, como vista aérea, a nivel de los ojos, vista desde arriba o en ángulo bajo.
  6. Composición: Opcional: Indica cómo se encuadra la toma, como un plano general, un primer plano o un primer plano extremo.
  7. Ambiente: Opcional: Indica cómo el color y la luz contribuyen a la escena, como tonos azules, nocturnos o cálidos.

Ejemplos de instrucciones y resultados generados

En esta sección, se presentan varias propuestas y cómo el nivel de detalle que se proporciona en cada una de ellas te permite acercarte más a lo que quieres en tu video.

Hielos

En este video, se muestra cómo puedes usar cada uno de los elementos de la instrucción.

Instrucción Resultado generado
Primer plano (composición) de témpanos de hielo derretidos (sujeto) en una pared de roca congelada (contexto) con tonos azules fríos (ambiente), con zoom (movimiento de la cámara) manteniendo los detalles en primer plano de las gotas de agua (acción). Estalactitas que gotean con un fondo azul.

Hombre hablando por teléfono

En estos videos, se muestra cómo puedes revisar tu instrucción con detalles más específicos sobre el video que quieres que genere Veo.

Instrucción Resultado generado Análisis
La cámara se mueve para mostrar un primer plano de un hombre desesperado con un trench coat verde que está haciendo una llamada en un teléfono de pared de estilo rotativo con una luz de neón verde y una escena de película. Hombre hablando por teléfono. Este es el primer video generado en función de la instrucción.
Un primer plano cinematográfico sigue a un hombre desesperado con una gabardina verde desgastada mientras marca un teléfono rotativo montado en una pared de ladrillos arenosos, bañado en el brillo fantasmagórico de un letrero de neón verde. La cámara se acerca, revelando la tensión en su mandíbula y la desesperación grabada en su rostro mientras se esfuerza por hacer la llamada. La profundidad de campo baja se enfoca en su frente fruncido y el teléfono rotativo negro, y desenfoca el fondo en un mar de colores neón y sombras indistintas, lo que crea una sensación de urgencia y aislamiento. Hombre hablando por teléfono Una instrucción más detallada genera un video más enfocado con un entorno más rico.
Un video con un movimiento suave que se acerca a un hombre desesperado con un abrigo verde, que usa un teléfono rotativo vintage contra una pared bañada en un extraño brillo verde neón. La cámara comienza a una distancia media y se acerca lentamente al rostro del hombre, revelando su expresión frenética y el sudor en su frente mientras marca el teléfono con urgencia. El enfoque está en las manos del hombre, sus dedos que torpemente manipulan el dial mientras intenta conectarse desesperadamente. La luz verde de neón proyecta sombras largas en la pared, lo que aumenta la atmósfera tensa. La escena está enmarcada para enfatizar el aislamiento y la desesperación del hombre, y destacar el marcado contraste entre el brillo vibrante del neón y la determinación sombría del hombre. Hombre hablando por teléfono. Agregar más detalles le dio al sujeto una expresión realista y creó una escena intensa y vibrante.

Leopardo de las nieves

Esta instrucción demuestra el resultado que podría generar Veo.

Instrucción Resultado generado
Una criatura linda con pelaje similar al de un leopardo de las nieves camina en un bosque invernal, renderización en 3D de estilo de dibujos animados. El leopardo de las nieves está letárgico.

Leopardo de las nieves corriendo

Esta instrucción tiene más detalles y muestra un resultado generado que podría ser más cercano a lo que quieres en tu video.

Instrucción Resultado generado
Crea una breve escena animada en 3D con un estilo de dibujos animados alegre. Una criatura linda con pelaje similar al de un leopardo de las nieves, ojos grandes y expresivos, y una forma amigable y redondeada que corre feliz por un bosque invernal fantástico. La escena debe incluir árboles redondeados cubiertos de nieve, copos de nieve que caen suavemente y luz solar cálida que se filtra a través de las ramas. Los movimientos ágiles y la gran sonrisa de la criatura deben transmitir puro deleite. Intenta crear un tono alegre y cálido con colores brillantes y alegres, y una animación divertida. Considera agregar efectos de sonido sutiles y caprichosos para mejorar el ambiente alegre del invierno. Snow Leopard se ejecuta más rápido.

Más sugerencias para escribir instrucciones

Las siguientes sugerencias te ayudarán a escribir indicaciones que generen tus videos:

  • Usa lenguaje descriptivo: Usa adjetivos y adverbios para pintar un cuadro claro para Veo.
  • Proporciona contexto: Si es necesario, incluye información contextual para ayudar al modelo a comprender lo que deseas.
  • Consulta estilos artísticos específicos: Si tienes en mente una estética en particular, consulta estilos artísticos o movimientos artísticos específicos.
  • Usa herramientas de ingeniería de instrucciones: Considera explorar herramientas o recursos de ingeniería de instrucciones para ayudarte a definir mejor tus instrucciones y lograr resultados óptimos. Para obtener más información, consulta Introducción a las instrucciones.
  • Mejora los detalles faciales en tus imágenes personales y grupales: Especifica los detalles faciales como un enfoque de la foto, como usar la palabra retrato en la instrucción.

Agrega más detalles a las instrucciones

En estos ejemplos, se muestra cómo definir mejor tus instrucciones para generar tus videos.

Descripción del asunto

En este ejemplo, se muestra cómo especificar una descripción del asunto.

Descripción del asunto Instrucción Resultado generado
Esta descripción puede incluir un sujeto, varios sujetos y acciones, como "edificio de departamentos de hormigón blanco". Renderización arquitectónica de un edificio de departamentos de hormigón blanco con formas orgánicas fluidas que se combinan a la perfección con elementos futuristas y una exuberante vegetación Marcador de posición.

Contexto

En este ejemplo, se muestra cómo especificar el contexto.

Contexto Instrucción Resultado generado
El fondo o el contexto en el que se colocará el sujeto es muy importante. Intenta ubicar al sujeto en diferentes fondos, como en una calle concurrida o en el espacio exterior. Un satélite flotando en el espacio exterior con la luna y algunas estrellas en el fondo. Satélite flotando en la atmósfera.

Acción

En este ejemplo, se muestra cómo especificar la acción.

Acción Instrucción Resultado generado
Qué está haciendo el sujeto, como caminar, correr o girar la cabeza Un plano general de una mujer que camina por la playa, con aspecto relajado y mirando hacia el horizonte al atardecer. El atardecer es absolutamente hermoso.

Estilo

En este ejemplo, se muestra cómo especificar el estilo.

Estilo Instrucción Resultado generado
Puedes agregar palabras clave para mejorar la calidad de la generación y acercarla al estilo deseado, como poca profundidad de campo, foto fija de película, minimalista, surrealista, vintage, futurista, doble exposición. Estilo de cine negro, un hombre y una mujer caminan por la calle, misterio, cinemático, en blanco y negro. El estilo de cine negro es absolutamente hermoso.

Movimiento de la cámara

En este ejemplo, se muestra cómo especificar el movimiento de la cámara.

Movimiento de la cámara Instrucción Resultado generado
Toma en POV, vista aérea, vista de seguimiento con dron, toma de seguimiento Una toma en POV desde un auto clásico que conduce bajo la lluvia, en Canadá, por la noche, cinematográfica. El atardecer es absolutamente hermoso.

Composición

En este ejemplo, se muestra cómo especificar la composición.

Composición Instrucción Resultado generado
La forma en que se encuadra la toma (toma general, primer plano, ángulo bajo) Primer plano extremo de un ojo con la ciudad reflejada en él. El atardecer es absolutamente hermoso.
La forma en que se encuadra la toma (toma general, primer plano, ángulo bajo) Crea un video de un plano general de un surfista caminando por una playa con una tabla de surf, un hermoso atardecer, cinemático. El atardecer es absolutamente hermoso.

Atmósfera

En este ejemplo, se muestra cómo especificar el ambiente.

Ambiente Instrucción Resultado generado
Agregar colores ayudó a que la imagen se vea única y transmita las emociones deseadas: “tonos cálidos anaranjados apagados”, “luz natural”, “amanecer o atardecer”. Las paletas de colores desempeñan un papel fundamental en la fotografía, ya que influyen en el estado de ánimo y el impacto emocional de una imagen, y hacen que el estilo de la imagen sea coherente. Por ejemplo, una paleta cálida y dorada puede infundir un ambiente romántico y atmosférico en una fotografía. Ejemplo de paletas de colores: “tonos pastel de azul y rosa”, “iluminación ambiental tenue”, “tonos apagados y fríos” Primer plano de una niña que sostiene un adorable cachorro de golden retriever en el parque, luz del sol. Un cachorro en los brazos de una niña.
Agregar colores ayudó a que la imagen se vea única y transmita las emociones deseadas: “tonos cálidos anaranjados apagados”, “luz natural”, “amanecer o atardecer”. Las paletas de colores desempeñan un papel fundamental en la fotografía, ya que influyen en el estado de ánimo y el impacto emocional de una imagen, y hacen que el estilo de la imagen sea coherente. Por ejemplo, una paleta cálida y dorada puede infundir un ambiente romántico y atmosférico en una fotografía. Ejemplo de paletas de colores: “tonos pastel de azul y rosa”, “iluminación ambiental tenue”, “tonos apagados y fríos” Primer plano cinematográfico de una mujer triste que viaja en un autobús bajo la lluvia, tonos azules fríos, estado de ánimo triste. Una mujer que viaja en un autobús y se siente triste.

Usa imágenes de referencia para generar videos

Puedes dar vida a las imágenes con la función de imagen a video que tiene Veo y usar tus recursos existentes o Imagen para generar contenido nuevo.

Instrucción Resultado generado
Conejo con una barra de chocolate. Bunny se está escapando.
El conejito sale corriendo. Bunny se está escapando.

Mensajes negativos

Las instrucciones negativas pueden ser una herramienta potente que ayuda a especificar qué elementos no incluir en el video. Describe lo que quieres evitar que genere el modelo. Para ello, describe lo que quieres que genere. Sigue estas sugerencias:

  • ❌ No uses lenguaje instructivo ni palabras como no o no hagas. Por ejemplo, “No walls” o “don't show walls”.

  • ✅ Describe lo que no quieres ver. Por ejemplo, “muro, marco”, lo que significa que no quieres que haya un muro ni un marco en el video.

Instrucción Resultado generado
Genera una animación corta y estilizada de un roble grande y solitario con hojas que se agitan con fuerza en un viento fuerte. El árbol debe tener una forma ligeramente exagerada y caprichosa, con ramas dinámicas y fluidas. Las hojas deben mostrar una variedad de colores otoñales que se muevan y bailen con el viento. La animación debe incluir una banda sonora suave y atmosférica, y usar una paleta de colores cálida y atractiva. Árbol con palabras.
Genera una animación corta y estilizada de un roble grande y solitario con hojas que se agitan con fuerza en un viento fuerte. El árbol debe tener una forma ligeramente exagerada y caprichosa, con ramas dinámicas y fluidas. Las hojas deben mostrar una variedad de colores otoñales que se muevan y bailen con el viento. La animación debe incluir una banda sonora suave y atmosférica, y usar una paleta de colores cálida y atractiva.

Con una instrucción negativa: fondo urbano, estructuras hechas por el hombre, atmósfera oscura, tormentosa o amenazante.
Árbol sin palabras negativas.

Relaciones de aspecto

La generación de videos de Veo de Vertex AI admite las siguientes dos relaciones de aspecto:

Relación de aspecto Descripción
Pantalla ancha o 16:9 Reemplazó a 4:3 y es la relación de aspecto más común para televisiones, monitores y pantallas de teléfonos celulares (horizontal). Úsala cuando quieras capturar más del fondo, como paisajes panorámicos.
Vertical o 9:16 Pantalla ancha, pero rotada. Esta es una relación de aspecto relativamente nueva que se popularizó en las aplicaciones de video de formato corto, como YouTube Shorts. Úsala para retratos o objetos altos con orientaciones verticales sólidas, como edificios, árboles, cascadas o edificios.

Pantalla ancha: Relación de aspecto de 16:9

Este es un ejemplo rápido de la pantalla ancha con una relación de aspecto de 16:9.

Instrucción Resultado generado
Crea un video con una vista de seguimiento de un dron de un hombre que conduce un auto convertible rojo en Palm Springs, en la década de 1970, con luz solar cálida y sombras largas. La cascada es absolutamente hermosa.

Vertical: Relación de aspecto de 9:16

Este es un ejemplo de una imagen vertical con una relación de aspecto de 9:16.

Instrucción Resultado generado
Crea un video con un movimiento fluido de una majestuosa cascada hawaiana en una exuberante selva tropical. Enfócate en un flujo de agua realista, follaje detallado y una iluminación natural para transmitir tranquilidad. Captura el agua que corre, la atmósfera brumosa y la luz del sol que se filtra a través del denso follaje. Usa movimientos de cámara suaves y cinematográficos para mostrar la cascada y su entorno. Intenta lograr un tono pacífico y realista que transporte al público a la belleza serena de la selva tropical de Hawái. La cascada es absolutamente hermosa.