Guía de instrucciones para la generación de música con Lyria

En esta guía, se proporcionan ejemplos de los tipos de paisajes sonoros musicales y de audio que puedes crear con Lyria y se muestra cómo modificar partes específicas de una instrucción para producir resultados diferentes.

Descripción general de la guía de instrucciones

Lyria es un modelo de base para la generación de audio de alta calidad, capaz de crear diversos paisajes sonoros y piezas musicales a partir de instrucciones de texto. Para usar Lyria, debes proporcionar una instrucción, que es una descripción de texto de lo que deseas que genere tu modelo de IA generativa. Lyria produce música instrumental.

Filtros de seguridad

Lyria aplica filtros de seguridad en Vertex AI para ayudar a garantizar que el audio generado no contenga contenido ofensivo ni incumpla los lineamientos de uso. Por ejemplo, se bloquean las instrucciones que incumplen los lineamientos de IA responsable. Lyria también incluye verificaciones de recitación y de intención del artista.

Si sospechas que se está abusando de Lyria o que algún resultado generado contiene material inapropiado o información imprecisa, usa el formulario para denunciar sospechas de abuso en Google Cloud.

Conceptos básicos para escribir instrucciones

Las buenas instrucciones son descriptivas y claras. Para que la música generada se acerque más a lo que deseas, comienza por identificar tu idea musical principal y, luego, agrega palabras clave y modificadores para definirla mejor.

Debes tener en cuenta los siguientes elementos para tu instrucción:

  1. Género y estilo: La categoría musical principal (p.ej., electrónica dance, clásica, jazz, ambiental) y las características estilísticas (p.ej., 8 bits, cinématica, baja fidelidad).
  2. Estado de ánimo y emoción: El sentimiento deseado que debe evocar la música (p.ej., enérgico, melancólico, tranquilo, tenso).
  3. Instrumentación: Son los instrumentos clave que quieres escuchar (p.ej., piano, sintetizador, guitarra acústica, orquesta de cuerdas, batería electrónica).
  4. Tempo y ritmo: El ritmo (p.ej., tempo rápido, balada lenta, 120 BPM) y el carácter rítmico (p.ej., ritmo potente, ritmo sincopado, vals suave).
  5. Arreglo o estructura: Indica cómo avanza o se superpone la música (p.ej., comienza con un piano en solitario y, luego, entran las cuerdas, crece hasta un estribillo potente).
  6. Sonido ambiental/ambiente: Sonido de fondo o entorno sonoro general (p.ej., lluvia, vida nocturna de la ciudad, reverberación espaciosa, sensación de estar bajo el agua).
  7. Calidad de producción: Es el estilo de grabación o la fidelidad de audio deseados (p.ej., producción de alta calidad, mezcla clara, grabación vintage, sensación de demo sin procesar).

Ejemplos de instrucciones y resultados generados

En esta sección, se presentan instrucciones y cómo el nivel de detalle puede afectar la música.

Pista electrónica enérgica

En este ejemplo, se muestra el uso de varios elementos en la instrucción.

Instrucción Resultados generados
Una pista de baile electrónica (género) enérgica (estado de ánimo) con un tempo rápido (tempo) y un ritmo potente (ritmo), con sintetizadores (instrumentación) y baterías electrónicas (instrumentación) destacados. Producción de alta calidad (calidad de producción)

Descripción: Una pista instrumental de 30 segundos con un sonido electrónico claro y contundente, un ritmo alegre y un enfoque en las melodías de sintetizador y una fuerte presencia de batería.

Evolución del paisaje sonoro ambiental

En estos ejemplos, se muestra cómo revisar la instrucción para obtener resultados más específicos.

Instrucción Resultados generados Análisis
Música ambiental con sintetizadores

Descripción: Una pieza ambiental básica que usa principalmente pads de sintetizador. El estado de ánimo y la estructura son muy generales.

Este es el primer audio generado basado en una instrucción mínima.
Un paisaje sonoro ambiental (género/estilo) tranquilo y onírico (estado de ánimo) con sintetizadores en capas (instrumentación) y pads suaves y en evolución (instrumentación/arreglos). Tempo lento con reverberación espaciosa (ambiente/producción). Comienza con una melodía de sintetizador simple y, luego, agrega capas de pads atmosféricos (arreglos).

Descripción: Una pista ambiental más desarrollada. El audio evoca un estado pacífico y onírico con capas de sintetizador claras que se desarrollan lentamente. La reverberación espaciosa mejora la calidad atmosférica.

Una instrucción más detallada genera música más enfocada, con un entorno sonoro más rico y una progresión clara.

Más sugerencias para escribir instrucciones

Las siguientes sugerencias te ayudarán a escribir instrucciones eficaces para Lyria:

  • Usa descripciones y palabras específicas: Usa adjetivos y adverbios para pintar una imagen sonora clara. Cuantos más detalles proporciones, mejor podrá interpretar tu intención.
  • Generos, estados de ánimo y estilos de referencia: Indica claramente la categoría musical, el sentimiento deseado y cualquier característica estilística.
  • Especifica los instrumentos y ritmos clave: Menciona los instrumentos importantes y describe el ritmo y la sensación rítmica deseados.
  • Itera y experimenta: Si el primer resultado no es perfecto, modifica la instrucción agregando, quitando o cambiando palabras clave. Consulta Introducción a las instrucciones para obtener estrategias generales.

Agrega más detalles a las instrucciones

En estos ejemplos, se muestra cómo definir mejor las instrucciones enfocándose en elementos musicales específicos.

Género y estilo

Enfoque de elementos Instrucción Resultados generados
Género y estilo Una pieza orquestal cinematográfica con un estilo heroico y de aventura fantástica, con una melodía grandiosa y envolvente.

Descripción: Espera una pista orquestal de sonido completo con aumentos dramáticos y un tema fuerte y memorable que recuerda a una banda sonora de película.

Estado de ánimo y instrumentación

Enfoque de elementos Instrucción Resultados generados
Estado de ánimo y habilitación Una pieza de guitarra acústica pacífica y serena, con un estilo de púas, perfecta para la meditación.

Descripción: Una pista instrumental suave y relajante con una guitarra acústica en solitario que toca una melodía simple y calmante.

Tempo y ritmo

Enfoque de elementos Instrucción Resultados generados
Tempo y ritmo Una música de fondo tensa y llena de suspenso con un tempo muy lento y un ritmo irregular y disperso. Usa principalmente cuerdas graves y percusión sutil.

Descripción: Una pieza atmosférica diseñada para crear tensión, que se caracteriza por su ritmo lento, elementos rítmicos inquietantes y texturas oscuras de cuerdas.

Mensajes negativos

Las instrucciones negativas ayudan a especificar los elementos que se excluirán de la música. Describe lo que quieres evitar que genere el modelo.

  • El parámetro de la API es negative_prompt.
  • Lista de elementos que se excluirán, p.ej., negative_prompt: "vocals, excessive cymbal crashes, distorted guitar"
Situación de la instrucción Resultados generados
Instrucción: “Una pieza de piano tranquila y relajante para estudiar”.

(Sin instrucción negativa)

Descripción: La pieza para piano suele ser tranquila, pero puede incluir algunas dinámicas más fuertes inesperadas o ejecuciones complejas que podrían distraer durante el estudio.

Instrucción: “Una pieza de piano tranquila y relajante para estudiar”.
Consigna negativa: “melodías complejas, dinámicas fuertes, cambios repentinos, batería y voces”

Descripción: La pieza de piano resultante es siempre tranquila y simple, y evita los elementos distractores. El tono es más uniforme y adecuado para el enfoque de fondo.