En esta guía, se proporcionan ejemplos de los tipos de paisajes sonoros musicales y de audio que puedes crear con Lyria y se muestra cómo modificar partes específicas de una instrucción para producir resultados diferentes.
Descripción general de la guía de instrucciones
Lyria es un modelo de base para la generación de audio de alta calidad, capaz de crear diversos paisajes sonoros y piezas musicales a partir de instrucciones de texto. Para usar Lyria, debes proporcionar una instrucción, que es una descripción de texto de lo que deseas que genere tu modelo de IA generativa. Lyria produce música instrumental.
Filtros de seguridad
Lyria aplica filtros de seguridad en Vertex AI para ayudar a garantizar que el audio generado no contenga contenido ofensivo ni incumpla los lineamientos de uso. Por ejemplo, se bloquean las instrucciones que incumplen los lineamientos de IA responsable. Lyria también incluye verificaciones de recitación y de intención del artista.
Si sospechas que se está abusando de Lyria o que algún resultado generado contiene material inapropiado o información imprecisa, usa el formulario para denunciar sospechas de abuso en Google Cloud.
Conceptos básicos para escribir instrucciones
Las buenas instrucciones son descriptivas y claras. Para que la música generada se acerque más a lo que deseas, comienza por identificar tu idea musical principal y, luego, agrega palabras clave y modificadores para definirla mejor.
Debes tener en cuenta los siguientes elementos para tu instrucción:
- Género y estilo: La categoría musical principal (p.ej., electrónica dance, clásica, jazz, ambiental) y las características estilísticas (p.ej., 8 bits, cinématica, baja fidelidad).
- Estado de ánimo y emoción: El sentimiento deseado que debe evocar la música (p.ej., enérgico, melancólico, tranquilo, tenso).
- Instrumentación: Son los instrumentos clave que quieres escuchar (p.ej., piano, sintetizador, guitarra acústica, orquesta de cuerdas, batería electrónica).
- Tempo y ritmo: El ritmo (p.ej., tempo rápido, balada lenta, 120 BPM) y el carácter rítmico (p.ej., ritmo potente, ritmo sincopado, vals suave).
- Arreglo o estructura: Indica cómo avanza o se superpone la música (p.ej., comienza con un piano en solitario y, luego, entran las cuerdas, crece hasta un estribillo potente).
- Sonido ambiental/ambiente: Sonido de fondo o entorno sonoro general (p.ej., lluvia, vida nocturna de la ciudad, reverberación espaciosa, sensación de estar bajo el agua).
- Calidad de producción: Es el estilo de grabación o la fidelidad de audio deseados (p.ej., producción de alta calidad, mezcla clara, grabación vintage, sensación de demo sin procesar).
Ejemplos de instrucciones y resultados generados
En esta sección, se presentan instrucciones y cómo el nivel de detalle puede afectar la música.
Pista electrónica enérgica
En este ejemplo, se muestra el uso de varios elementos en la instrucción.
Instrucción | Resultados generados |
---|---|
Una pista de baile electrónica (género) enérgica (estado de ánimo) con un tempo rápido (tempo) y un ritmo potente (ritmo), con sintetizadores (instrumentación) y baterías electrónicas (instrumentación) destacados. Producción de alta calidad (calidad de producción) |
Descripción: Una pista instrumental de 30 segundos con un sonido electrónico claro y contundente, un ritmo alegre y un enfoque en las melodías de sintetizador y una fuerte presencia de batería. |
Evolución del paisaje sonoro ambiental
En estos ejemplos, se muestra cómo revisar la instrucción para obtener resultados más específicos.
Instrucción | Resultados generados | Análisis |
---|---|---|
Música ambiental con sintetizadores |
Descripción: Una pieza ambiental básica que usa principalmente pads de sintetizador. El estado de ánimo y la estructura son muy generales. |
Este es el primer audio generado basado en una instrucción mínima. |
Un paisaje sonoro ambiental (género/estilo) tranquilo y onírico (estado de ánimo) con sintetizadores en capas (instrumentación) y pads suaves y en evolución (instrumentación/arreglos). Tempo lento con reverberación espaciosa (ambiente/producción). Comienza con una melodía de sintetizador simple y, luego, agrega capas de pads atmosféricos (arreglos). |
Descripción: Una pista ambiental más desarrollada. El audio evoca un estado pacífico y onírico con capas de sintetizador claras que se desarrollan lentamente. La reverberación espaciosa mejora la calidad atmosférica. |
Una instrucción más detallada genera música más enfocada, con un entorno sonoro más rico y una progresión clara. |
Más sugerencias para escribir instrucciones
Las siguientes sugerencias te ayudarán a escribir instrucciones eficaces para Lyria:
- Usa descripciones y palabras específicas: Usa adjetivos y adverbios para pintar una imagen sonora clara. Cuantos más detalles proporciones, mejor podrá interpretar tu intención.
- Generos, estados de ánimo y estilos de referencia: Indica claramente la categoría musical, el sentimiento deseado y cualquier característica estilística.
- Especifica los instrumentos y ritmos clave: Menciona los instrumentos importantes y describe el ritmo y la sensación rítmica deseados.
- Itera y experimenta: Si el primer resultado no es perfecto, modifica la instrucción agregando, quitando o cambiando palabras clave. Consulta Introducción a las instrucciones para obtener estrategias generales.
Agrega más detalles a las instrucciones
En estos ejemplos, se muestra cómo definir mejor las instrucciones enfocándose en elementos musicales específicos.
Género y estilo
Enfoque de elementos | Instrucción | Resultados generados |
---|---|---|
Género y estilo | Una pieza orquestal cinematográfica con un estilo heroico y de aventura fantástica, con una melodía grandiosa y envolvente. |
Descripción: Espera una pista orquestal de sonido completo con aumentos dramáticos y un tema fuerte y memorable que recuerda a una banda sonora de película. |
Estado de ánimo y instrumentación
Enfoque de elementos | Instrucción | Resultados generados |
---|---|---|
Estado de ánimo y habilitación | Una pieza de guitarra acústica pacífica y serena, con un estilo de púas, perfecta para la meditación. |
Descripción: Una pista instrumental suave y relajante con una guitarra acústica en solitario que toca una melodía simple y calmante. |
Tempo y ritmo
Enfoque de elementos | Instrucción | Resultados generados |
---|---|---|
Tempo y ritmo | Una música de fondo tensa y llena de suspenso con un tempo muy lento y un ritmo irregular y disperso. Usa principalmente cuerdas graves y percusión sutil. |
Descripción: Una pieza atmosférica diseñada para crear tensión, que se caracteriza por su ritmo lento, elementos rítmicos inquietantes y texturas oscuras de cuerdas. |
Mensajes negativos
Las instrucciones negativas ayudan a especificar los elementos que se excluirán de la música. Describe lo que quieres evitar que genere el modelo.
- El parámetro de la API es
negative_prompt
. - Lista de elementos que se excluirán, p.ej.,
negative_prompt: "vocals, excessive cymbal crashes, distorted guitar"
Situación de la instrucción | Resultados generados |
---|---|
Instrucción: “Una pieza de piano tranquila y relajante para estudiar”. (Sin instrucción negativa) |
Descripción: La pieza para piano suele ser tranquila, pero puede incluir algunas dinámicas más fuertes inesperadas o ejecuciones complejas que podrían distraer durante el estudio. |
Instrucción: “Una pieza de piano tranquila y relajante para estudiar”. Consigna negativa: “melodías complejas, dinámicas fuertes, cambios repentinos, batería y voces” |
Descripción: La pieza de piano resultante es siempre tranquila y simple, y evita los elementos distractores. El tono es más uniforme y adecuado para el enfoque de fondo. |