Lyria adalah model dasar baru untuk pembuatan audio berkualitas tinggi, yang mampu membuat beragam lanskap suara dan potongan musik dari perintah teks. Lyria memungkinkan pengguna menghasilkan musik instrumental berkualitas tinggi dari perintah teks.
Untuk menjelajahi model ini di konsol, lihat kartu model Lyria di Model Garden (dapat diakses menggunakan tab Media Studio).
Mencoba Lyria di Vertex AI (Vertex AI Studio)
Model yang Didukung
Lyria API mendukung model berikut:
lyria-002
Permintaan HTTP
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION[-aiplatform.googleapis.com/v1/projects/](https://-aiplatform.googleapis.com/v1/projects/)PROJECT_ID/locations/LOCATION/publishers/google/models/lyria-002:predict \
-d '{
"instances": [
{
"prompt": "string",
"negative_prompt": "string", // Optional
"seed": 0 // Optional. Cannot be used with sample_count.
}
],
"parameters": {
"sample_count": 1 // Optional. Cannot be used with seed.
}
}'
Gunakan parameter berikut untuk model Lyria. Untuk mengetahui informasi selengkapnya, lihat detail kartu Lyria Model Garden.
Parameter | |
---|---|
(dalam objek |
Wajib. Deskripsi teks dalam bahasa Inggris Amerika Serikat (en-us) untuk audio yang akan dibuat. Contoh: "Lagu dance elektronik yang energik dengan tempo cepat". |
(dalam objek |
Opsional. Deskripsi tentang hal yang akan dikecualikan dari audio yang dihasilkan. Contoh: "vokal, tempo lambat" |
(dalam objek |
Opsional. Seed untuk pembuatan deterministik. Jika disediakan, model akan mencoba menghasilkan audio yang sama dengan perintah yang sama dan parameter lainnya.
Tidak dapat digunakan dengan Contoh: |
(dalam objek |
Opsional. Jumlah sampel audio yang akan dibuat. Default-nya adalah 1 jika tidak ditentukan dan seed tidak digunakan.
Tidak dapat digunakan dengan Contoh: |
Permintaan sampel
Gunakan permintaan berikut untuk membuat musik instrumental dari perintah teks:
Permintaan pembuatan teks menjadi musik
curl
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/lyria-002:predict \ -d '{ "instances": [ { "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.", "negative_prompt": "drums, electric guitar", "seed": 98765 } ], "parameters": {} }'
JSON
Contoh ini menggunakan seed
untuk output yang dapat direproduksi.
{ "instances": [ { "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.", "negative_prompt": "drums, electric guitar", "seed": 98765 } ], "parameters": {} }
JSON dengan sample_count
Contoh ini menggunakan sample_count
untuk membuat beberapa sampel.
Untuk menguji perintah teks menggunakan Lyria API, kirim permintaan POST ke
endpoint model penayang. Contoh berikut menghilangkan seed
dari objek instances
dan menggunakan sample_count
dalam objek parameters
untuk menghasilkan beberapa sampel.
{ "instances": [ { "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.", "negative_prompt": "drums, electric guitar" } ], "parameters": { "sample_count": 2 } }
Isi respons
Permintaan yang berhasil akan menampilkan objek JSON yang berisi data audio yang dihasilkan. Setiap klip audio yang dihasilkan berdurasi 30 detik dan disediakan sebagai file audio WAV dengan frekuensi sampel 48 kHz.
{
"predictions": [
{
"audioContent": "BASE64_ENCODED_WAV_STRING_SAMPLE_1",
"mimeType": "audio/wav"
}
// Additional audio samples will be listed here if sample_count > 1
// e.g.,
//{"audioContent": "BASE64_ENCODED_WAV_STRING_SAMPLE_2",
// "mimeType": "audio/wav"
//}
],
"deployedModelId": "xxxxxxxxxxxxxxx", // Actual ID may vary based on deployment
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/lyria-002",
"modelDisplayName": "Lyria 2"
}
Elemen respons | |
---|---|
predictions |
Array sampel audio yang dihasilkan. Setiap objek dalam array mewakili satu klip audio. |
predictions[].audioContent |
String berenkode base64 dari data audio WAV yang dihasilkan. |
predictions[].mimeType |
Jenis MIME data audio. Untuk Lyria, ini adalah |
deployedModelId |
ID model yang di-deploy yang memproses permintaan (jika berlaku untuk jenis endpoint). |
model |
Nama resource lengkap model yang memproses permintaan. |
modelDisplayName |
Nama tampilan model. |
Praktik terbaik dan batasan
Lihat Kartu Model Lyria untuk mengetahui praktik terbaik mendetail tentang perintah, dukungan bahasa (khusus bahasa Inggris Amerika Serikat untuk perintah), waktu pembuatan, format output (WAV, 48 kHz, klip instrumental 30 detik), tindakan keamanan, dan informasi deployment.
Poin utama:
- Perintah Mendetail: Umumnya menghasilkan audio yang lebih baik.
- Tentukan: Genre, mood, instrumentasi, tempo.
- Perintah Negatif: Gunakan
negative_prompt
untuk mengecualikan elemen. - Output: Klip audio WAV berdurasi 30 detik, 48 kHz, hanya instrumental.
- Keamanan: Filter keamanan konten, pemeriksaan pembacaan, pemeriksaan intent artis, dan pemberian watermark SynthID diterapkan.
Harga
Harga penggunaan Lyria 2 adalah $0,06 per 30 detik musik output yang dihasilkan. Untuk mengetahui detail selengkapnya, lihat Harga Vertex AI.
Informasi selengkapnya
- Pelajari AI Generatif di Vertex AI lebih lanjut.
- Untuk ringkasan Lyria, lihat kartu modelnya yang tersedia di Model Garden (Media Studio).
Langkah berikutnya
- Coba Lyria di Vertex AI Studio.
- Tinjau Persyaratan Layanan Google Cloud.
- Baca Persyaratan Tambahan untuk Produk AI Generatif.