Lyria API

Lyria adalah model dasar baru untuk pembuatan audio berkualitas tinggi, yang mampu membuat beragam lanskap suara dan potongan musik dari perintah teks. Lyria memungkinkan pengguna menghasilkan musik instrumental berkualitas tinggi dari perintah teks.

Untuk menjelajahi model ini di konsol, lihat kartu model Lyria di Model Garden (dapat diakses menggunakan tab Media Studio).

Mencoba Lyria di Vertex AI (Vertex AI Studio)

Mencoba Lyria di Colab

Model yang Didukung

Lyria API mendukung model berikut:

  • lyria-002

Permintaan HTTP

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  https://LOCATION[-aiplatform.googleapis.com/v1/projects/](https://-aiplatform.googleapis.com/v1/projects/)PROJECT_ID/locations/LOCATION/publishers/google/models/lyria-002:predict \
  -d '{
    "instances": [
      {
        "prompt": "string",
        "negative_prompt": "string", // Optional
        "seed": 0 // Optional. Cannot be used with sample_count.
      }
    ],
    "parameters": {
      "sample_count": 1 // Optional. Cannot be used with seed.
    }
  }'

Gunakan parameter berikut untuk model Lyria. Untuk mengetahui informasi selengkapnya, lihat detail kartu Lyria Model Garden.

Parameter

prompt

(dalam objek instances)

string

Wajib. Deskripsi teks dalam bahasa Inggris Amerika Serikat (en-us) untuk audio yang akan dibuat.

Contoh: "Lagu dance elektronik yang energik dengan tempo cepat".

negative_prompt

(dalam objek instances)

string

Opsional. Deskripsi tentang hal yang akan dikecualikan dari audio yang dihasilkan.

Contoh: "vokal, tempo lambat"

seed

(dalam objek instances)

integer

Opsional. Seed untuk pembuatan deterministik. Jika disediakan, model akan mencoba menghasilkan audio yang sama dengan perintah yang sama dan parameter lainnya.

Tidak dapat digunakan dengan sample_count dalam permintaan yang sama.

Contoh: 12345

sample_count

(dalam objek parameters)

integer

Opsional. Jumlah sampel audio yang akan dibuat. Default-nya adalah 1 jika tidak ditentukan dan seed tidak digunakan.

Tidak dapat digunakan dengan seed dalam permintaan yang sama.

Contoh: 2

Permintaan sampel

Gunakan permintaan berikut untuk membuat musik instrumental dari perintah teks:

Permintaan pembuatan teks menjadi musik

curl

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/lyria-002:predict \
-d '{
  "instances": [
    {
      "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.",
      "negative_prompt": "drums, electric guitar",
      "seed": 98765
    }
  ],
  "parameters": {}
}'

JSON

Contoh ini menggunakan seed untuk output yang dapat direproduksi.


{
  "instances": [
    {
      "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.",
      "negative_prompt": "drums, electric guitar",
      "seed": 98765
    }
  ],
  "parameters": {}
}

JSON dengan sample_count

Contoh ini menggunakan sample_count untuk membuat beberapa sampel.

Untuk menguji perintah teks menggunakan Lyria API, kirim permintaan POST ke endpoint model penayang. Contoh berikut menghilangkan seed dari objek instances dan menggunakan sample_count dalam objek parameters untuk menghasilkan beberapa sampel.


{
  "instances": [
    {
      "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.",
      "negative_prompt": "drums, electric guitar"
    }
  ],
  "parameters": {
    "sample_count": 2
  }
}

Isi respons

Permintaan yang berhasil akan menampilkan objek JSON yang berisi data audio yang dihasilkan. Setiap klip audio yang dihasilkan berdurasi 30 detik dan disediakan sebagai file audio WAV dengan frekuensi sampel 48 kHz.

{
  "predictions": [
    {
      "audioContent": "BASE64_ENCODED_WAV_STRING_SAMPLE_1",
      "mimeType": "audio/wav"
    }
    // Additional audio samples will be listed here if sample_count > 1
    // e.g.,
    //{"audioContent": "BASE64_ENCODED_WAV_STRING_SAMPLE_2",
    // "mimeType": "audio/wav"
    //}
  ],
  "deployedModelId": "xxxxxxxxxxxxxxx", // Actual ID may vary based on deployment
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/lyria-002",
  "modelDisplayName": "Lyria 2"
}
Elemen respons
predictions

array

Array sampel audio yang dihasilkan. Setiap objek dalam array mewakili satu klip audio.

predictions[].audioContent

string

String berenkode base64 dari data audio WAV yang dihasilkan.

predictions[].mimeType

string

Jenis MIME data audio. Untuk Lyria, ini adalah "audio/wav".

deployedModelId

string

ID model yang di-deploy yang memproses permintaan (jika berlaku untuk jenis endpoint).

model

string

Nama resource lengkap model yang memproses permintaan.

modelDisplayName

string

Nama tampilan model.

Praktik terbaik dan batasan

Lihat Kartu Model Lyria untuk mengetahui praktik terbaik mendetail tentang perintah, dukungan bahasa (khusus bahasa Inggris Amerika Serikat untuk perintah), waktu pembuatan, format output (WAV, 48 kHz, klip instrumental 30 detik), tindakan keamanan, dan informasi deployment.

Poin utama:

  • Perintah Mendetail: Umumnya menghasilkan audio yang lebih baik.
  • Tentukan: Genre, mood, instrumentasi, tempo.
  • Perintah Negatif: Gunakan negative_prompt untuk mengecualikan elemen.
  • Output: Klip audio WAV berdurasi 30 detik, 48 kHz, hanya instrumental.
  • Keamanan: Filter keamanan konten, pemeriksaan pembacaan, pemeriksaan intent artis, dan pemberian watermark SynthID diterapkan.

Harga

Harga penggunaan Lyria 2 adalah $0,06 per 30 detik musik output yang dihasilkan. Untuk mengetahui detail selengkapnya, lihat Harga Vertex AI.

Informasi selengkapnya

  • Pelajari AI Generatif di Vertex AI lebih lanjut.
  • Untuk ringkasan Lyria, lihat kartu modelnya yang tersedia di Model Garden (Media Studio).

Langkah berikutnya