Lyria は、高品質なオーディオ生成のための新しい基盤モデルであり、テキスト プロンプトから多様なサウンドスケープと楽曲を作成できます。Lyria を使用すると、テキスト プロンプトから高品質のインストルメンタル音楽を生成できます。
コンソールでこのモデルを確認するには、Model Garden で Lyria モデルカードを参照してください([Media Studio] タブを使用してアクセスできます)。
Vertex AI で Lyria を試す(Vertex AI Studio)
サポートされているモデル
Lyria API は、次のモデルをサポートしています。
lyria-002
HTTP リクエスト
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION[-aiplatform.googleapis.com/v1/projects/](https://-aiplatform.googleapis.com/v1/projects/)PROJECT_ID/locations/LOCATION/publishers/google/models/lyria-002:predict \
-d '{
"instances": [
{
"prompt": "string",
"negative_prompt": "string", // Optional
"seed": 0 // Optional. Cannot be used with sample_count.
}
],
"parameters": {
"sample_count": 1 // Optional. Cannot be used with seed.
}
}'
Lyria モデルには、次のパラメータを使用します。詳細については、Lyria Model Garden カードの詳細をご覧ください。
パラメータ | |
---|---|
( |
必須。生成する音声の米国英語(en-us)のテキスト記述。 例: 「速いテンポのエネルギッシュなエレクトロニック ダンス トラック」 |
( |
省略可。生成される音声から除外する内容の説明。 例: 「ボーカル、スローテンポ」 |
( |
省略可。確定生成用のシード。指定されている場合、モデルは同じプロンプトと他のパラメータで同じ音声を生成しようとします。
同じリクエストで 例: |
( |
省略可。生成する音声サンプルの数。指定せずにシードが使用されていない場合、デフォルトは 1 です。
同じリクエストで 例: |
リクエストの例
次のリクエストを使用して、テキスト プロンプトからインストルメンタル音楽を生成します。
テキストから音楽への生成リクエスト
curl
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/lyria-002:predict \ -d '{ "instances": [ { "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.", "negative_prompt": "drums, electric guitar", "seed": 98765 } ], "parameters": {} }'
JSON
この例では、再現可能な出力に seed
を使用しています。
{ "instances": [ { "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.", "negative_prompt": "drums, electric guitar", "seed": 98765 } ], "parameters": {} }
sample_count を含む JSON
この例では、sample_count
を使用して複数のサンプルを生成します。
Lyria API を使用してテキスト プロンプトをテストするには、パブリッシャー モデル エンドポイントに POST リクエストを送信します。次の例では、instances
オブジェクトから seed
を省略し、parameters
オブジェクトの sample_count
を使用して複数のサンプルを生成します。
{ "instances": [ { "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.", "negative_prompt": "drums, electric guitar" } ], "parameters": { "sample_count": 2 } }
レスポンスの本文
リクエストが成功すると、生成された音声データを含む JSON オブジェクトが返されます。生成される各音声クリップの長さは 30 秒で、48 kHz のサンプリング レートで WAV 音声ファイルとして提供されます。
{
"predictions": [
{
"audioContent": "BASE64_ENCODED_WAV_STRING_SAMPLE_1",
"mimeType": "audio/wav"
}
// Additional audio samples will be listed here if sample_count > 1
// e.g.,
//{"audioContent": "BASE64_ENCODED_WAV_STRING_SAMPLE_2",
// "mimeType": "audio/wav"
//}
],
"deployedModelId": "xxxxxxxxxxxxxxx", // Actual ID may vary based on deployment
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/lyria-002",
"modelDisplayName": "Lyria 2"
}
レスポンス要素 | |
---|---|
predictions |
生成された音声サンプルの配列。配列内の各オブジェクトは 1 つの音声クリップを表します。 |
predictions[].audioContent |
生成された WAV 音声データを Base64 でエンコードした文字列。 |
predictions[].mimeType |
音声データの MIME タイプ。Lyria の場合は |
deployedModelId |
リクエストを処理したデプロイ済みモデルの ID(エンドポイント タイプに該当する場合)。 |
model |
リクエストを処理したモデルの完全なリソース名。 |
modelDisplayName |
モデルの表示名。 |
ベスト プラクティスと制限事項
プロンプト、言語サポート(プロンプトの場合は米国英語のみ)、生成時間、出力形式(WAV、48 kHz、30 秒のインストルメンタル クリップ)、安全対策、デプロイ情報に関する詳細なベスト プラクティスについては、Lyria モデルカードをご覧ください。
要点:
- 詳細なプロンプト: 通常、音声の品質が向上します。
- 指定: ジャンル、ムード、楽器、テンポ。
- ネガティブ プロンプト:
negative_prompt
を使用して要素を除外します。 - 出力: 30 秒の WAV 音声クリップ、48 kHz、インストルメンタルのみ。
- 安全性: コンテンツの安全フィルタ、朗読のチェック、アーティストの意図のチェック、SynthID 透かしが適用されます。
料金
Lyria 2 の使用料金は、生成された出力音楽の 30 秒あたり $0.06 です。詳細については、Vertex AI の料金をご覧ください。
詳細
- Vertex AI での生成 AI で詳細をご確認ください。
- Lyria の概要については、Model Garden(Media Studio)で利用可能なモデルカードをご覧ください。
次のステップ
- Vertex AI Studio で Lyria を試す。
- Google Cloud サービス利用規約を確認します。
- 生成 AI プロダクトに関する追加利用規約をお読みください。