このページは Cloud Translation API によって翻訳されました。

Lyria API

Lyria は、高品質なオーディオ生成のための新しい基盤モデルであり、テキストプロンプトから多様なサウンドスケープと楽曲を作成できます。Lyria を使用すると、テキストプロンプトから高品質のインストルメンタル音楽を生成できます。

コンソールでこのモデルを確認するには、Model Garden で Lyria モデルカードを参照してください（[Media Studio] タブを使用してアクセスできます）。

Vertex AI で Lyria を試す（Vertex AI Studio）

Colab で Lyria を試す

サポートされているモデル

Lyria API は、次のモデルをサポートしています。

lyria-002

HTTP リクエスト

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  https://LOCATION[-aiplatform.googleapis.com/v1/projects/](https://-aiplatform.googleapis.com/v1/projects/)PROJECT_ID/locations/LOCATION/publishers/google/models/lyria-002:predict \
  -d '{
    "instances": [
      {
        "prompt": "string",
        "negative_prompt": "string", // Optional
        "seed": 0 // Optional. Cannot be used with sample_count.
      }
    ],
    "parameters": {
      "sample_count": 1 // Optional. Cannot be used with seed.
    }
  }'

Lyria モデルには、次のパラメータを使用します。詳細については、Lyria Model Garden カードの詳細をご覧ください。

パラメータ

パラメータ
`prompt` （`instances` オブジェクト内）	`string` 必須。生成する音声の米国英語（en-us）のテキスト記述。例: 「速いテンポのエネルギッシュなエレクトロニックダンストラック」
`negative_prompt` （`instances` オブジェクト内）	`string` 省略可。生成される音声から除外する内容の説明。例: 「ボーカル、スローテンポ」
`seed` （`instances` オブジェクト内）	`integer` 省略可。確定生成用のシード。指定されている場合、モデルは同じプロンプトと他のパラメータで同じ音声を生成しようとします。同じリクエストで `sample_count` と併用することはできません。例: `12345`
`sample_count` （`parameters` オブジェクト内）	`integer` 省略可。生成する音声サンプルの数。指定せずにシードが使用されていない場合、デフォルトは 1 です。同じリクエストで `seed` と併用することはできません。例: `2`

prompt

（instances オブジェクト内）

string

必須。生成する音声の米国英語（en-us）のテキスト記述。

例: 「速いテンポのエネルギッシュなエレクトロニックダンストラック」

negative_prompt

（instances オブジェクト内）

string

省略可。生成される音声から除外する内容の説明。

例: 「ボーカル、スローテンポ」

seed

（instances オブジェクト内）

integer

省略可。確定生成用のシード。指定されている場合、モデルは同じプロンプトと他のパラメータで同じ音声を生成しようとします。

同じリクエストで sample_count と併用することはできません。

例: 12345

sample_count

（parameters オブジェクト内）

integer

省略可。生成する音声サンプルの数。指定せずにシードが使用されていない場合、デフォルトは 1 です。

同じリクエストで seed と併用することはできません。

例: 2

リクエストの例

次のリクエストを使用して、テキストプロンプトからインストルメンタル音楽を生成します。

テキストから音楽への生成リクエスト

curl

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/lyria-002:predict \
-d '{
  "instances": [
    {
      "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.",
      "negative_prompt": "drums, electric guitar",
      "seed": 98765
    }
  ],
  "parameters": {}
}'

JSON

この例では、再現可能な出力に seed を使用しています。


{
  "instances": [
    {
      "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.",
      "negative_prompt": "drums, electric guitar",
      "seed": 98765
    }
  ],
  "parameters": {}
}

sample_count を含む JSON

この例では、sample_count を使用して複数のサンプルを生成します。

Lyria API を使用してテキストプロンプトをテストするには、パブリッシャーモデルエンドポイントに POST リクエストを送信します。次の例では、instances オブジェクトから seed を省略し、parameters オブジェクトの sample_count を使用して複数のサンプルを生成します。


{
  "instances": [
    {
      "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.",
      "negative_prompt": "drums, electric guitar"
    }
  ],
  "parameters": {
    "sample_count": 2
  }
}

レスポンスの本文

リクエストが成功すると、生成された音声データを含む JSON オブジェクトが返されます。生成される各音声クリップの長さは 30 秒で、48 kHz のサンプリングレートで WAV 音声ファイルとして提供されます。

{
  "predictions": [
    {
      "audioContent": "BASE64_ENCODED_WAV_STRING_SAMPLE_1",
      "mimeType": "audio/wav"
    }
    // Additional audio samples will be listed here if sample_count > 1
    // e.g.,
    //{"audioContent": "BASE64_ENCODED_WAV_STRING_SAMPLE_2",
    // "mimeType": "audio/wav"
    //}
  ],
  "deployedModelId": "xxxxxxxxxxxxxxx", // Actual ID may vary based on deployment
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/lyria-002",
  "modelDisplayName": "Lyria 2"
}

レスポンス要素
`predictions`	`array` 生成された音声サンプルの配列。配列内の各オブジェクトは 1 つの音声クリップを表します。
`predictions[].audioContent`	`string` 生成された WAV 音声データを Base64 でエンコードした文字列。
`predictions[].mimeType`	`string` 音声データの MIME タイプ。Lyria の場合は `"audio/wav"` です。
`deployedModelId`	`string` リクエストを処理したデプロイ済みモデルの ID（エンドポイントタイプに該当する場合）。
`model`	`string` リクエストを処理したモデルの完全なリソース名。
`modelDisplayName`	`string` モデルの表示名。

ベストプラクティスと制限事項

プロンプト、言語サポート（プロンプトの場合は米国英語のみ）、生成時間、出力形式（WAV、48 kHz、30 秒のインストルメンタルクリップ）、安全対策、デプロイ情報に関する詳細なベストプラクティスについては、Lyria モデルカードをご覧ください。

要点:

詳細なプロンプト: 通常、音声の品質が向上します。
指定: ジャンル、ムード、楽器、テンポ。
ネガティブプロンプト: negative_prompt を使用して要素を除外します。
出力: 30 秒の WAV 音声クリップ、48 kHz、インストルメンタルのみ。
安全性: コンテンツの安全フィルタ、朗読のチェック、アーティストの意図のチェック、SynthID 透かしが適用されます。

料金

Lyria 2 の使用料金は、生成された出力音楽の 30 秒あたり $0.06 です。詳細については、Vertex AI の料金をご覧ください。

詳細

Vertex AI での生成 AI で詳細をご確認ください。
Lyria の概要については、Model Garden（Media Studio）で利用可能なモデルカードをご覧ください。

次のステップ

Vertex AI Studio で Lyria を試す。
Google Cloud サービス利用規約を確認します。
生成 AI プロダクトに関する追加利用規約をお読みください。

Lyria API コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

サポートされているモデル

HTTP リクエスト

リクエストの例

テキストから音楽への生成リクエスト

curl

JSON

sample_count を含む JSON

レスポンスの本文

ベスト プラクティスと制限事項

料金

詳細

次のステップ

Lyria API

ベストプラクティスと制限事項