Lyria는 텍스트 프롬프트에서 다양한 사운드스케이프와 음악 작품을 만들 수 있는 고품질 오디오 생성을 위한 새로운 기반 모델입니다. Lyria를 사용하면 사용자가 텍스트 프롬프트에서 고품질의 악기 음악을 생성할 수 있습니다.
콘솔에서 이 모델을 살펴보려면 Model Garden (미디어 스튜디오 탭을 사용하여 액세스 가능)의 Lyria 모델 카드를 참고하세요.
Vertex AI (Vertex AI Studio)에서 Lyria 사용해 보기
지원되는 모델
Lyria API는 다음 모델을 지원합니다.
lyria-002
HTTP 요청
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION[-aiplatform.googleapis.com/v1/projects/](https://-aiplatform.googleapis.com/v1/projects/)PROJECT_ID/locations/LOCATION/publishers/google/models/lyria-002:predict \
-d '{
"instances": [
{
"prompt": "string",
"negative_prompt": "string", // Optional
"seed": 0 // Optional. Cannot be used with sample_count.
}
],
"parameters": {
"sample_count": 1 // Optional. Cannot be used with seed.
}
}'
Lyria 모델에 다음 매개변수를 사용합니다. 자세한 내용은 Lyria Model Garden 카드 세부정보를 참고하세요.
매개변수 | |
---|---|
( |
필수 항목입니다. 생성할 오디오에 대한 미국 영어 (en-us) 텍스트 설명입니다. 예: '빠른 템포의 활기찬 일렉트로닉 댄스 트랙' |
( |
선택사항입니다. 생성된 오디오에서 제외할 항목에 대한 설명입니다. 예: '보컬, 느린 템포' |
( |
선택사항입니다. 결정론적 생성을 위한 시드입니다. 제공된 경우 모델은 동일한 프롬프트와 다른 파라미터를 사용하여 동일한 오디오를 생성하려고 시도합니다.
동일한 요청에서 예: |
( |
선택사항입니다. 생성할 오디오 샘플 수입니다. 지정되지 않고 시드가 사용되지 않으면 기본값은 1입니다.
동일한 요청에서 예: |
샘플 요청
다음 요청을 사용하여 텍스트 프롬프트에서 악기 음악을 생성합니다.
텍스트 음악 변환 생성 요청
curl
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/lyria-002:predict \ -d '{ "instances": [ { "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.", "negative_prompt": "drums, electric guitar", "seed": 98765 } ], "parameters": {} }'
JSON
이 예에서는 재현 가능한 출력을 위해 seed
를 사용합니다.
{ "instances": [ { "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.", "negative_prompt": "drums, electric guitar", "seed": 98765 } ], "parameters": {} }
sample_count가 포함된 JSON
이 예에서는 sample_count
를 사용하여 여러 샘플을 생성합니다.
Lyria API를 사용하여 텍스트 프롬프트를 테스트하려면 게시자 모델 엔드포인트에 POST 요청을 전송합니다. 다음 예에서는 instances
객체에서 seed
를 생략하고 parameters
객체에서 sample_count
를 사용하여 여러 샘플을 생성합니다.
{ "instances": [ { "prompt": "A calm acoustic folk song with a gentle guitar melody and soft strings.", "negative_prompt": "drums, electric guitar" } ], "parameters": { "sample_count": 2 } }
응답 본문
요청이 성공하면 생성된 오디오 데이터가 포함된 JSON 객체가 반환됩니다. 생성된 각 오디오 클립은 30초 길이이며 48kHz 샘플링 레이트의 WAV 오디오 파일로 제공됩니다.
{
"predictions": [
{
"audioContent": "BASE64_ENCODED_WAV_STRING_SAMPLE_1",
"mimeType": "audio/wav"
}
// Additional audio samples will be listed here if sample_count > 1
// e.g.,
//{"audioContent": "BASE64_ENCODED_WAV_STRING_SAMPLE_2",
// "mimeType": "audio/wav"
//}
],
"deployedModelId": "xxxxxxxxxxxxxxx", // Actual ID may vary based on deployment
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/lyria-002",
"modelDisplayName": "Lyria 2"
}
응답 요소 | |
---|---|
predictions |
생성된 오디오 샘플의 배열입니다. 배열의 각 객체는 하나의 오디오 클립을 나타냅니다. |
predictions[].audioContent |
생성된 WAV 오디오 데이터의 base64 인코딩 문자열입니다. |
predictions[].mimeType |
오디오 데이터의 MIME 유형입니다. Lyria의 경우 |
deployedModelId |
요청을 처리한 배포된 모델의 ID입니다 (엔드포인트 유형에 해당하는 경우). |
model |
요청을 처리한 모델의 전체 리소스 이름입니다. |
modelDisplayName |
모델의 표시 이름입니다. |
권장사항 및 제한사항
프롬프트, 언어 지원 (프롬프트의 경우 미국 영어만 해당), 생성 시간, 출력 형식 (WAV, 48kHz, 30초 악기 연주 클립), 안전 조치, 배포 정보에 관한 자세한 권장사항은 Lyria 모델 카드를 참고하세요.
핵심 사항:
- 상세 프롬프트: 일반적으로 오디오 품질이 개선됩니다.
- 지정: 장르, 분위기, 악기, 템포
- 부정적 프롬프트:
negative_prompt
를 사용하여 요소를 제외합니다. - 출력: 30초 WAV 오디오 클립, 48kHz, 악기만 포함
- 안전: 콘텐츠 안전 필터, 낭독 확인, 아티스트 의도 확인, SynthID 워터마크가 적용됩니다.
가격 책정
Lyria 2 사용 요금은 생성된 출력 음악 30초당 $0.06입니다. 자세한 내용은 Vertex AI 가격 책정을 참고하세요.
추가 정보
- Vertex AI의 생성형 AI에 대해 자세히 알아보세요.
- Lyria에 관한 개요는 Model Garden (Media Studio)에서 확인할 수 있는 모델 카드를 참고하세요.
다음 단계
- Vertex AI Studio에서 Lyria를 사용해 보세요.
- Google Cloud 서비스 약관을 검토하세요.
- 생성형 AI 제품에 대한 추가 약관을 확인하세요.