Text-to-Speech UI 내에서 자체 커스텀 음성 모델을 만들 수 있습니다.
기본 요건
- Text-to-Speech API를 사용 설정합니다.
- 학습 데이터 요구사항에 따라 오디오를 녹음합니다.
- Cloud Storage 버킷 만들기
- 학습 데이터 요구사항(0001.wav, 0002.wav... 0200.wav 등)에서 지정한 형식으로 오디오 파일을 새 버킷에 업로드합니다.
새 커스텀 음성 모델 학습
- Text-to-Speech UI에서 커스텀 음성 탭을 엽니다.
- 화면 상단의 만들기를 클릭합니다.
- 음성 모델의 이름을 지정합니다.
- 지원되는 언어 드롭다운에서 언어를 지정합니다.
- 기본 요건 4단계의 버킷 구성에서 적절한 CSV 파일을 선택합니다.
- 성우의 동의문을 업로드합니다. 예: '본인(이름)은 본인의 음성을 사용해 합성 커스텀 음성을 만드는 데 동의합니다.'
- 만들기를 클릭하여 모델 만들기를 시작합니다. 모델을 만드는 데 최대 3일이 걸릴 수 있습니다.
- 학습 작업의 상태를 확인하려면 오른쪽 상단의 탐색 헤더에서 콘솔 알림을 확인하세요.
다음 단계
모델 학습이 완료되면 콘솔에서 샘플 출력 오디오 파일을 사용할 수 있습니다. 이 파일을 사용하여 모델의 품질을 초기 평가할 수 있습니다. 요구사항을 충족하는 경우 영업팀에 모델 배포 지원을 요청하세요. 배포에 2~3주가 걸리므로, 신속하게 평가하고 일찍 소통하는 것이 좋습니다.