음성 애플리케이션을 위한 커스텀 음성 모델 만들기

Text-to-Speech UI 내에서 자체 커스텀 음성 모델을 만들 수 있습니다.

기본 요건

  1. Text-to-Speech API를 사용 설정합니다.
  2. 학습 데이터 요구사항에 따라 오디오를 녹음합니다.
  3. Cloud Storage 버킷 만들기
  4. 학습 데이터 요구사항(0001.wav, 0002.wav... 0200.wav 등)에서 지정한 형식으로 오디오 파일을 새 버킷에 업로드합니다.

새 커스텀 음성 모델 학습

  1. Text-to-Speech UI에서 커스텀 음성 탭을 엽니다.
  2. 화면 상단의 만들기를 클릭합니다.
  3. 음성 모델의 이름을 지정합니다.
  4. 지원되는 언어 드롭다운에서 언어를 지정합니다.
  5. 기본 요건 4단계의 버킷 구성에서 적절한 CSV 파일을 선택합니다.
  6. 성우의 동의문을 업로드합니다. 예: '본인(이름)은 본인의 음성을 사용해 합성 커스텀 음성을 만드는 데 동의합니다.'
  7. 만들기를 클릭하여 모델 만들기를 시작합니다. 모델을 만드는 데 최대 3일이 걸릴 수 있습니다.
  8. 학습 작업의 상태를 확인하려면 오른쪽 상단의 탐색 헤더에서 콘솔 알림을 확인하세요.

다음 단계

모델 학습이 완료되면 콘솔에서 샘플 출력 오디오 파일을 사용할 수 있습니다. 이 파일을 사용하여 모델의 품질을 초기 평가할 수 있습니다. 요구사항을 충족하는 경우 영업팀에 모델 배포 지원을 요청하세요. 배포에 2~3주가 걸리므로, 신속하게 평가하고 일찍 소통하는 것이 좋습니다.