Custom Voice 基础知识

概览

Cloud Text-to-Speech API 现在提供 Custom Voice。借助此功能,您可以使用自己的录音室品质的录音来训练自定义语音模型,以创建独特的语音。然后,通过 Cloud Text-to-Speech API,您可以使用自定义语音来合成音频。

用户提供的训练音频数据

Custom Voice 会提供一个文字转语音 (TTS) 模型,该模型听起来尽可能与您提供的音频数据相似。您的用例获得批准后,Google 会向您发送录音的脚本。建议您选择并聘请一名配音演员,来代表您的目标自定义语音。您需要让配音演员录制录音室品质的音频,用作训练数据(如需了解详情,请参阅训练数据要求页面)。如果您的训练数据未通过 Google 的内部质量检查,您可能需要在解决已发现的问题后重新录制或重新提交数据。

模型训练

Google 需要几周的时间来训练您的自定义语音模型。

部署

训练完成后,Google 会将自定义语音模型部署到您选择的项目中。

后续步骤