常见问题解答

Custom Voice 是否支持 SSML?

  • Custom Voice 支持所有 SSML 功能,但重音(路线图上)和音高语调(即将推出)除外。

SSML 句子的长度如何?

  • 我们建议避免使用 SSML 句子标记,并由我们推断句子结构。如果必须使用 SSML 句子,我们将为每个 SSML 句子生成最多 30 秒的音频。

  • 每个句子最多可以包含 480 个音素。请根据需要使用标点符号(例如英文句点)拆分较长的句子。

Custom Voice 模型的两个版本之间是否存在语音差异?

  • 随着技术的发展,Custom Voice 模型两个版本之间会有一些变化,即使对模型进行训练时使用的是相同的音频数据。如果您遇到此问题,请向我们发送一些样本,以便我们进行调查。

在哪里可以向 Google 报告问题?