常见问题解答

Brand Voice Lite 是否支持 SSML?

我们不支持 Brand Voices Lite 使用 SSML。不过,我们的模型听起来很自然,应该能够很好地捕捉到说话者的口误和语义细微差别。

如何准确录制参考音频和用户意见音频?

确保在相同的语音条件下录制用户意见征求音频和参考音频。消除所有背景噪音,并清晰地念出脚本。意见征求音频应为采用 LINEAR16 编码且采样率为 24 kHz 的单声道 WAV 文件。

如何加入许可名单?

如需获取许可名单访问权限,请让您的客户经理团队填写许可名单申请表单。

该流程预计需要多长时间?

  • 许可名单访问权限审核:1-2 周 模型训练:15 分钟 部署:15 分钟

支持哪些语言?

我们仅支持 en-US

支持哪些端点区域?

我们仅支持默认的全局端点。

我对模型感到满意。我应该采取哪些步骤来为生产环境做准备?

这是一项正式发布前功能,因此我们不支持正式版服务等级协议。不过,由于 AI 原则要求,账号团队需要提交负责任 AI 审核请求,以便获得生产环境审批。审批过程可能需要 1-2 周。账号团队会按以下步骤操作:

  • 填写交易审核表单以供审批。
  • 如果获得批准,请填写包含已获批准文档的内部工单。
  • 如果获得批准,审核人员会授予您在正式版中使用该功能的权限。

产品定价如何?

请在价格详情页面上查看 Brand Voices Lite 的价格。

Brand Voice Lite 模型的两个版本之间是否存在语音差异?

随着技术的发展,Brand Voice Lite 模型两个版本之间会有一些变化,即使对模型进行训练时使用的是相同的音频数据。如果您遇到此问题,请向我们发送一些样本,以便我们进行调查。

在哪里可以向 Google 报告问题?

如果问题仍然存在,请联系您的客户代表。每个表单请只能提交一个问题。