本指南提供了有关语音功能的附加高级设置。您可以 转到代理设置 > 语音和 IVR >Speech-to-Text >高级语音设置。
这些设置可在代理设置中找到(应用于整个代理), 流设置(应用于整个 流程并覆盖代理设置), 网页设置(适用于网页和 覆盖流程和代理设置),以及 履单设置 (适用于 fulfillment 和替换页面、流程和代理设置)。一部分 这些设置中会提供一些设置,具体取决于 与关卡的相关性。*您必须先在代理级别勾选启用高级语音设置复选框(代理设置 > 语音和 IVR > 语音转文字 > 高级语音设置),然后才能在任何更低级别配置这些设置。*
如果在这些较低级别上选择了自定义选项,更新后的代理级设置不会传播到流、页面和执行级别。如果自定义选项包含多个设置,而您只想更新其中的部分设置,那么如果您希望其他设置与代理级设置保持一致,可能还需要更新其他设置。
不同级别的设置可用性
下表介绍了在 Google 搜索上可以使用哪些高级语音设置 每个级别:
设置名称 | 代理 | 流程 | 页面 | 履行情况 |
---|---|---|---|---|
模型选择 (Speech-to-Text) | ✔ | ✔ | ✔ | |
语音结束的灵敏度 | ✔ | ✔ | ✔ | |
基于超时的高级语音结束灵敏度 | ✔ | ✔ | ✔ | |
启用智能端点 | ✔ | |||
无语音超时 | ✔ | ✔ | ✔ | |
打断功能 | ✔ | ✔ | ||
允许取消播放部分响应 | ✔ | |||
音频导出存储桶 | ✔ | ✔ | ||
DTMF | ✔ | ✔ | ✔ |
模型选择(语音转文字)
可以在代理、流程和页面级别设置。
设置用于语音识别的语音模型。此设置 特定于语言,因此您可以为不同的语言选择不同的模型。 您还可以选中替换请求级语音模型,此操作会导致 所选模型,即使运行时 API 调用指定了不同的模型, 模型。
如需了解对话代理 (Dialogflow CX) 电话网关,请参阅 限制。 如需了解详情,请参阅 语音模型。
语音结束的灵敏度
可在代理、流和页面级设置。
控制识别最终用户音频输入中语音结束的灵敏度。该值的范围介于 0(低灵敏度,不太可能结束语音)到 100(高灵敏度,很有可能结束语音)之间。
基于超时的高级语音结束灵敏度
可以在代理级别设置,并在流和页面级别停用。
如果启用此设置,系统会使用语音结束敏感度设置值来建立相对音频静音超时,以确定语音结束。如果此设置处于停用状态(默认),系统会使用语音结束敏感度设置值,通过 Google Cloud Speech-to-Text 提供的 ML 模型来确定语音结束。
而结束语音灵敏度设置仅支持 phone_call
en-US
语言的语音模型
“启用基于超时的高级语音敏感度”标记
允许为所有语言和
Dialogflow 支持的语音模型。
启用智能端点
只能在代理级别设置。
如果启用此设置,对话代理 (Dialogflow CX) 会分析部分用户输入, 以确定词的结尾。例如,如果用户说“我想”,然后暂停,对话式客服 (Dialogflow CX) 会等待用户继续说下去。
这对于数字参数收集特别有用,因为在收集过程中,用户 可能会显示“1234”先停下来再说“5678”若要应用此设置 您必须设置 智能端点: 参数的形式。
此设置仅适用于 en-US
语言标记,默认处于停用状态。
语音超时
可以在代理、流程和页面级别设置。
对话代理 (Dialogflow CX) 停止等待最终用户的时长(以秒为单位) 音频输入。默认值为 5 秒,最大值为 60 秒。对于 对话代理 (Dialogflow CX) 会调用无输入事件。
打断功能
可在代理、流程和执行方式级别设置。
启用后,最终用户可以中断对话式客服 (Dialogflow CX) 响应音频。中断后,对话式客服 (Dialogflow CX) 将停止发送音频,并将处理下一个最终用户输入。
如果消息队列中有多条消息, 并且消息已被与页面、流程或代理关联的执行方式加入队列 队列中的所有后续消息也会 已启用打断功能。在这种情况下,集成会停止播放所有启用了打断功能的排入队列的消息的音频。
允许取消部分响应播放
只能在履单级别设置。
当您在代理设置 > 语音和 IVR 中选中启用高级语音设置复选框,并在执行方式一级启用部分响应时,即可启用此设置。此设置允许取消部分响应的播放。
如果消息队列中的消息 由允许取消的执行方式创建,则消息播放 如果向队列中添加了其他消息,则会取消。如果您希望初始消息开始播放,但如果在初始消息播放完成之前,有效的 webhook 生成了另一条消息,则取消该播放,这非常有用。
音频导出存储桶
可在代理和数据流级设置。
如果提供了此参数,则与请求相关的所有音频数据都将保存到 Cloud Storage 存储桶:
已保存音频 | 适用的请求 |
---|---|
最终用户音频输入 | DetectIntent、StreamingDetectIntent、AnalyzeContent、StreamingAnalyzeContent |
为响应合成的 Text-to-Speech (TTS) 音频 | AnalyzeContent、StreamingAnalyzeContent |
将 Storage Object Creator 角色授予项目中的以下服务账号:
格式为
one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.com
的服务账号(如果您使用合作伙伴内置电话集成)。格式为
service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com
的服务账号(如果您使用 Dialogflow CX 电话网关集成)。如需在 IAM 中找到此服务账号,请选中包含 Google 提供的角色授予选项。
DTMF
如需详细了解此功能,请参阅 DTMF(双音多频信号)文档。