高级语音设置

本指南提供了有关语音功能的附加高级设置。您可以 转到代理设置 > 语音和 IVR >Speech-to-Text >高级语音设置

这些设置可在代理设置中找到(应用于整个代理), 流设置(应用于整个 流程并覆盖代理设置), 网页设置(适用于网页和 覆盖流程和代理设置),以及 履单设置 (适用于 fulfillment 和替换页面、流程和代理设置)。一部分 这些设置中会提供一些设置,具体取决于 与关卡的相关性。*您必须先在代理级别勾选启用高级语音设置复选框(代理设置 > 语音和 IVR > 语音转文字 > 高级语音设置),然后才能在任何更低级别配置这些设置。*

如果在这些较低级别上选择了自定义选项,更新后的代理级设置不会传播到流、页面和执行级别。如果自定义选项包含多个设置,而您只想更新其中的部分设置,那么如果您希望其他设置与代理级设置保持一致,可能还需要更新其他设置。

不同级别的设置可用性

下表介绍了在 Google 搜索上可以使用哪些高级语音设置 每个级别:

设置名称 代理 流程 页面 履行情况
模型选择 (Speech-to-Text)
语音结束的灵敏度
基于超时的高级语音结束灵敏度
启用智能端点
无语音超时
打断功能
允许取消播放部分响应
音频导出存储桶
DTMF

模型选择(语音转文字)

可以在代理、流程和页面级别设置。

设置用于语音识别的语音模型。此设置 特定于语言,因此您可以为不同的语言选择不同的模型。 您还可以选中替换请求级语音模型,此操作会导致 所选模型,即使运行时 API 调用指定了不同的模型, 模型。

如需了解对话代理 (Dialogflow CX) 电话网关,请参阅 限制。 如需了解详情,请参阅 语音模型

语音结束的灵敏度

可在代理、流和页面级设置。

控制识别最终用户音频输入中语音结束的灵敏度。该值的范围介于 0(低灵敏度,不太可能结束语音)到 100(高灵敏度,很有可能结束语音)之间。

基于超时的高级语音结束灵敏度

可以在代理级别设置,并在流和页面级别停用。

如果启用此设置,系统会使用语音结束敏感度设置值来建立相对音频静音超时,以确定语音结束。如果此设置处于停用状态(默认),系统会使用语音结束敏感度设置值,通过 Google Cloud Speech-to-Text 提供的 ML 模型来确定语音结束。

结束语音灵敏度设置仅支持 phone_call en-US 语言的语音模型 “启用基于超时的高级语音敏感度”标记 允许为所有语言和 Dialogflow 支持的语音模型。

启用智能端点

只能在代理级别设置。

如果启用此设置,对话代理 (Dialogflow CX) 会分析部分用户输入, 以确定词的结尾。例如,如果用户说“我想”,然后暂停,对话式客服 (Dialogflow CX) 会等待用户继续说下去。

这对于数字参数收集特别有用,因为在收集过程中,用户 可能会显示“1234”先停下来再说“5678”若要应用此设置 您必须设置 智能端点: 参数的形式。

此设置仅适用于 en-US 语言标记,默认处于停用状态。

语音超时

可以在代理、流程和页面级别设置。

对话代理 (Dialogflow CX) 停止等待最终用户的时长(以秒为单位) 音频输入。默认值为 5 秒,最大值为 60 秒。对于 对话代理 (Dialogflow CX) 会调用无输入事件

打断功能

可在代理、流程和执行方式级别设置。

启用后,最终用户可以中断对话式客服 (Dialogflow CX) 响应音频。中断后,对话式客服 (Dialogflow CX) 将停止发送音频,并将处理下一个最终用户输入。

如果消息队列中有多条消息, 并且消息已被与页面、流程或代理关联的执行方式加入队列 队列中的所有后续消息也会 已启用打断功能。在这种情况下,集成会停止播放所有启用了打断功能的排入队列的消息的音频。

允许取消部分响应播放

只能在履单级别设置。

当您在代理设置 > 语音和 IVR 中选中启用高级语音设置复选框,并在执行方式一级启用部分响应时,即可启用此设置。此设置允许取消部分响应的播放。

如果消息队列中的消息 由允许取消的执行方式创建,则消息播放 如果向队列中添加了其他消息,则会取消。如果您希望初始消息开始播放,但如果在初始消息播放完成之前,有效的 webhook 生成了另一条消息,则取消该播放,这非常有用。

音频导出存储桶

可在代理和数据流级设置。

如果提供了此参数,则与请求相关的所有音频数据都将保存到 Cloud Storage 存储桶:

已保存音频 适用的请求
最终用户音频输入 DetectIntent、StreamingDetectIntent、AnalyzeContent、StreamingAnalyzeContent
为响应合成的 Text-to-Speech (TTS) 音频 AnalyzeContent、StreamingAnalyzeContent

Storage Object Creator 角色授予项目中的以下服务账号:

  • 格式为 one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.com 的服务账号(如果您使用合作伙伴内置电话集成)。

  • 格式为 service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com 的服务账号(如果您使用 Dialogflow CX 电话网关集成)。如需在 IAM 中找到此服务账号,请选中包含 Google 提供的角色授予选项。

DTMF

如需详细了解此功能,请参阅 DTMF(双音多频信号)文档