進階語音設定

本指南提供語音功能的其他進階設定。如要開啟或關閉這些進階設定,請依序前往「代理程式設定」>「語音和 IVR」>「語音轉文字」>「進階語音設定」

這些設定位於代理程式設定 (套用至整個代理程式)、流程設定 (套用至整個流程並覆寫代理程式設定)、頁面設定 (套用至頁面並覆寫流程和代理程式設定),以及執行要求設定 (套用至執行要求並覆寫頁面、流程和代理程式設定)。每個層級都有一組可用的設定,具體取決於該層級的設定關聯性。*如要在任何較低層級設定這些設定,請先在代理程式層級勾選「啟用進階語音設定」方塊 (依序前往「代理程式設定」>「語音和 IVR」>「語音轉文字」>「進階語音設定」)*。

如果這些較低層級選取「自訂」選項,更新後的專員層級設定就不會傳播至流程、頁面和完成層級。如果「自訂」選項包含多項設定,而您只想更新部分設定,可能也需要更新其他設定,才能與代理商層級設定保持一致。

各層級可用的設定

下表說明各層級可用的進階語音設定:

設定名稱 代理 心流狀態 頁面 Fulfillment
模型選擇 (Speech-to-Text)
語音感測結束處
根據逾時時間進階調整語音感測結束處
啟用智慧端點
沒有語音逾時
插話
允許取消播放部分回覆
音訊匯出值區
DTMF

模型選擇 (Speech-to-Text)

可在代理程式、流程和頁面層級設定。

設定用於語音辨識的語音模型。這項設定會因語言而異,因此你可以為不同語言選取不同模型。您也可以勾選「Override request-level speech model」(覆寫要求層級的語音模型),這樣即使執行階段 API 呼叫指定了其他模型,系統仍會使用所選模型。

如要瞭解 Conversational Agents (Dialogflow CX) Phone Gateway 的限制,請參閱這篇文章。詳情請參閱語音模型

語音感測結束處

可在代理程式、流程和頁面層級設定。

控制辨識使用者語音輸入結束的感應度。值介於 0 (低感應度,較不可能結束語音) 到 100 (高感應度,較可能結束語音)。

根據逾時時間進階調整語音感測結束處

可在代理程式層級設定,並在流程和頁面層級停用。

如果啟用這項設定,系統會使用「語音結束敏感度」設定值做為指標,建立相對音訊靜音逾時,以判斷語音結束時間。如果停用這項設定 (預設),系統會使用「語音結束敏感度」設定值,判斷 Google Cloud 語音轉文字提供的 ML 模型是否已結束語音。

雖然「語音感測結束處」設定預設只支援 en-US 語言標記的 phone_call 語音模型,但「啟用以逾時為準的進階語音感測結束處」設定可讓您為 Dialogflow 支援的所有語言和語音模型設定語音感測結束處。

啟用智慧端點

只能在代理程式層級設定。

啟用這項設定後,Conversational Agents (Dialogflow CX) 會分析部分使用者輸入內容,判斷語音是否結束。舉例來說,如果使用者說「我想」並暫停,Conversational Agents (Dialogflow CX) 會等待使用者繼續說完句子。

這項功能在收集數字參數時特別實用,因為使用者可能會先說出「1234」,然後暫停,再說出「5678」。如要為特定參數套用這項設定,您必須在參數表單中設定智慧端點

這項設定僅適用於 en-US 語言代碼,且預設為停用。

沒有語音逾時

可在代理程式、流程和頁面層級設定。

Conversational Agents (Dialogflow CX) 停止等待使用者音訊輸入的時間長度 (以秒為單位)。預設值為 5 秒,上限為 60 秒。在此逾時期間,Conversational Agents (Dialogflow CX) 會叫用無輸入事件

插話

可在代理程式、流程和執行要求層級設定。

啟用後,使用者就能中斷 Conversational Agents (Dialogflow CX) 的回應音訊。如果中斷,Conversational Agents (Dialogflow CX) 會停止傳送音訊,並處理下一個使用者輸入內容。

如果訊息佇列中有多則訊息,且訊息是由與頁面、流程或代理程式相關聯的完成事項排入佇列,並已啟用插話功能,則佇列中的所有後續訊息也會啟用插話功能。在這種情況下,整合服務會停止播放所有已啟用插播功能的佇列訊息音訊。

允許取消播放部分回覆

只能在履行層級設定。

在「代理程式設定」>「語音和 IVR」中勾選「啟用進階語音設定」方塊,並在執行要求層級啟用部分回應,即可啟用這項設定。這項設定可取消播放部分回應。

如果訊息佇列中的訊息是由允許取消的完成動作所建立,且佇列中新增了其他訊息,系統就會取消播放該訊息。如果您希望初始訊息開始播放,但如果工作中的 Webhook 在初始訊息播放完畢前產生其他訊息,則取消播放,這時就很有用。

音訊匯出值區

可在代理程式和流程層級設定。

如果提供音訊資料,系統會將與要求相關聯的音訊資料儲存至 Cloud Storage 值區:

已儲存音訊 適用要求
使用者音訊輸入 DetectIntent、StreamingDetectIntent、AnalyzeContent、StreamingAnalyzeContent
為回應合成的文字轉語音 (TTS) 音訊 AnalyzeContent、StreamingAnalyzeContent

將「Storage Object Creator」(Storage 物件建立者) 角色授予專案中的下列服務帳戶:

  • 服務帳戶 (格式為 one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.com),如果您使用合作夥伴內建電話整合

  • 如果使用 Dialogflow CX Phone Gateway 整合服務,請將服務帳戶設為 service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com 格式。如要在 IAM 中找出這個服務帳戶,請勾選「Include Google-provided role grants」選項。

DTMF

如要進一步瞭解這項功能,請參閱 DTMF (雙音多頻訊號) 說明文件