本指南提供語音功能的其他進階設定。如要開啟或關閉這些進階設定,請依序前往「代理程式設定」>「語音和 IVR」>「語音轉文字」>「進階語音設定」。
這些設定位於代理程式設定 (套用至整個代理程式)、流程設定 (套用至整個流程並覆寫代理程式設定)、頁面設定 (套用至頁面並覆寫流程和代理程式設定),以及執行要求設定 (套用至執行要求並覆寫頁面、流程和代理程式設定)。每個層級都有一組可用的設定,具體取決於該層級的設定關聯性。*如要在任何較低層級設定這些設定,請先在代理程式層級勾選「啟用進階語音設定」方塊 (依序前往「代理程式設定」>「語音和 IVR」>「語音轉文字」>「進階語音設定」)*。
如果這些較低層級選取「自訂」選項,更新後的專員層級設定就不會傳播至流程、頁面和完成層級。如果「自訂」選項包含多項設定,而您只想更新部分設定,可能也需要更新其他設定,才能與代理商層級設定保持一致。
各層級可用的設定
下表說明各層級可用的進階語音設定:
設定名稱 | 代理 | 心流狀態 | 頁面 | Fulfillment |
---|---|---|---|---|
模型選擇 (Speech-to-Text) | ✔ | ✔ | ✔ | |
語音感測結束處 | ✔ | ✔ | ✔ | |
根據逾時時間進階調整語音感測結束處 | ✔ | ✔ | ✔ | |
啟用智慧端點 | ✔ | |||
沒有語音逾時 | ✔ | ✔ | ✔ | |
插話 | ✔ | ✔ | ✔ | |
允許取消播放部分回覆 | ✔ | |||
音訊匯出值區 | ✔ | ✔ | ||
DTMF | ✔ | ✔ | ✔ |
模型選擇 (Speech-to-Text)
可在代理程式、流程和頁面層級設定。
設定用於語音辨識的語音模型。這項設定會因語言而異,因此你可以為不同語言選取不同模型。您也可以勾選「Override request-level speech model」(覆寫要求層級的語音模型),這樣即使執行階段 API 呼叫指定了其他模型,系統仍會使用所選模型。
如要瞭解 Conversational Agents (Dialogflow CX) Phone Gateway 的限制,請參閱這篇文章。詳情請參閱語音模型。
語音感測結束處
可在代理程式、流程和頁面層級設定。
控制辨識使用者語音輸入結束的感應度。值介於 0 (低感應度,較不可能結束語音) 到 100 (高感應度,較可能結束語音)。
根據逾時時間進階調整語音感測結束處
可在代理程式層級設定,並在流程和頁面層級停用。
如果啟用這項設定,系統會使用「語音結束敏感度」設定值做為指標,建立相對音訊靜音逾時,以判斷語音結束時間。如果停用這項設定 (預設),系統會使用「語音結束敏感度」設定值,判斷 Google Cloud 語音轉文字提供的 ML 模型是否已結束語音。
雖然「語音感測結束處」設定預設只支援 en-US
語言標記的 phone_call
語音模型,但「啟用以逾時為準的進階語音感測結束處」設定可讓您為 Dialogflow 支援的所有語言和語音模型設定語音感測結束處。
啟用智慧端點
只能在代理程式層級設定。
啟用這項設定後,Conversational Agents (Dialogflow CX) 會分析部分使用者輸入內容,判斷語音是否結束。舉例來說,如果使用者說「我想」並暫停,Conversational Agents (Dialogflow CX) 會等待使用者繼續說完句子。
這項功能在收集數字參數時特別實用,因為使用者可能會先說出「1234」,然後暫停,再說出「5678」。如要為特定參數套用這項設定,您必須在參數表單中設定智慧端點。
這項設定僅適用於 en-US
語言代碼,且預設為停用。
沒有語音逾時
可在代理程式、流程和頁面層級設定。
Conversational Agents (Dialogflow CX) 停止等待使用者音訊輸入的時間長度 (以秒為單位)。預設值為 5 秒,上限為 60 秒。在此逾時期間,Conversational Agents (Dialogflow CX) 會叫用無輸入事件。
插話
可在代理程式、流程和執行要求層級設定。
啟用後,使用者就能中斷 Conversational Agents (Dialogflow CX) 的回應音訊。如果中斷,Conversational Agents (Dialogflow CX) 會停止傳送音訊,並處理下一個使用者輸入內容。
如果訊息佇列中有多則訊息,且訊息是由與頁面、流程或代理程式相關聯的完成事項排入佇列,並已啟用插話功能,則佇列中的所有後續訊息也會啟用插話功能。在這種情況下,整合服務會停止播放所有已啟用插播功能的佇列訊息音訊。
允許取消播放部分回覆
只能在履行層級設定。
在「代理程式設定」>「語音和 IVR」中勾選「啟用進階語音設定」方塊,並在執行要求層級啟用部分回應,即可啟用這項設定。這項設定可取消播放部分回應。
如果訊息佇列中的訊息是由允許取消的完成動作所建立,且佇列中新增了其他訊息,系統就會取消播放該訊息。如果您希望初始訊息開始播放,但如果工作中的 Webhook 在初始訊息播放完畢前產生其他訊息,則取消播放,這時就很有用。
音訊匯出值區
可在代理程式和流程層級設定。
如果提供音訊資料,系統會將與要求相關聯的音訊資料儲存至 Cloud Storage 值區:
已儲存音訊 | 適用要求 |
---|---|
使用者音訊輸入 | DetectIntent、StreamingDetectIntent、AnalyzeContent、StreamingAnalyzeContent |
為回應合成的文字轉語音 (TTS) 音訊 | AnalyzeContent、StreamingAnalyzeContent |
將「Storage Object Creator」(Storage 物件建立者) 角色授予專案中的下列服務帳戶:
服務帳戶 (格式為
one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.com
),如果您使用合作夥伴內建電話整合。如果使用 Dialogflow CX Phone Gateway 整合服務,請將服務帳戶設為
service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com
格式。如要在 IAM 中找出這個服務帳戶,請勾選「Include Google-provided role grants」選項。
DTMF
如要進一步瞭解這項功能,請參閱 DTMF (雙音多頻訊號) 說明文件。