일부 제품과 기능의 이름이 변경되고 있습니다. 생성형 플레이북 및 흐름 기능도 단일 통합 콘솔로 마이그레이션되고 있습니다. 세부정보를 참조하세요.

이 페이지는 Cloud Translation API를 통해 번역되었습니다.

고급 음성 설정

이 가이드에서는 음성 기능을 위한 추가적인 고급 설정을 제공합니다. 에이전트 설정 > 음성 및 IVR > Speech-to-Text > 고급 음성 설정으로 이동하여 이러한 고급 설정을 사용 설정하거나 중지할 수 있습니다.

이러한 설정은 에이전트 설정(전체 에이전트에 적용), 흐름 설정(전체 흐름에 적용되고 에이전트 설정을 재정의), 페이지 설정(페이지에 적용되고 흐름 및 에이전트 설정을 재정의), fulfillment 설정(fulfillment에 적용되고 페이지, 흐름, 에이전트 설정 재정의)에서 사용 가능합니다. 이러한 설정의 하위 집합은 수준의 설정 관련성에 따라 각 수준에서 사용 가능합니다. *하위 수준에서 이러한 설정을 구성하려면 먼저 에이전트 수준(에이전트 설정 > 음성 및 IVR > Speech-to-Text > 고급 음성 설정)에서 고급 음성 설정 사용 설정 체크박스를 선택해야 합니다.*

이러한 하위 수준에서 맞춤설정 옵션을 선택하면 업데이트된 에이전트 수준 설정은 흐름, 페이지, fulfillment 수준에 전파되지 않습니다. 맞춤설정 옵션에 여러 설정이 있으며 일부 설정만 업데이트하려는 경우 에이전트 수준 설정과 동일하게 하려면 다른 설정을 업데이트해야 할 수 있습니다.

수준별 설정 가용성

다음 표에서는 각 수준에서 사용할 수 있는 고급 음성 설정을 보여줍니다.

설정 이름	상담사	흐름	페이지	Fulfillment
모델 선택(Speech-to-Text)	✔	✔	✔
음성 종료 민감도	✔	✔	✔
고급 제한 시간 기반 음성 종료 민감도	✔	✔	✔
스마트 엔드포인트 사용 설정	✔
음성 중지 제한 시간	✔	✔	✔
통화 참여	✔	✔		✔
부분 응답 재생 취소 허용				✔
오디오 내보내기 버킷	✔	✔
DTMF	✔	✔	✔

모델 선택(Speech-to-Text)

에이전트, 흐름, 페이지 수준에서 설정할 수 있습니다.

음성 인식에 사용되는 음성 모델을 설정합니다. 이 설정은 언어별로 적용되므로 언어마다 다른 모델을 선택할 수 있습니다. 또한 요청 수준 음성 모델 재정의를 선택하면 런타임 API 호출에서 다른 모델을 지정하더라도 선택한 모델이 사용됩니다.

대화형 에이전트(Dialogflow CX) Phone Gateway에 대한 제한사항을 참조하세요. 자세한 내용은 음성 모델을 참조하세요.

음성 종료 민감도

에이전트, 흐름, 페이지 수준에서 설정할 수 있습니다.

최종 사용자 오디오 입력에서 음성 종료를 인식하는 민감도를 제어합니다. 값의 범위는 0(낮은 민감도, 음성이 종료될 가능성이 작음)부터 100(높은 민감도, 음성이 종료될 가능성이 높음)까지입니다.

고급 제한 시간 기반 음성 종료 민감도

에이전트 수준에서 설정하고 흐름 및 페이지 수준에서 중지할 수 있습니다.

이 설정을 사용 설정하면 음성 종료 민감도 설정 값이 음성 종료를 결정하는 상대 오디오 무음 제한 시간을 설정할 수 있는 게이지로 사용됩니다. 이 설정이 사용 중지되면 (기본값) 음성 종료 민감도 설정 값이 Google Cloud Speech-to-Text에서 제공하는 ML 모델로 음성 종료를 결정하는 데 사용됩니다.

반면 음성 종료 민감도 설정은 기본적으로 en-US 언어 태그의 phone_call 음성 모델만 지원하며 제한 시간 기반의 고급 음성 종료 민감도 사용 설정 설정을 사용하면 Dialogflow에서 지원하는 모든 언어와 음성 모델의 음성 종료 민감도를 구성할 수 있습니다.

스마트 엔드포인트 사용 설정

에이전트 수준에서만 설정할 수 있습니다.

이 설정을 사용 설정하면 대화형 에이전트(Dialogflow CX)에서 부분적인 사용자 입력을 분석하여 음성 종료를 결정합니다. 예를 들어 사용자가 '내가 원하는 것은'이라고 말하고 잠시 멈추면 대화형 에이전트(Dialogflow CX)는 사용자가 문장을 계속 말할 때까지 기다립니다.

이는 사용자가 '1234'라고 말한 후 '5678'이라고 말하기 전에 잠시 멈출 수 있는 숫자 파라미터 수집에 특히 유용합니다. 특정 파라미터에 이 설정을 적용하려면 스마트 엔드포인트를 파라미터 형식으로 설정해야 합니다.

이 설정은 en-US 언어 태그에만 사용 가능하며 기본적으로 중지되어 있습니다.

음성 중지 제한 시간

에이전트, 흐름, 페이지 수준에서 설정할 수 있습니다.

대화형 에이전트(Dialogflow CX)에서 최종 사용자 오디오 입력 대기를 중지하는 기간(초)입니다. 기본값은 5초이며 최댓값은 60초입니다. 이 제한 시간 동안 대화형 에이전트(Dialogflow CX)가 입력 없음 이벤트를 호출합니다.

통화 참여

에이전트, 흐름, fulfillment 수준에서 설정할 수 있습니다.

사용 설정하면 최종 사용자가 대화형 에이전트(Dialogflow CX) 응답 오디오를 중단할 수 있습니다. 중단하면 대화형 에이전트(Dialogflow CX)에서 오디오 전송을 중지하고 다음 최종 사용자 입력을 처리합니다.

메시지 큐에 메시지가 여러 개 있고 통화 참여가 사용 설정된 페이지, 흐름 또는 에이전트와 연결된 fulfillment에서 메시지가 큐에 추가되면 큐의 다음 모든 메시지에서도 통화 참여가 사용 설정됩니다. 이 경우 통합 시 통화 참여가 사용 설정된 큐에 추가된 모든 메시지의 오디오 재생이 중지됩니다.

부분 응답 재생 취소 허용

fulfillment 수준에서만 설정할 수 있습니다.

에이전트 설정 > 음성 및 IVR에서 고급 음성 설정 사용 설정 체크박스가 선택되어 있고 fulfillment 수준에서 부분 응답이 사용 설정되면 이 설정을 사용 설정할 수 있습니다. 이 설정을 사용하면 부분 응답 재생을 취소할 수 있습니다.

메시지 큐의 메시지가 취소를 허용하는 fulfillment에 의해 생성된 경우 다른 메시지가 큐에 추가되면 메시지 재생이 취소됩니다. 초기 메시지 재생을 시작하려고 하지만 작동 중인 웹훅에서 초기 메시지 재생이 완료되기 전에 다른 메시지를 생성하면 재생을 취소하려는 경우에 유용합니다.

오디오 내보내기 버킷

에이전트 및 흐름 수준에서 설정할 수 있습니다.

제공되는 경우 요청과 연결된 모든 오디오 데이터가 Cloud Storage 버킷에 저장됩니다.

저장되는 오디오	적용 가능한 요청
최종 사용자 오디오 입력	DetectIntent, StreamingDetectIntent, AnalyzeContent, StreamingAnalyzeContent
응답을 위해 합성된 Text-to-Speech(TTS) 오디오	AnalyzeContent, StreamingAnalyzeContent

프로젝트의 다음 서비스 계정에 스토리지 객체 생성자 역할을 부여합니다.

파트너 기본 제공 전화 통합을 사용하는 경우 one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.com 형식의 서비스 계정
Dialogflow CX 전화 게이트웨이 통합을 사용하는 경우 service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com 형식의 서비스 계정에 연결합니다. IAM에서 이 서비스 계정을 찾으려면 Google 제공 역할 부여 포함 옵션을 선택합니다.

DTMF

이 기능에 대한 자세한 내용은 DTMF(Dual-tone multi-frequency signaling) 문서를 참조하세요.

음성 적응

2024년 1분기 음성 모델 마이그레이션