단일 발화 동작

Speech-to-Text는 단일 발화로 구성되는 음성을 인식하는 latest_short 모델을 제공합니다. 이 방법은 사용자가 긴 형태의 독백이나 음성기록이 아닌 단일 음성 명령어를 실행하는 애플리케이션에 유용할 수 있습니다.

latest_short 모델이 있는 인식기가 인식 요청에 사용된 경우 Speech-to-Text는 발화 완료를 감지한 후 인식 수행을 중지합니다. Speech-to-Text는 END_OF_SINGLE_UTTERANCE 유형의 음성 활동 이벤트 응답 다음에 텍스트 변환 결과를 반환합니다.

단일 발화 및 StreamingRecognize

StreamingRecognize 요청에 latest_short 모델 Recognizer를 선택하면 Speech-to-Text가 발화가 종료된 후 스트림을 자동으로 닫습니다.

음성 활동 이벤트 포함

StreamingRecognize 요청에 음성 활동 이벤트도 사용 설정된 경우에도 Speech-to-Text는 음성 시작/종료 음성 활동 이벤트를 반환합니다. 음성 시작에 대한 음성 활동 시간 제한이 계속 적용됩니다. 발화가 종료되는 즉시 스트림이 종료되므로 음성 종료의 음성 활동 시간 제한이 적용되지 않습니다.