Speech-to-Text는 단일 발화로 구성되는 음성을 인식하는 latest_short 모델을 제공합니다. 이 방법은 사용자가 긴 형태의 독백이나 음성기록이 아닌 단일 음성 명령어를 실행하는 애플리케이션에 유용할 수 있습니다.
latest_short 모델이 있는 인식기가 인식 요청에 사용된 경우 Speech-to-Text는 발화 완료를 감지한 후 인식 수행을 중지합니다. Speech-to-Text는 END_OF_SINGLE_UTTERANCE 유형의 음성 활동 이벤트 응답 다음에 텍스트 변환 결과를 반환합니다.
단일 발화 및 StreamingRecognize
StreamingRecognize 요청에 latest_short 모델 Recognizer를 선택하면 Speech-to-Text가 발화가 종료된 후 스트림을 자동으로 닫습니다.
음성 활동 이벤트 포함
StreamingRecognize 요청에 음성 활동 이벤트도 사용 설정된 경우에도 Speech-to-Text는 음성 시작/종료 음성 활동 이벤트를 반환합니다.
음성 시작에 대한 음성 활동 시간 제한이 계속 적용됩니다. 발화가 종료되는 즉시 스트림이 종료되므로 음성 종료의 음성 활동 시간 제한이 적용되지 않습니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-07-24(UTC)"],[],[],null,["# Single utterance behavior\n\n| **Preview**\n|\n|\n| This product or feature is subject to the \"Pre-GA Offerings Terms\" in the General Service Terms section\n| of the [Service Specific Terms](/terms/service-terms#1).\n|\n| Pre-GA products and features are available \"as is\" and might have limited support.\n|\n| For more information, see the\n| [launch stage descriptions](/products#product-launch-stages).\n\nSpeech-to-Text provides the `latest_short` model for recognizing speech that\nconsists of single utterances. This may be useful for applications where users\nare issuing single voice commands as opposed to long-form monologue or\ndictation.\n\nWhen a recognizer with the `latest_short` model is used for a recognition\nrequest, Speech-to-Text will stop performing recognition once it detects\nan utterance has finished. Speech-to-Text will return a speech activity\nevent response with the type `END_OF_SINGLE_UTTERANCE` followed by the\ntranscription results.\n\nSingle utterance and StreamingRecognize\n---------------------------------------\n\nIn the case where a `latest_short` model [`Recognizer`](/speech-to-text/v2/docs/reference/rest/v2/projects.locations.recognizers#Recognizer)\nis selected for a `StreamingRecognize` request, Speech-to-Text will close\nthe stream automatically after the utterance has ended.\n\n### With voice activity events\n\nIn the case where voice activity events have also been enabled for a\nStreamingRecognize request, Speech-to-Text will still return speech\nbegin/end voice activity events.\nVoice activity timeouts for speech begin will still be applied. Voice activity\ntimeouts for speech end will not be applied, since the stream will be closed as\nsoon as the utterance ends."]]