음성 적응을 사용하면 Speech-to-Text에서 가져온 스크랩트 작성 결과의 정확도를 향상시킬 수 있습니다. 음성 적응 기능을 사용하면 오디오 데이터에서 다른 경우에 추천될 수 있는 대안보다 STT가 더 자주 인식해야 하는 단어 또는 문구를 지정할 수 있습니다. 음성 적응은 다음과 같은 경우에 스크랩트 작성 정확도를 향상시키는 데 특히 유용합니다.
- 오디오에 매우 자주 나타날 가능성이 높은 단어/문구가 포함되어 있는 경우
- 고유 이름과 같이 일반적인 오디오에 포함될 가능성이 높지 않은 사용 빈도가 낮은 단어가 오디오에 포함될 가능성이 높은 경우
- 오디오에 노이즈가 있거나 명확하게 들리지 않는 경우
음성 적응 및 음성 적응 부스트 권장사항 정보는 음성 적응 개념 페이지를 참조하세요.
다음 코드 샘플은 Speech-to-Text API로 전송되는 요청에 음성 컨텍스트를 설정하여 스크랩트 작성 정확도를 향상시키는 방법을 보여줍니다. 사용 중인 언어에 사용 가능한 클래스 목록은 클래스 토큰 페이지를 참조하세요.
REST 및 명령줄
자세한 내용은 speech:recognize
API 엔드포인트를 참조하세요.
요청 데이터를 사용하기 전에 다음을 바꿉니다.
- language-code: 오디오 클립에서 사용된 언어의 BCP-47 코드입니다.
- phrases-to-boost: Speech-to-Text에서 부스트할 구문이 포함된 문자열 배열입니다.
- storage-bucket: Cloud Storage 버킷입니다.
- input-audio: 변환할 오디오 데이터입니다.
HTTP 메서드 및 URL:
POST https://speech.googleapis.com/v1p1beta1/speech:recognize
JSON 요청 본문:
{ "config":{ "languageCode":"language-code", "speechContexts":[{ "phrases":[phrases-to-boost], "boost": 2 }] }, "audio":{ "uri":"gs:storage-bucket/input-file" } }
요청을 보내려면 다음 옵션 중 하나를 펼칩니다.
다음과 비슷한 JSON 응답이 표시됩니다.
{ "results": [ { "alternatives": [ { "transcript": "When deciding whether to bring an umbrella, I consider the weather", "confidence": 0.9463943 } ], "languageCode": "en-us" } ] }
자바
Node.js
Python
Go