개요
Speech-to-Text 온디바이스는 내장형 기기에서 서버 품질의 음성 기술을 지원합니다. 이 기능을 사용하면 네트워크 또는 Google 서버에 연결하지 않고 완전히 기기 내에서 스트리밍 음성 인식을 실행할 수 있습니다. 온디바이스 솔루션은 서버 측 솔루션과 비교할 때 이 사용 사례에 대해 몇 가지 이점을 제공합니다. 즉, 기기가 네트워크에 연결되지 않았거나 네트워크 연결이 제한적일 때에도 음성 인식을 사용할 수 있고 사용자 데이터가 기기를 벗어나지 않습니다.
주요 기능 | |
---|---|
고품질 텍스트 변환 | 자동 음성 인식에 Google 알고리즘을 적용합니다. |
오프라인 | 인터넷 연결 없이 음성 인식 |
짧은 지연 시간 | 기기에서 로컬로 음성 인식을 빠르게 실행 |
효율적인 모델 | 크기가 1GB 미만이며 리소스를 최소한으로 사용하는 모델을 통해 효율적으로 배포할 수 있습니다. |
음성 활동 감지 | 사람의 음성의 시작과 끝을 감지합니다. |
신뢰도 | 스크립트에 대한 신뢰도를 예상합니다. |
모델 적응 | 많이 쓰이지 않는 분야별 단어 또는 어구의 스크립트 작성 정확도를 향상합니다. |
다음 단계
Speech On-Device는 라이브러리 또는 gRPC 서버의 두 가지 버전으로 제공됩니다.
- libgspeech는 Google Speech에 대한 라이브러리 인터페이스입니다. libgspeech는 메모리 사용 및 Google Speech를 지원하는 추론 그래프에 대한 추가 제어를 제공합니다.
- 음성 서버는 Google Speech에 대한 gRPC 서버 인터페이스입니다. 이 서버는 Cloud Speech API에 익숙한 사용자에게 적합합니다.
액세스하려면 Google에 문의하세요.