Cloud Speech-to-Text 온디바이스

개요

Speech-to-Text 온디바이스는 내장형 기기에서 서버 품질의 음성 기술을 지원합니다. 이 기능을 사용하면 네트워크 또는 Google 서버에 연결하지 않고 완전히 기기 내에서 스트리밍 음성 인식을 실행할 수 있습니다. 온디바이스 솔루션은 서버 측 솔루션과 비교할 때 이 사용 사례에 대해 몇 가지 이점을 제공합니다. 즉, 기기가 네트워크에 연결되지 않았거나 네트워크 연결이 제한적일 때에도 음성 인식을 사용할 수 있고 사용자 데이터가 기기를 벗어나지 않습니다.

주요 기능
고품질 텍스트 변환 자동 음성 인식에 Google 알고리즘을 적용합니다.
오프라인 인터넷 연결 없이 음성 인식
짧은 지연 시간 기기에서 로컬로 음성 인식을 빠르게 실행
효율적인 모델 크기가 1GB 미만이며 리소스를 최소한으로 사용하는 모델을 통해 효율적으로 배포할 수 있습니다.
음성 활동 감지 사람의 음성의 시작과 끝을 감지합니다.
신뢰도 스크립트에 대한 신뢰도를 예상합니다.
모델 적응 많이 쓰이지 않는 분야별 단어 또는 어구의 스크립트 작성 정확도를 향상합니다.

다음 단계

Speech On-Device는 라이브러리 또는 gRPC 서버의 두 가지 버전으로 제공됩니다.

  1. libgspeech는 Google Speech에 대한 라이브러리 인터페이스입니다. libgspeech는 메모리 사용 및 Google Speech를 지원하는 추론 그래프에 대한 추가 제어를 제공합니다.
  2. 음성 서버는 Google Speech에 대한 gRPC 서버 인터페이스입니다. 이 서버는 Cloud Speech API에 익숙한 사용자에게 적합합니다.

액세스하려면 Google에 문의하세요.