Informações gerais
A Speech-to-Text OnDevice oferece tecnologia de fala com qualidade de servidor para dispositivos incorporados. Esse recurso permite executar reconhecimento de fala em streaming por completo no dispositivo, sem qualquer conexão com uma rede ou servidores do Google. A solução no dispositivo oferece vários benefícios para esse caso de uso em comparação com uma solução do lado do servidor: o reconhecimento de fala está disponível mesmo quando o dispositivo não está conectado à rede ou a conexão de rede é limitada e os dados do usuário não saem do dispositivo.
Principais recursos | |
---|---|
Transcrição de alta qualidade | Aplicar os algoritmos do Google ao reconhecimento automático de fala. |
Off-line | Reconhecimento de fala sem conexão com a Internet. |
Baixa latência | O reconhecimento de fala é executado rapidamente no dispositivo. |
Modelos eficientes | Implante de maneira eficiente com modelos de tamanho inferior a 1 GB que consomem recursos mínimos. |
Detecção de atividade de voz | Detecta o início e o fim da fala humana. |
Confiança | Tenha estimativas de confiança na transcrição. |
Adaptação de modelo | Aumente a precisão da transcrição de palavras ou frases raras e específicas do domínio. |
A seguir
O Speech no dispositivo é veiculada de duas maneiras, como uma biblioteca ou um servidor gRPC.
- libgspeech é uma interface de biblioteca para o Google Speech. O libgspeech fornece controle adicional de uso da memória e do gráfico de inferência que alimenta o Google Speech.
- Servidor do Speech é uma interface do servidor gRPC para o Google Speech. O servidor é adequado para usuários familiarizados com a API Cloud Speech.
Entre em contato com o Google para ter acesso.