Überblick
Speech-to-Text On-Device aktiviert die Sprachtechnologie von Servern auf eingebetteten Geräten. Mit diesem Feature können Sie die Streamingspracherkennung vollständig auf dem Gerät ausführen, ohne dass eine Verbindung zu einem Netzwerk oder Google-Servern besteht. Die On-Device-Lösung bietet im Vergleich zu einer serverseitigen Lösung mehrere Vorteile: Die Spracherkennung ist auch dann verfügbar, wenn das Gerät nicht mit dem Netzwerk oder der Netzwerkverbindung verbunden ist, und die Daten des Nutzers verlassen das Gerät nicht.
Hauptmerkmale | |
---|---|
Hohe Qualität in der Transkription | Die Algorithmen von Google werden auf die automatische Spracherkennung angewendet. |
Offline | Spracherkennung ohne Internetverbindung |
Niedrige Latenz | Die Spracherkennung wird lokal auf dem Gerät schnell ausgeführt. |
Effiziente Modelle | Modelle mit weniger als 1 GB Größe sorgen für eine effiziente Bereitstellung mit geringem Ressourcenverbrauch. |
Erkennung der Sprachaktivitäten | Erkennt Anfang und Ende der menschlichen Sprache. |
Zuverlässigkeit | Konfidenzschätzungen zur Transkription abrufen. |
Modellanpassung | Erhöhen Sie die Transkriptionsgenauigkeit für seltene und domainspezifische Wörter oder Wortgruppen. |
Nächste Schritte
Speech-on-Device wird in zwei Varianten als Bibliothek oder gRPC-Server bereitgestellt.
- libgspeech ist eine Bibliotheksschnittstelle zu Google Speech. libgspeech bietet zusätzliche Kontrolle über die Speichernutzung und das Inferenzdiagramm, von dem Google Speech unterstützt wird.
- Der Sprachserver ist eine gRPC-Serverschnittstelle zu Google Speech. Der Server eignet sich für Nutzer, die mit der Cloud Speech API vertraut sind.
Wenden Sie sich an Google, um Zugriff zu erhalten.