Cloud Speech-to-Text On-Device

Überblick

Speech-to-Text On-Device aktiviert die Sprachtechnologie von Servern auf eingebetteten Geräten. Mit diesem Feature können Sie die Streamingspracherkennung vollständig auf dem Gerät ausführen, ohne dass eine Verbindung zu einem Netzwerk oder Google-Servern besteht. Die On-Device-Lösung bietet im Vergleich zu einer serverseitigen Lösung mehrere Vorteile: Die Spracherkennung ist auch dann verfügbar, wenn das Gerät nicht mit dem Netzwerk oder der Netzwerkverbindung verbunden ist, und die Daten des Nutzers verlassen das Gerät nicht.

Hauptmerkmale
Hohe Qualität in der Transkription Die Algorithmen von Google werden auf die automatische Spracherkennung angewendet.
Offline Spracherkennung ohne Internetverbindung
Niedrige Latenz Die Spracherkennung wird lokal auf dem Gerät schnell ausgeführt.
Effiziente Modelle Modelle mit weniger als 1 GB Größe sorgen für eine effiziente Bereitstellung mit geringem Ressourcenverbrauch.
Erkennung der Sprachaktivitäten Erkennt Anfang und Ende der menschlichen Sprache.
Zuverlässigkeit Konfidenzschätzungen zur Transkription abrufen.
Modellanpassung Erhöhen Sie die Transkriptionsgenauigkeit für seltene und domainspezifische Wörter oder Wortgruppen.

Nächste Schritte

Speech-on-Device wird in zwei Varianten als Bibliothek oder gRPC-Server bereitgestellt.

  1. libgspeech ist eine Bibliotheksschnittstelle zu Google Speech. libgspeech bietet zusätzliche Kontrolle über die Speichernutzung und das Inferenzdiagramm, von dem Google Speech unterstützt wird.
  2. Der Sprachserver ist eine gRPC-Serverschnittstelle zu Google Speech. Der Server eignet sich für Nutzer, die mit der Cloud Speech API vertraut sind.

Wenden Sie sich an Google, um Zugriff zu erhalten.