Speech-to-Text mithilfe von Clientbibliotheken transkribieren
Auf dieser Seite wird beschrieben, wie Sie mithilfe der Google Cloud-Clientbibliotheken eine Spracherkennungsanfrage in Ihrer bevorzugten Programmiersprache an Speech-to-Text senden.
Speech-to-Text ermöglicht die einfache Einbindung von Google-Spracherkennungstechnologien in Entwickleranwendungen. Sie können Audiodaten an die Speech-to-Text API senden, die dann eine Texttranskription dieser Audiodatei zurückgibt. Weitere Informationen zu diesem Dienst finden Sie unter Spracherkennung – Grundlagen.
Hinweis
Bevor Sie eine Anfrage an die Speech-to-Text API senden können, müssen Sie die folgenden Aktionen abgeschlossen haben. Weitere Informationen finden Sie auf der Seite Vorbereitung.
- Speech-to-Text in einem Google Cloud-Projekt aktivieren
- Die Abrechnung für Speech-to-Text muss aktiviert sein.
-
Installieren Sie die Google Cloud CLI und initialisieren Sie sie mit folgendem Befehl:
gcloud init
-
Erstellen Sie lokale Anmeldedaten zur Authentifizierung für Ihr Google-Konto:
gcloud auth application-default login
- (Optional) Erstellen Sie einen neuen Google Cloud Storage-Bucket zum Speichern Ihrer Audiodaten.
Clientbibliothek installieren
Go
go get cloud.google.com/go/speech/apiv1
Java
Wenn Sie Maven verwenden, fügen Sie Ihrer Datei pom.xml
den folgenden Code hinzu. Weitere Informationen zu BOMs finden Sie unter The Google Cloud Platform Libraries BOM.
Wenn Sie Gradle verwenden, fügen Sie den Abhängigkeiten Folgendes hinzu:
Wenn Sie sbt nutzen, fügen Sie den Abhängigkeiten Folgendes hinzu:
Wenn Sie Visual Studio Code, IntelliJ oder Eclipse verwenden, können Sie Ihrem Projekt mithilfe der folgenden IDE-Plug-ins Clientbibliotheken hinzufügen:
Diese Plug-ins bieten zusätzliche Funktionen wie die Schlüsselverwaltung für Dienstkonten. Einzelheiten finden Sie in der Dokumentation der einzelnen Plug-ins.
Node.js
Bevor Sie die Bibliothek installieren, prüfen Sie, ob Sie Ihre Umgebung auf die Node.js-Entwicklung vorbereitet haben.
npm install --save @google-cloud/speech
Python
Bevor Sie die Bibliothek installieren, prüfen Sie, ob Sie Ihre Umgebung auf die Python-Entwicklung vorbereitet haben.
pip install --upgrade google-cloud-speech
Anfrage zur Audiotranskription stellen
Jetzt können Sie mithilfe von Speech-to-Text Audiodateien in Text transkribieren. Mit dem folgenden Code senden Sie eine recognize
-Anfrage an die Speech-to-Text API.
Go
Java
Node.js
Bevor Sie das Beispiel ausführen, prüfen Sie, ob Sie Ihre Umgebung auf die Node.js-Entwicklung vorbereitet haben.
Python
Bevor Sie das Beispiel ausführen, prüfen Sie, ob Sie Ihre Umgebung auf die Python-Entwicklung vorbereitet haben.
Glückwunsch! Sie haben Ihre erste Anfrage an Speech-to-Text gesendet.
Wenn Sie eine Fehlermeldung oder eine leere Antwort von Speech-to-Text erhalten, lesen Sie die Informationen unter Fehlerbehebung und die Schritte zur Fehlerminimierung.
Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden:
- Löschen Sie das Projekt mit der Google Cloud Console, wenn Sie es nicht benötigen.
Nächste Schritte
- Transkribieren kurzer Audiodateien üben
- Mehr über die Zusammenfassung langer Audiodateien für die Spracherkennung
- Mehr über das Transkribieren von Streamingaudio, das z. B. mit einem Mikrofon aufgenommen wurde
- Erste Schritte mit Speech-to-Text in Ihrer bevorzugten Sprache unter Verwendung einer Speech-to-Text-Clientbibliothek
- Beispielanwendungen durcharbeiten
- Für maximale Leistung, Genauigkeit und weitere Tipps die Best Practices lesen