Speech-to-Text mithilfe von Clientbibliotheken transkribieren
Auf dieser Seite wird beschrieben, wie Sie mithilfe der Google Cloud-Clientbibliotheken eine Spracherkennungsanfrage in Ihrer bevorzugten Programmiersprache an Speech-to-Text senden.
Speech-to-Text ermöglicht die einfache Einbindung von Google-Spracherkennungstechnologien in Entwickleranwendungen. Sie können Audiodaten an die Speech-to-Text API senden, die dann eine Texttranskription dieser Audiodatei zurückgibt. Weitere Informationen zu diesem Dienst finden Sie unter Spracherkennung – Grundlagen.
Hinweis
Bevor Sie eine Anfrage an die Speech-to-Text API senden können, müssen Sie die folgenden Aktionen abgeschlossen haben. Weitere Informationen finden Sie auf der Seite Vorbereitung.
- Speech-to-Text in einem Google Cloud-Projekt aktivieren
- Die Abrechnung für Speech-to-Text muss aktiviert sein.
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
- (Optional) Erstellen Sie einen neuen Google Cloud Storage-Bucket zum Speichern Ihrer Audiodaten.
Clientbibliothek installieren
Go
go get cloud.google.com/go/speech/apiv1
Java
If you are using Maven, add
the following to your pom.xml
file. For more information about
BOMs, see The Google Cloud Platform Libraries BOM.
If you are using Gradle, add the following to your dependencies:
If you are using sbt, add the following to your dependencies:
If you're using Visual Studio Code, IntelliJ, or Eclipse, you can add client libraries to your project using the following IDE plugins:
The plugins provide additional functionality, such as key management for service accounts. Refer to each plugin's documentation for details.
Node.js
Bevor Sie die Bibliothek installieren, prüfen Sie, ob Sie Ihre Umgebung auf die Node.js-Entwicklung vorbereitet haben.
npm install --save @google-cloud/speech
Python
Bevor Sie die Bibliothek installieren, prüfen Sie, ob Sie Ihre Umgebung auf die Python-Entwicklung vorbereitet haben.
pip install --upgrade google-cloud-speech
Anfrage zur Audiotranskription stellen
Jetzt können Sie mithilfe von Speech-to-Text Audiodateien in Text transkribieren. Mit dem folgenden Code senden Sie eine recognize
-Anfrage an die Speech-to-Text API.
Go
Java
Node.js
Bevor Sie das Beispiel ausführen, prüfen Sie, ob Sie Ihre Umgebung auf die Node.js-Entwicklung vorbereitet haben.
Python
Bevor Sie das Beispiel ausführen, prüfen Sie, ob Sie Ihre Umgebung auf die Python-Entwicklung vorbereitet haben.
Glückwunsch! Sie haben Ihre erste Anfrage an Speech-to-Text gesendet.
Wenn Sie eine Fehlermeldung oder eine leere Antwort von Speech-to-Text erhalten, lesen Sie die Informationen unter Fehlerbehebung und die Schritte zur Fehlerminimierung.
Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden:
- Löschen Sie das Projekt mit der Google Cloud Console, wenn Sie es nicht benötigen.
Nächste Schritte
- Transkribieren kurzer Audiodateien üben
- Mehr über die Zusammenfassung langer Audiodateien für die Spracherkennung
- Mehr über das Transkribieren von Streamingaudio, das z. B. mit einem Mikrofon aufgenommen wurde
- Erste Schritte mit Speech-to-Text in Ihrer bevorzugten Sprache unter Verwendung einer Speech-to-Text-Clientbibliothek
- Beispielanwendungen durcharbeiten
- Für maximale Leistung, Genauigkeit und weitere Tipps die Best Practices lesen