Speech-to-Text mithilfe des gcloud CLI transkribieren
Auf dieser Seite wird beschrieben, wie Sie mit dem gcloud
-Tool über die Befehlszeile eine Spracherkennungsanfrage an Speech-to-Text senden.
Speech-to-Text ermöglicht die einfache Einbindung von Google-Spracherkennungstechnologien in Entwickleranwendungen. Sie können Audiodaten an die Speech-to-Text API senden, die dann eine Texttranskription dieser Audiodatei zurückgibt. Weitere Informationen zu diesem Dienst finden Sie unter Spracherkennung – Grundlagen.
Hinweis
Bevor Sie eine Anfrage an die Speech-to-Text API senden können, müssen Sie die folgenden Aktionen abgeschlossen haben. Weitere Informationen finden Sie auf der Seite Vorbereitung.
- Speech-to-Text in einem GCP-Projekt aktivieren.
- Die Abrechnung für Speech-to-Text muss aktiviert sein.
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
- (Optional) Erstellen Sie einen neuen Google Cloud Storage-Bucket zum Speichern Ihrer Audiodaten.
Anfrage zur Audiotranskription stellen
Jetzt können Sie mithilfe von Speech-to-Text Audiodateien in Text transkribieren. Mit dem folgenden Codebeispiel können Sie eine recognize
-Anfrage an die Speech-to-Text API senden.
Öffnen Sie die Befehlszeilen-Shell und führen Sie den folgenden Befehl aus:
gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \ --language-code=en-US
Mit diesem Befehl wird Speech-to-Text aufgefordert, die Audiodaten einer FLAC zu transkribieren, die an einem öffentlich zugänglichen Speicherort gehostet ist.
Wenn die Anfrage erfolgreich ist, gibt der Server eine Antwort im JSON-Format zurück:
{ "results": [ { "alternatives": [ { "confidence": 0.9840146, "transcript": "how old is the Brooklyn Bridge" } ] } ] }
Glückwunsch! Sie haben Ihre erste Anfrage an Speech-to-Text gesendet.
Wenn Sie eine Fehlermeldung oder eine leere Antwort von Speech-to-Text erhalten, lesen Sie die Informationen unter Fehlerbehebung und die Schritte zur Fehlerminimierung.
Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden:
- Löschen Sie das Projekt mit der Google Cloud Console, wenn Sie es nicht benötigen.
Nächste Schritte
- Transkribieren kurzer Audiodateien üben
- Mehr über die Zusammenfassung langer Audiodateien für die Spracherkennung
- Mehr über das Transkribieren von Streamingaudio, das z. B. mit einem Mikrofon aufgenommen wurde
- Erste Schritte mit Speech-to-Text in Ihrer bevorzugten Sprache unter Verwendung einer Speech-to-Text-Clientbibliothek
- Beispielanwendungen durcharbeiten
- Für maximale Leistung, Genauigkeit und weitere Tipps die Best Practices lesen