Auf dieser Seite wird gezeigt, wie eine kurze Audiodatei mithilfe synchroner Spracherkennung in Text transkribiert wird.
Bei der synchronen Spracherkennung wird der erkannte Text für eine kurze Audiosequenz (unter 60 Sekunden) zurückgegeben.
Audioinhalte können direkt aus einer lokalen Datei an Speech-to-Text gesendet werden. Alternativ kann Speech-to-Text in einem Google Cloud Storage-Bucket gespeicherte Audioinhalte verarbeiten. Auf der Seite Kontingente und Limits finden Sie Limits für die Anfragen zur synchronen Spracherkennung.
Weitere Informationen zu Erkennungsmodulen und zum Senden von Erkennungsanfragen finden Sie in der Referenzdokumentation.
Synchrone Spracherkennung für eine lokale Datei ausführen
Im Folgenden finden Sie ein Beispiel für eine synchrone Spracherkennung für eine lokale Audiodatei.
Python
Synchrone Spracherkennung für eine Remotedatei durchführen
Zur Erleichterung Ihrer Arbeit kann die Speech-to-Text API die synchrone Spracherkennung direkt für eine Audiodatei in Google Cloud Storage ausführen, ohne dass Sie den Inhalt der Audiodatei im Text Ihrer Anfrage senden müssen.
Damit Speech-to-Text auf Ihre Dateien in Google Cloud Storage zugreifen kann, müssen Sie ein Dienstkonto für Speech-to-Text erstellen und diesem Konto Lesezugriff auf das entsprechende Speicherobjekt gewähren. Führen Sie in Cloud Shell den folgenden Befehl aus, um ein Dienstkonto zu erstellen und aufzurufen, falls es nicht vorhanden ist.
gcloud beta services identity create --service=speech.googleapis.com \ --project=PROJECT_ID
Wenn Sie aufgefordert werden, die Komponente gcloud Beta Commands zu installieren, geben Sie Y
ein. Nach der Installation wird der Befehl automatisch neu gestartet.
Die Dienstkonto-ID ist wie eine E-Mail-Adresse formatiert:
Service identity created: service-xxx@gcp-sa-speech.iam.gserviceaccount.com
Gewähren Sie diesem Konto Lesezugriff auf das relevante Speicherobjekt, auf dem Sie die Erkennung ausführen möchten.
Weitere Informationen zur Verwaltung des Zugriffs auf Google Cloud Storage finden Sie unter Zugriffssteuerungslisten erstellen und verwalten in der Google Cloud Storage-Dokumentation.
Hier ist ein Beispiel für die Durchführung einer synchronen Spracherkennung für eine Datei in Cloud Storage:
Python