Kurzanleitung: gcloud-Tool verwenden

Auf dieser Seite wird beschrieben, wie Sie mit dem gcloud-Tool über die Befehlszeile eine Spracherkennungsanfrage an Speech-to-Text senden.

Speech-to-Text ermöglicht die einfache Einbindung von Google-Spracherkennungstechnologien in Entwickleranwendungen. Sie können Audiodaten an die Speech-to-Text API senden, die dann eine Texttranskription dieser Audiodatei zurückgibt. Weitere Informationen zu diesem Dienst finden Sie unter Spracherkennung – Grundlagen.

Hinweis

Bevor Sie eine Anfrage an die Speech-to-Text API senden können, müssen Sie die folgenden Aktionen abgeschlossen haben. Weitere Informationen finden Sie auf der Seite Vorbereitung.

  • Speech-to-Text in einem GCP-Projekt aktivieren
    1. Die Abrechnung für Speech-to-Text muss aktiviert sein.
    2. Erstellen und/oder weisen Sie ein oder mehrere Dienstkonten für Speech-to-Text zu.
    3. Laden Sie einen Anmeldeinformationsschlüssel für das Dienstkonto herunter.
  • Legen Sie Ihre Authentifizierungsumgebungsvariable fest.
  • (Optional) Erstellen Sie einen neuen Google Cloud Storage-Bucket zum Speichern Ihrer Audiodaten.

Anfrage zur Audiotranskription stellen

Jetzt können Sie mithilfe von Speech-to-Text Audiodateien in Text transkribieren. Mit dem folgenden Codebeispiel können Sie eine recognize-Anfrage an die Speech-to-Text API senden.

Öffnen Sie die Befehlszeilen-Shell und führen Sie den folgenden Befehl aus:

gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \
    --language-code=en-US

Mit diesem Befehl wird Speech-to-Text aufgefordert, die Audiodaten einer FLAC-Datei zu transkribieren, die an einem öffentlich zugänglichen Speicherort gehostet ist.

Wenn die Anfrage erfolgreich ist, gibt der Server eine Antwort im JSON-Format zurück:

{
  "results": [
    {
      "alternatives": [
        {
          "confidence": 0.9840146,
          "transcript": "how old is the Brooklyn Bridge"
        }
      ]
    }
  ]
}

Das wars! Sie haben Ihre erste Anfrage an Speech-to-Text gesendet.

Wenn Sie eine Fehlermeldung oder eine leere Antwort von Speech-to-Text erhalten, lesen Sie die Informationen unter Fehlerbehebung und die Schritte zur Fehlerminimierung.

Weitere Informationen