Speech-to-Text mithilfe der Google Cloud Console transkribieren

In dieser Kurzanleitung wird die Cloud Speech-to-Text-Konsole vorgestellt. In dieser Kurzanleitung erstellen und optimieren Sie eine Transkription und erfahren, wie Sie diese Konfiguration mit der Speech-to-Text API für Ihre eigenen Anwendungen verwenden.

Wie Sie Anfragen senden und Antworten mithilfe der REST API statt der Console senden, erfahren Sie unter Hinweise.

Hinweis

Bevor Sie die Speech-to-Text-Konsole verwenden können, müssen Sie die API in der Google Cloud Platform Console aktivieren. Die unten stehenden Schritte führen Sie durch die folgenden Aktionen:

  • Speech-to-Text in einem Projekt aktivieren.
  • Die Abrechnung für Speech-to-Text muss aktiviert sein.

Google Cloud-Projekt einrichten

  1. Melden Sie sich in der Google Cloud Console an.

  2. Zur Projektauswahl

    Sie können entweder ein vorhandenes Projekt auswählen oder ein neues erstellen. Weitere Informationen zum Erstellen eines Projekts finden Sie in der Google Cloud Platform-Dokumentation.

  3. Wenn Sie ein neues Projekt erstellen, werden Sie aufgefordert, ein Abrechnungskonto mit diesem Projekt zu verknüpfen. Wenn Sie ein bereits vorhandenes Projekt verwenden, muss die Abrechnung aktiviert sein.

    So prüfen Sie, ob die Abrechnung für Ihr Projekt aktiviert ist

  4. Nachdem Sie ein Projekt ausgewählt und mit einem Rechnungskonto verknüpft haben, können Sie die Speech-to-Text API aktivieren. Öffnen Sie oben auf der Seite die Leiste Produkte und Ressourcen suchen und geben Sie speech ein.

  5. Wählen Sie in der Ergebnisliste die Cloud Speech-to-Text API aus.

  6. Wenn Sie Speech-to-Text ausprobieren möchten, ohne es mit Ihrem Projekt zu verknüpfen, wählen Sie die Option DIESE API TESTEN aus. Klicken Sie auf AKTIVIEREN, um die Speech-to-Text API für die Verwendung mit Ihrem Projekt zu aktivieren.

Transkription erstellen

Verwenden Sie die Google Cloud Console, um eine neue Transkription zu erstellen:

Audiokonfiguration

  1. Öffnen Sie die Übersicht über Speech-to-Text.

    Screenshot der Übersichtsseite von Speech-to-Text

  2. Klicken Sie auf Transkription erstellen.

    • Wenn Sie die Konsole zum ersten Mal verwenden, werden Sie aufgefordert, auszuwählen, wo in Cloud Storage Ihre Konfigurationen und Transkriptionen gespeichert werden sollen.
      Screenshot der Speech-to-Text-Seite "Transkript erstellen"
  3. Laden Sie auf der Seite Transkription erstellen eine Quell-Audiodatei hoch. Sie können eine Datei auswählen, die bereits in Cloud Storage gespeichert ist, oder eine neue in Ihr angegebenes Cloud Storage-Ziel hochladen.

  4. Wählen Sie den Codierungstyp der hochgeladenen Audiodatei aus.

  5. Legen Sie die Abtastrate fest.

  6. Klicken Sie auf Weiter. Sie werden zu Transkriptionsoptionen weitergeleitet.

Transkriptionsoptionen

  1. Wählen Sie den Sprachcode des Audioquells aus. Dies ist die Sprache, die in der Aufzeichnung gesprochen wird.

  2. Wählen Sie das Transkriptionsmodell aus, das Sie für die Datei verwenden möchten. Die Standardoption ist vorab ausgewählt. Im Allgemeinen ist keine Änderung erforderlich. Das Abgleichen des Modells mit der Art der Audiodaten kann jedoch zu einer höheren Genauigkeit führen. Die Modellkosten variieren.

    Screenshot der Speech-to-Text-Seite "Transkript erstellen"

  3. Klicken Sie auf Weiter. Sie werden zu Modellanpassung weitergeleitet.

Modellanpassung (optional)

Wenn Ihre Quell-Audioinhalte seltene Wörter, Eigennamen oder proprietäre Begriffe enthalten und Sie bei der Erkennung auf Probleme stoßen, kann die Modellanpassung hilfreich sein.

  1. Klicken Sie das Kästchen Modellanpassung aktivieren an.

  2. Wählen Sie Einmalige Anpassungsressource aus.

  3. Fügen Sie relevante Wortgruppen hinzu und weisen Sie ihnen einen Optimierungswert zu.

    Screenshot der Speech-to-Text-Seite "Transkript erstellen"

  4. Klicken Sie in der linken Spalte auf Senden, um die Transkription zu erstellen.

Transkription prüfen

Je nach Größe der Audiodatei kann die Transkription zwischen Minuten und Stunden dauern. Nachdem die Transkription erstellt wurde, kann sie überprüft werden. Wenn Sie die Tabelle nach Zeitstempel sortieren, können Sie Ihre letzten Transkriptionen ganz einfach finden.

  1. Klicken Sie auf den Namen der Transkription, die Sie sich ansehen möchten.

    Screenshot der Seite "Speech-to-Text-Transkriptionsliste"
  2. Vergleichen Sie den Transkriptionstext mit der Audiodatei.

    Screenshot der Seite "Speech-to-Text-Transkriptionsliste"
  3. Wenn Sie Änderungen vornehmen möchten, klicken Sie auf Konfiguration wiederverwenden. Dadurch gelangen Sie zum Ablauf Transkription erstellen mit denselben vorgewählten Optionen, damit Sie ein paar Dinge ändern, eine neue Transkription erstellen und die Ergebnisse vergleichen können.

Nächste Schritte