Mit der Konsole Audioinhalte aus Text erstellen

In dieser Kurzanleitung wird die Cloud Text-to-Speech Console vorgestellt. In dieser Kurzanleitung erstellen Sie Audiodaten aus Text und erfahren, wie Sie diese Audiodaten für Ihre eigenen Anwendungen wiedergeben, herunterladen und aktualisieren.

Weitere Informationen zu den grundlegenden Konzepten von Text-to-Speech finden Sie unter Grundlagen von Text-to-Speech.

Hinweis

Bevor Sie die Text-to-Speech-Konsole verwenden können, müssen Sie die API in der Google Cloud Console aktivieren. Die unten stehenden Schritte führen Sie durch die folgenden Aktionen:

  • Text-to-Speech für ein Projekt aktivieren.
  • Die Abrechnung muss für Text-to-Speech aktiviert sein.

Google Cloud-Projekt einrichten

  1. Melden Sie sich in der Google Cloud Console an.

  2. Zur Projektauswahlseite

    Sie können entweder ein vorhandenes Projekt auswählen oder ein neues erstellen. Weitere Informationen zum Erstellen eines Projekts finden Sie in der Google Cloud Platform-Dokumentation.

  3. Wenn Sie ein neues Projekt erstellen, werden Sie aufgefordert, ein Abrechnungskonto mit diesem Projekt zu verknüpfen. Wenn Sie ein bereits vorhandenes Projekt verwenden, muss die Abrechnung aktiviert sein.

    So prüfen Sie, ob die Abrechnung für Ihr Projekt aktiviert ist

  4. Nachdem Sie ein Projekt ausgewählt und mit einem Rechnungskonto verknüpft haben, können Sie die Text-to-Speech API aktivieren. Öffnen Sie oben auf der Seite die Leiste Produkte und Ressourcen suchen und geben Sie "text-to-speech" ein.

  5. Wählen Sie aus der Liste der Ergebnisse die Cloud Text-to-Speech API aus.

  6. Wenn Sie Text-to-Speech testen möchten, ohne es mit Ihrem Projekt zu verknüpfen, wählen Sie die Option DIESE API TESTEN. Klicken Sie auf AKTIVIEREN, um die Text-to-Speech API für Ihr Projekt zu aktivieren.

Audioinhalte aus Text erstellen

Verwenden Sie die Google Cloud Console, um Audioinhalte aus Text zu erstellen:

Text oder SSML eingeben

  1. Öffnen Sie die Seite Text-to-Speech-Synthetisierung.

    Screenshot der Seite „Text-to-Speech-Synthetisierung“

  2. Geben Sie Ihren Text oder SSML ein. Sie können entweder nur Text synthetisieren oder die Speech Synthesis Markup Language (SSML) verwenden, um die Audioantwort individuell anzupassen.

  3. Wählen Sie die Sprache des Texts oder SSML aus. Dies ist die Sprache, die für die Synthese verwendet wird.

  4. Wählen Sie die Stimme aus, die Sie für die Synthese verwenden möchten. Die Sprachfunktionen, -merkmale und -kosten können variieren.

Erweiterte Einstellungen (optional)

  1. Maximieren Sie optional den Bereich Erweiterte Einstellungen, um weitere Attribute der Audiodaten zu konfigurieren, die Sie erstellen möchten.

  2. Geben Sie zusätzliche Merkmale der synthetisierten Audioinhalte an, z. B. Sprache und Tonhöhe.

    Screenshot der Seite „Text-to-Speech-Synthetisierung Teil 2“

  3. Klicken Sie unten auf Synthetisieren, um die synthetisierten Audioinhalte zu erstellen.

Audio prüfen

Je nach Eingabe kann die Erstellung der synthetisierten Audioinhalte zwischen Sekunden und Minuten dauern. Nachdem die Audioinhalte erstellt wurden, kann sie überprüft werden.

  1. Klicken Sie auf die Steuerelemente des Players, um die Audioinhalte abzuspielen.

    Screenshot der Seite „Text-to-Speech-Synthetisierung Teil 3“

  2. Klicken Sie auf Herunterladen, um die Audiodatei lokal herunterzuladen.

Bereinigen

Löschen Sie das Projekt mit der Google Cloud Console, wenn Sie es nicht benötigen. Damit vermeiden Sie unnötige Kosten für Google Cloud.

Nächste Schritte