Mit der Console Audioinhalte aus Text erstellen

In dieser Kurzanleitung wird die Cloud Text-to-Speech-Konsole vorgestellt. In dieser Kurzanleitung erstellen Sie Audioinhalte aus Text und erfahren, wie Sie diese Audioinhalte für Ihre eigenen Anwendungen wiedergeben, herunterladen und aktualisieren.

Weitere Informationen zu den grundlegenden Konzepten von Text-to-Speech finden Sie unter Grundlagen von Text-to-Speech.

Hinweise

Bevor Sie die Text-to-Speech-Konsole verwenden können, müssen Sie die API in der Google Cloud -Konsole aktivieren. Die unten stehenden Schritte führen Sie durch die folgenden Aktionen:

  • Text-to-Speech für ein Projekt aktivieren.
  • Die Abrechnung muss für Text-to-Speech aktiviert sein.

Ihr Google Cloud -Projekt einrichten

  1. In der Google Cloud Console anmelden

  2. Zur Projektauswahlseite

    Sie können entweder ein vorhandenes Projekt auswählen oder ein neues erstellen. Weitere Informationen zum Erstellen eines Projekts finden Sie in der Google Cloud Platform-Dokumentation.

  3. Wenn Sie ein neues Projekt erstellen, werden Sie aufgefordert, ein Abrechnungskonto mit diesem Projekt zu verknüpfen. Wenn Sie ein bereits vorhandenes Projekt verwenden, muss die Abrechnung aktiviert sein.

    So prüfen Sie, ob die Abrechnung für Ihr Projekt aktiviert ist

  4. Nachdem Sie ein Projekt ausgewählt und mit einem Rechnungskonto verknüpft haben, können Sie die Text-to-Speech API aktivieren. Öffnen Sie oben auf der Seite die Leiste Produkte und Ressourcen suchen und geben Sie "text-to-speech" ein.

  5. Wählen Sie aus der Liste der Ergebnisse die Cloud Text-to-Speech API aus.

  6. Wenn Sie Text-to-Speech testen möchten, ohne es mit Ihrem Projekt zu verknüpfen, wählen Sie die Option DIESE API TESTEN. Klicken Sie auf AKTIVIEREN, um die Text-to-Speech API für Ihr Projekt zu aktivieren.

Audio aus Text erstellen

So erstellen Sie mit der Google Cloud Console Audioinhalte aus Text:

Text oder SSML eingeben

  1. Öffnen Sie die Seite Text-to-Speech – Synthetisieren.

    Screenshot der Seite „Text-to-Speech-Synthetisierung“

  2. Geben Sie Text oder SSML ein. Sie können entweder Nur-Text-Dateien synthetisieren oder die Speech Synthesis Markup Language (SSML) verwenden, um die Audio-Antwort benutzerdefiniert anzupassen.

  3. Wählen Sie die Sprache für Ihren Text oder Ihre SSML aus. Dies ist die Sprache, die für die Synthese verwendet wird.

  4. Wählen Sie die Stimme aus, die für die Synthese verwendet werden soll. Die Sprachfunktionen, -merkmale und -kosten können variieren.

Erweiterte Einstellungen (optional)

  1. Optional können Sie den Abschnitt Erweiterte Einstellungen maximieren, um weitere Eigenschaften des zu erstellenden Audios zu konfigurieren.

  2. Geben Sie zusätzliche Merkmale der synthetisierten Audioinhalte an, z. B. Sprache und Tonhöhe.

    Screenshot der Seite „Text-to-Speech-Synthetisierung Teil 2“

  3. Klicken Sie unten auf Synthetisieren, um die synthetisierten Audioinhalte zu erstellen.

Audio überprüfen

Je nach Eingabe kann es Sekunden bis Minuten dauern, bis die synthetische Audioausgabe erstellt ist. Nachdem die Audioinhalte erstellt wurden, kann sie überprüft werden.

  1. Klicken Sie auf die Player-Steuerelemente, um das Audio abzuspielen.

    Screenshot der Seite „Text-to-Speech-Synthetisierung Teil 3“

  2. Klicken Sie auf Herunterladen, um die Audiodatei lokal herunterzuladen.

Bereinigen

Löschen Sie das Projekt mit Google Cloud console , wenn Sie es nicht benötigen, um unnötige Google Cloud Kosten zu vermeiden.

Nächste Schritte