Cloud Text-to-Speech
Durch maschinelles Lernen unterstützte Umwandlung von Text in Sprache
Kostenlos testen Dokumentation ansehenHochwertige Sprachsynthese
Google Cloud Text-to-Speech konvertiert Text in natürlich klingende Sprache mit mehr als 180 Stimmen in über 30 Sprachen und Sprachvarianten. Unter Anwendung der bahnbrechenden Forschung im Bereich der Sprachsynthese (WaveNet) und der leistungsstarken neuronalen Netzwerke von Google werden erstklassige Audiodaten produziert. Diese nutzerfreundliche API ermöglicht naturgetreue Interaktionen mit Ihren Nutzern, die den Kundendienst, die Interaktion mit Geräten und andere Anwendungsbereiche transformieren.
Konvertieren Sie Ihren Text jetzt in Sprache
Geben Sie Ihren Text ein, wählen Sie eine Sprache aus und klicken Sie auf "Speak It", um ihn anzuhören.
Maschinelles Lernen von Google
Wenden Sie fortgeschrittene Algorithmen des neuronalen Deep-Learning-Netzes an, um Sprache aus Text in einer Vielzahl von Stimmen und Sprachen zu synthetisieren. Unsere neuronalen Netzwerke basieren auf dem Sprachsynthese-Know-how von Google.
Auswahl aus über 180 Stimmen
Google Cloud Text-to-Speech bietet eine Auswahl von mehr als 180 Stimmen in über 30 Sprachen und Sprachvarianten. Entwickler können so die Stimme auswählen, die am besten zu ihrer Anwendung passt.
Einschließlich exklusiver Zugriff auf WaveNet-Technologie
DeepMind hat bahnbrechende Forschungsarbeit zu Modellen für maschinelles Lernen geleistet und erzeugt so Sprache, die menschliche Stimmen nachahmt und natürlicher klingt. Durch diese Forschung wird die Lücke zum menschlichen Sprechen um mehr als 70 % reduziert. Cloud Text-to-Speech bietet exklusiven Zugriff auf mehr als 90 WaveNet-Stimmen und im Laufe der Zeit werden noch weitere dazukommen.
Einfache Integration in vorhandene Anwendungen und Geräte
Cloud Text-to-Speech unterstützt alle Anwendungen und Geräte, die eine REST- oder gRPC-Anfrage senden können, darunter Smartphones, PCs, Tablets und IoT-Geräte wie Autos, Fernseher oder Lautsprecher.
Unterstützt viele gängige Anwendungsfälle
Google Cloud Text-to-Speech ist eine einfach zu verwendende API, die eine flexible Lösung zur Erstellung natürlich klingender Sprache für viele Anwendungsfälle bietet. Gängige Anwendungsfälle sind beispielsweise die Automatisierung von Callcentern, interaktive Antworten von IoT-Geräten oder die Umwandlung von Text in Audio, um Inhalte im Audioformat anzubieten.
Features von Cloud Text-to-Speech
- Mehrsprachig
- Unterstützung von 180 Stimmen in über 30 Sprachen und Sprachvarianten. Weitere folgen demnächst.
- WaveNet-Stimmen
- Exklusiver Zugriff auf WaveNet-Stimmen von DeepMind in verschiedenen Sprachen; diese bieten äußerst natürliche Sprache.
- Unterstützung von Text und SSML
- Passen Sie Ihre Sprache mithilfe von SSML-Tags an, mit denen Sie Pausen, Zahlen, Formatierung von Datum und Uhrzeit sowie andere Befehle zur Aussprache hinzufügen können.
- Einstellung der Sprechgeschwindigkeit
- Passen Sie Ihre Sprechgeschwindigkeit auf ein viermal schnelleres oder langsameres Tempo als die normale Geschwindigkeit an.
- Einstellung der Tonlage
- Passen Sie die Tonlage Ihrer ausgewählten Stimme um bis zu 20 Halbtöne über oder unter der Standardausgabe an.
- Lautstärkeregelung
- Erhöhen Sie die Lautstärke der Ausgabe um bis zu 16 dB oder verringern Sie die Lautstärke um bis zu -96 dB.
- Flexibilität im Audioformat
- Wählen Sie aus einer Reihe von Audioformaten, einschließlich MP3, Linear16 und Ogg Opus.
- Audioprofile
- Optimieren Sie Audioprofile für die Art von Lautsprecher, über den die Audiodatei ausgegeben werden soll, wie z. B. Kopfhörer oder Telefonleitungen.
Preise für Cloud Text-to-Speech
Hochwertige Sprachsynthese
Preise für Cloud Text-to-Speech werden nach der kostenlosen Stufe pro 1 Million Zeichen an verarbeitetem Text berechnet. Weitere Informationen finden Sie in unserer Preisübersicht.
| Feature | Kostenloses Monatskontingent | Kostenpflichtige Nutzung |
|---|---|---|
| Standardstimmen (alle außer WaveNet) | 0 bis 4 Millionen Zeichen | 4,00 $/1 Million Zeichen |
| WaveNet-Stimmen | 0 bis 1 Million Zeichen | 16,00 $/1 Million Zeichen |