Cloud Text-to-Speech

Durch maschinelles Lernen unterstützte Umwandlung von Text in Sprache

Kostenlos testen Dokumentation ansehen

Hochwertige Sprachsynthese

Google Cloud Text-to-Speech konvertiert Text in natürlich klingende Sprache in mehr als 100 Stimmen für über 20 Sprachen und Sprachvarianten. Unter Anwendung der bahnbrechenden Forschung im Bereich der Sprachsynthese (WaveNet) und der leistungsstarken neuronalen Netzwerke von Google werden erstklassige Audiodaten produziert. Diese nutzerfreundliche API ermöglicht naturgetreue Interaktionen mit Ihren Nutzern, die den Kundendienst, die Interaktion mit Geräten und andere Anwendungsbereiche transformieren.

Hochwertige Sprachsynthese

Konvertieren Sie Ihren Text jetzt in Sprache

Geben Sie Ihren Text ein, wählen Sie eine Sprache aus und klicken Sie auf "Speak It", um ihn anzuhören.

Basiert auf Googles Technologie für maschinelles Lernen

Wenden Sie fortgeschrittene Algorithmen des neuronalen Deep-Learning-Netzes an, um Sprache aus Text in einer Vielzahl von Stimmen und Sprachen zu synthetisieren. Unsere neuronalen Netzwerke basieren auf dem Sprachsynthese-Know-how von Google.

Maschinelles Lernen von Google

Wählen Sie aus über 100 Stimmen aus

Google Cloud Text-to-Speech bietet eine Auswahl von mehr als 100 Stimmen in über 20 Sprachen und Sprachvarianten. Entwickler können so die Stimme auswählen, die am besten zu ihrer Anwendung passt.

Auswahl aus über 100 Stimmen

Einschließlich exklusiven Zugriffs auf WaveNet-Technologie

DeepMind hat bahnbrechende Forschungsarbeit zu Modellen für maschinelles Lernen geleistet, um Sprache zu erzeugen, die menschliche Stimmen nachahmt und natürlicher klingt. Durch diese Forschung wird die Lücke zur menschlichen Leistung um mehr als 70 % reduziert. Cloud Text-to-Speech bietet exklusiven Zugriff auf mehr als 50 WaveNet-Stimmen und im Laufe der Zeit werden noch weitere dazukommen.

WaveNet-Stimmen von DeepMind

Einfache Integration in vorhandene Anwendungen und Geräte

Cloud Text-to-Speech unterstützt jede Anwendung und jedes Gerät, das eine REST- oder gRPC-Anfrage senden kann, darunter Smartphones, PCs, Tablets und IdD-Geräte wie Autos, Fernseher oder Lautsprecher.

Einfache Integration in vorhandene Anwendungen und Geräte

Unterstützt viele gängige Anwendungsfälle

Google Cloud Text-to-Speech ist eine einfach zu verwendende API, die eine flexible Lösung zur Erstellung natürlich klingender Sprache für viele Anwendungsfälle bietet. Gängige Anwendungsfälle sind beispielsweise die Automatisierung von Callcentern, interaktive Antworten von IdD-Geräten oder die Umwandlung von Text in Audio, um Inhalte im Audioformat anzubieten.

Unterstützt viele gängige Anwendungsfälle

Vorteile von Cloud Text-to-Speech

Mehrsprachig
Unterstützung von mehr als 100 Stimmen in über 20 Sprachen und Sprachvarianten. Weitere folgen in Kürze.
WaveNet-Stimmen
Exklusiver Zugriff auf WaveNet-Stimmen von DeepMind in verschiedenen Sprachen; diese bieten äußerst natürliche Sprache.
Unterstützt Text und SSML
Passen Sie Ihre Sprache mithilfe von SSML-Tags an, mit denen Sie Pausen, Zahlen, Formatierung von Datum und Uhrzeit sowie andere Befehle zur Aussprache hinzufügen können.
Sprechgeschwindigkeitsabstimmung
Passen Sie Ihre Sprechgeschwindigkeit auf ein viermal schnelleres oder langsameres Tempo als die normale Geschwindigkeit an.
Tonlageneinstellung
Passen Sie die Tonlage Ihrer ausgewählten Stimme um bis zu 20 Halbtöne über oder unter der Standardausgabe an.
Lautstärkeregelung
Erhöhen Sie die Lautstärke der Ausgabe um bis zu 16 dB oder verringern Sie die Lautstärke auf bis zu -96 dB.
Flexibilität im Audioformat
Wählen Sie aus einer Reihe von Audioformaten, einschließlich MP3, Linear16 und Ogg Opus.
Audioprofile
Optimieren Sie Audioprofile für die Art von Lautsprecher, über den die Audiodaten ausgegeben werden sollen, wie z. B. Kopfhörer oder Telefonleitungen.

PREISE für CLOUD Text-to-Speech

Hochwertige Sprachsynthese

Preise für Cloud Text-to-Speech werden pro 1 Million Zeichen an verarbeitetem Text berechnet. Die ersten 1 Million Zeichen sind kostenlos. Weitere Informationen finden Sie in unserer Preisübersicht.

Funktion Kostenloses Monatskontingent Kostenpflichtige Nutzung
Standardstimmen (alle außer WaveNet) 0 bis 4 Millionen Zeichen 4,00 $/1 Million Zeichen
WaveNet-Stimmen 0 bis 1 Million Zeichen 16,00 $/1 Million Zeichen
Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs (nur auf Englisch verfügbar) für Ihre Währung angegeben sind.
Ein auf dieser Seite erwähntes Produkt oder eine Funktion befindet sich in der Betaphase. Weitere Informationen zu unseren Markteinführungsphasen finden Sie hier.

Feedback geben zu...

Cloud Text-to-Speech API