Cloud Text-to-Speechbèta

Conversie van tekst naar spraak met machine learning.

Kosteloos uitproberen

Spraaksynthese in High Fidelity

Met Google Cloud Text-to-Speech kunnen ontwikkelaars natuurlijk klinkende spraak met 30 stemmen in verschillende talen en taalvarianten synthetiseren. Dankzij baanbrekend DeepMind-onderzoek in de neurale netwerken van WaveNet en Google kunt u audio in High Fidelity leveren. Deze gebruiksvriendelijke API zorgt voor levensechte interactie met gebruikers van verschillende apps en apparaten.

Spraaksynthese in High Fidelity

Converteer nu uw tekst naar spraak

Typ wat u wilt, selecteer een taal en klik dan op 'Uitspreken' om het te horen.

Mogelijk gemaakt door Machine Learning van Google

Pas de meest geavanceerde netwerkalgoritmen voor deep learning toe om tekst te synthetiseren in een verscheidenheid aan stemmen en talen. Onze neurale netwerken zijn ontworpen op basis van de expertise van Google op het gebied van spraaksynthese.

Machine Learning van Google

Inclusief exclusieve toegang tot WaveNet-stemmen van DeepMind

DeepMind heeft baanbrekend onderzoek gedaan naar machine learning-modellen om spraak te genereren die menselijke stemmen nabootst en natuurlijker klinkt. Hierdoor wordt de kloof met menselijke prestaties met meer dan 50% verkleind. Cloud Text-to-Speech biedt exclusieve toegang tot meerdere WaveNet-stemmen, die continu worden aangevuld.

WaveNet-stemmen van DeepMind

Selecteren uit meer dan 30 stemmen

Google Cloud Text-to-Speech biedt een selectie van meer dan 30 stemmen in 14 talen en varianten, zodat ontwikkelaars de stem kunnen kiezen die het beste werkt voor hun app.

Selecteren uit meer dan 30 stemmen

Gemakkelijk te integreren met bestaande apps en apparaten

Cloud Text-to-Speech biedt ondersteuning voor alle apps of apparaten die een REST- of gRPC-verzoek kunnen verzenden, zoals telefoons, pc's, tablets en IoT-apparaten (bijvoorbeeld auto's, tv's en luidsprekers).

Gemakkelijk te integreren met bestaande apps en apparaten

Ondersteuning voor veelvoorkomende toepassingen

Als een eenvoudig te gebruiken API is Google Cloud Text-to-Speech een flexibele oplossing voor het maken van een natuurlijke beleving voor verschillende toepassingen. Veelvoorkomende toepassingen zijn automatisering van het callcenter, interactieve reacties van IoT-apparaten en het transformeren van tekst naar audio, die als audio kan worden gebruikt.

Ondersteuning voor veel voorkomende toepassingen

Kenmerken van Cloud Text-to-Speech

Meertalig
Ondersteunt meer dan 30 stemmen in 14 talen en varianten, en binnenkort meer.
WaveNet-stemmen
Exclusieve meertalige toegang tot DeepMind WaveNet-stemmen die de meest natuurlijk klinkende spraak leveren.
Tekst- en SSML-ondersteuning
Pas uw spraak aan met SSML-tags, waarmee u pauzes, getallen, datum- en tijdindelingen en andere uitspraakinstructies kunt toevoegen.
Afstellen van spreeksnelheid
Maak de snelheid van het spreken viermaal sneller of langzamer dan de normale snelheid.
Afstellen van toonhoogte
Pas de toonhoogte van uw geselecteerde stem aan, met maximaal 20 halve tonen meer of minder dan de standaarduitvoer.
Aanpassing van volume
Verhoog het volume van de uitvoer tot 16 dB of verlaag het volume tot -96 dB.
Flexibele audio-indeling
Kies uit een aantal audio-indelingen, waaronder mp3, Linear16 en Ogg Opus.
AudioprofielenBÈTA
Optimaliseer voor het type luidspreker waaruit uw spraak moet worden afgespeeld, zoals koptelefoons of telefoonlijnen.

PRIJZEN van CLOUD Text-to-Speech

Spraaksynthese in High Fidelity

Cloud Text-to-Speech wordt per 1 miljoen verwerkte teksttekens in rekening gebracht na een gratis tier van 1 miljoen tekens. Zie ons prijsoverzicht voor meer informatie.

Functie Maandelijkse gratis tier Betaald gebruik
Standaardstemmen (niet-WaveNet) 0 tot 4 miljoen tekens $ 4,00 USD/1 miljoen tekens
WaveNet-stemmen 0 tot 1 miljoen tekens $ 16,00 USD / 1 miljoen tekens
Als u in een andere valuta dan USD betaalt, gelden de prijzen die in uw valuta op Cloud Platform SKU's worden getoond.
Producten of functies op deze pagina bevinden zich in de bètafase. Kijk hier voor meer informatie over de lanceringsfasen van onze producten.

Feedback verzenden over...

Cloud Text-to-Speech API