Text-to-Speech

Converteer tekst naar realistische spraak met een API die gebruik maakt van de AI-technologie van Google.

Kosteloos uitproberen
  • action/check_circle_24px Gemaakt met Sketch.

    Verbeter de interacties met klanten met intelligente, levensechte reacties

  • action/check_circle_24px Gemaakt met Sketch.

    Gebruik in uw apps en apparaten een gebruikersinterface met spraak om met gebruikers te communiceren.

  • action/check_circle_24px Gemaakt met Sketch.

    Personaliseer uw communicatie op basis van gebruikersvoorkeuren voor de stem en taal.

High Fidelity-spraak

Implementeer de baanbrekende technologie van Google om spraak met een menselijke intonatie te genereren. De API is ontworpen met de spraaksynthese-expertise van DeepMind en genereert stemmen die vergelijkbaar zijn met die van een mens.

Grootste keus in stemmen

Kies uit meer dan 220 stemmen in meer dan 40 talen en varianten. Kies de stem die het beste past bij uw gebruiker en app.

Versnelde innovatie

Benut de beste technologieën van Google voor vertalingen en spraak-naar-tekst voor toepassingen zoals audiocontent in meerdere talen en spraakbots.

Text-to-Speech in de praktijk

Typ wat u wilt, selecteer een taal en klik dan op 'Uitspreken' om het te horen.

Belangrijkste functies

WaveNet-stemmen

Gebruik de meer dan 90 WaveNet-stemmen die zijn ontworpen op basis van het baanbrekende onderzoek van DeepMind om spraak te genereren die veel meer lijkt op een mensenstem.

Stem afstellen

Personaliseer de toonhoogte van de door u geselecteerde stem, tot twintig halve tonen hoger of lager dan de standaard. Maak de spreeksnelheid viermaal sneller of langzamer dan de normale snelheid.

Ondersteuning voor tekst en SSML

Pas uw spraak aan met SSML-tags, waarmee u pauzes, getallen, datum- en tijdindelingen en andere uitspraakinstructies kunt toevoegen.

Alle functies weergeven

Wat is er nieuw

Meld u aan voor Google Cloud-nieuwsbrieven met productupdates, informatie over evenementen, speciale aanbiedingen en meer.

Documentatie

De basisbeginselen van Google Cloud
De basisbeginselen van Text-to-Speech

Een gids voor de fundamentele concepten van het gebruik van de Text-to-Speech API.

Snelstartgids
Snelstartgids: De opdrachtregel gebruiken

Stel uw Google Cloud-project en machtiging in. Stuur vervolgens een verzoek naar Text-to-Speech om tekst om te zetten in audio.

De basisbeginselen van Google Cloud
Ondersteunde stemmen en talen

Bekijk welke talen in Text-to-Speech worden ondersteund en luister naar voorbeelden van de stemmen voor elke taal.

Tutorial
WaveNet en andere synthetische stemmen

Bekijk meer informatie over de verschillende synthetische stemmen die beschikbaar zijn voor gebruik in Text-to-Speech, waaronder de premium stemmen van WaveNet.

Tutorial
Adressen uitspreken met SSML

In deze tutorial ziet u hoe u de opmaaktaal voor spraaksynthese (Speech Synthesis Markup Language, SSML) gebruikt om een tekstbestand met adressen uit te spreken.

Toepassingen

Toepassing
Stembots in contactcenters

Voorzie uw klantenservice van betere spraakmogelijkheden door spraak dynamisch te genereren in plaats van een vooraf opgenomen audiobestand af te spelen. Communiceer met gesynthetiseerde stemmen van hoge kwaliteit waardoor bellers een vertrouwd en persoonlijk gevoel krijgen.

Referentiearchitectuur voor stembots in contactcenters
Toepassing
Spraak genereren in apparaten

Laat uw apparaten met menselijke stemmen spreken om op natuurlijke wijze met uw gebruikers te communiceren. Ontwerp een end-to-end gebruikersinterface voor spraak met Speech-to-Text en verbeter de klantbeleving met eenvoudige en aansprekende communicatie.

Referentiearchitectuur voor het genereren van stemmen in apparaten

Alle functies

Selectie van stemmen en talen Kies uit een uitgebreide selectie van meer dan 220 stemmen in meer dan 40 talen en varianten, en binnenkort nog meer.
WaveNet-stemmen Gebruik de meer dan 90 WaveNet-stemmen die zijn ontworpen op basis van het baanbrekende onderzoek van DeepMind om spraak te genereren die veel meer lijkt op een mensenstem.
Ondersteuning voor tekst en SSML Pas uw spraak aan met SSML-tags, waarmee u pauzes, getallen, datum- en tijdindelingen en andere uitspraakinstructies kunt toevoegen.
De toonhoogte instellen Personaliseer de toonhoogte van de door u geselecteerde stem, tot twintig halve tonen hoger of lager dan de standaard.
De spreeksnelheid instellen Maak de spreeksnelheid viermaal sneller of langzamer dan de normale snelheid.
Aanpassing van het volume Verhoog het volume van de uitvoer met maximaal 16 dB of verlaag het volume met maximaal -96 dB.
Geïntegreerde REST- en gRPC-API's Integreer eenvoudig met elke app en elk apparaat waarmee een REST- of gRPC-verzoek kan worden verzonden, inclusief telefoons, computers, tablets en IoT-apparaten (zoals auto's, tv's en speakers)
Flexibele audio-indeling Kies uit verschillende audio-indelingen, waaronder mp3, Linear16 en Ogg Opus.
Audioprofielen Optimaliseer voor het type speaker waarop uw spraak moet worden afgespeeld, zoals koptelefoons of telefoonlijnen.

Prijzen

De prijzen voor Text-to-Speech worden berekend per 1 miljoen tekens verwerkte tekst na de Free Tier.

Als u in een andere valuta dan USD betaalt, gelden de prijzen die in uw valuta voor Google Cloud SKU's worden vermeld.