Cloud Text-to-Speech
Conversie van tekst naar spraak met machine learning
Kosteloos uitproberen Documentatie bekijkenNatuurgetrouwe spraaksynthese
Google Cloud Text-to-Speech zet tekst om in menselijk klinkende spraak in meer dan 180 stemmen en meer dan 30 talen en varianten. Dankzij baanbrekend onderzoek naar spraaksynthese (WaveNet) en de krachtige neurale netwerken van Google kunt u audio in High Fidelity leveren. Deze gebruiksvriendelijke API zorgt voor levensechte interactie met gebruikers. Zo tilt u klantenservice, apparaatinteractie en andere toepassingen naar een hoger niveau.
Converteer nu uw tekst naar spraak
Typ wat u wilt, selecteer een taal en klik dan op 'Uitspreken' om het te horen.
Maakt gebruik van machine learning van Google
Pas geavanceerde neurale netwerkalgoritmen voor deep learning toe om tekst te synthetiseren in een verscheidenheid aan stemmen en talen. Onze neurale netwerken zijn ontworpen op basis van de expertise van Google op het gebied van spraaksynthese.
Kies uit meer dan 180 stemmen
Google Cloud Text-to-Speech biedt een selectie van meer dan 180 stemmen in meer dan 30 talen en varianten, zodat ontwikkelaars de stem kunnen kiezen die het best werkt voor hun app.
Met exclusieve toegang tot WaveNet-technologie
DeepMind heeft baanbrekend onderzoek gedaan naar modellen voor machine learning om spraak te genereren die menselijke stemmen nabootst en natuurlijker klinkt. Dit heeft de kloof met de menselijke prestaties met meer dan 70% verkleind. Cloud Text-to-Speech biedt exclusieve toegang tot meer dan negentig WaveNet-stemmen, die continu worden aangevuld.
Gemakkelijk te integreren met bestaande apps en apparaten
Cloud Text-to-Speech ondersteunt alle apps en apparaten die een REST- of gRPC-verzoek kunnen sturen, zoals telefoons, pc's, tablets en IoT-apparaten (bijvoorbeeld auto's, tv's en luidsprekers).
Ondersteuning voor veelvoorkomende toepassingen
Google Cloud Text-to-Speech is een gebruiksvriendelijke API en een flexibele oplossing voor het creëren van een natuurlijke beleving voor verschillende toepassingen. Veelvoorkomende toepassingen zijn automatisering van het callcenter, interactieve reacties van IoT-apparaten en het transformeren van tekst naar bruikbare audio.
Functies van Cloud Text-to-Speech
- Meertalig
- Ondersteunt meer dan 180 stemmen in meer dan 30 talen en varianten, en binnenkort nog meer.
- WaveNet-stemmen
- Exclusieve meertalige toegang tot DeepMind WaveNet-stemmen die de meest natuurlijk klinkende spraak leveren.
- Tekst- en SSML-support
- Pas uw spraak aan met SSML-tags, waarmee u pauzes, getallen, datum- en tijdindelingen en andere uitspraakinstructies kunt toevoegen.
- Instellen van spreeksnelheid
- Maak de spreeksnelheid viermaal sneller of langzamer dan de normale snelheid.
- Instellen van toonhoogte
- Pas de toonhoogte van uw geselecteerde stem aan, met maximaal twintig halve tonen meer of minder dan de standaarduitvoer.
- Aanpassing van volume
- Verhoog het volume van de uitvoer tot 16 dB of verlaag het volume tot -96 dB.
- Flexibele audio-indeling
- Kies uit verschillende audio-indelingen, waaronder mp3, Linear16 en Ogg Opus.
- Audioprofielen
- Optimaliseer voor het type luidspreker waarop uw spraak moet worden afgespeeld, zoals hoofdtelefoons of telefoonlijnen.
Prijzen van Cloud Text-to-Speech
Natuurgetrouwe spraaksynthese
De prijzen voor Cloud Text-to-Speech worden berekend per 1 miljoen tekens verwerkte tekst na de Free Tier. Zie ons prijsoverzicht voor meer informatie.
| Functie | Maandelijkse Free Tier | Betaald gebruik |
|---|---|---|
| Standaardstemmen (niet-WaveNet) | 0 tot 4 miljoen tekens | $ 4,00/1 miljoen tekens |
| WaveNet-stemmen | 0 tot 1 miljoen tekens | $ 16,00/miljoen tekens |