Cloud Text-to-Speech

Conversione da testo a parlato basata sul machine learning.

Fai una prova gratuita

Visualizza la documentazione per questo prodotto.

Sintesi vocale ad alta precisione

Google Cloud Text-to-Speech consente agli sviluppatori di sintetizzare un discorso dal suono naturale con 30 voci, disponibili in più lingue e varianti. Applica la rivoluzionaria ricerca di DeepMind nell'ambito di WaveNet e delle potenti reti neurali di Google per offrire audio ad alta precisione. Con questa API di facile utilizzo, puoi creare interazioni realistiche con gli utenti, su un'ampia gamma di applicazioni e dispositivi.

Sintesi vocale ad alta precisione

Converti il testo in parlato ora

Digita ciò che vuoi, seleziona una lingua, quindi fai clic su "Ascolta".

Basata sulla tecnologia machine learning di Google

Applica gli avanzati algoritmi di rete neurale di deep learning per sintetizzare il testo in una varietà di voci e lingue. Le nostre reti neurali si basano sull'esperienza di Google nell'ambito della sintesi vocale.

Machine learning di Google

Accesso esclusivo a WaveNet Voices di DeepMind

DeepMind ha svolto ricerche rivoluzionarie nell'ambito dei modelli di machine learning per generare un sistema di sintesi vocale che imita in modo più naturale voci e suoni umani, riducendo il divario rispetto alla controparte umana di oltre il 50%. Cloud Text-to-Speech offre accesso esclusivo a una vasta gamma di voci WaveNet e continuerà ad aggiungerne altre nel tempo.

Voci WaveNet di DeepMind

Scelta tra più di 30 voci

Google Cloud Text-to-Speech offre una selezione di oltre 30 voci in 14 lingue e varianti, consentendo agli sviluppatori di scegliere la voce che si adatta meglio alla loro applicazione.

Scelta tra più di 30 voci

Facilità di integrazione con le applicazioni e i dispositivi esistenti

Cloud Text-to-Speech supporta qualsiasi applicazione o dispositivo in grado di inviare una richiesta REST o gRPC tra cui telefoni, PC, tablet e dispositivi IoT (ad esempio auto, TV e altoparlanti).

Facilità di integrazione con le applicazioni e i dispositivi esistenti

Supporto di molti casi d'uso comuni

Google Cloud Text-to-Speech è un'API di facile utilizzo e, come tale, rappresenta una soluzione flessibile per la creazione di esperienze realistiche per una varietà di casi d'uso. I casi d'uso comuni includono l'automazione dei call center, le risposte interattive dei dispositivi IoT o la trasformazione del testo in audio.

Supporto di molti casi d'uso comuni

Funzionalità di Cloud Text-to-Speech

Supporto multilingue
Supporta oltre 30 voci in 14 lingue e varianti, con altre lingue presto in arrivo.
Voci WaveNet
Esclusivo accesso multilingue alle voci DeepMind WaveNet che consentono di ottenere un'esperienza di sintesi vocale estremamente realistica.
Supporto di testo e SSML
Personalizza la tua sintesi vocale con tag SSML che ti consentono di aggiungere pause, numeri, formattazione di data e ora e altre istruzioni relative alla pronuncia.
Regolazione della velocità del parlato
Personalizza la velocità del parlato rendendola fino a quattro volte superiore o inferiore rispetto a quella normale.
Regolazione del tono di voce
Personalizza il tono della voce selezionata, fino a 20 semitoni in più o in meno rispetto all'output predefinito.
Controllo del guadagno del volume
Aumenta il volume dell'output fino a 16 db o riducilo fino a -96 db.
Flessibilità del formato audio
Scegli tra una serie di formati audio disponibili tra cui mp3, Linear16 e Ogg Opus.
Profili audioBETA
Ottimizza l'audio per il tipo di altoparlante da cui verrà riprodotta la tua voce, ad esempio cuffie o linee telefoniche.

PREZZI di CLOUD Text-to-Speech

Sintesi vocale ad alta precisione

Il prezzo di Cloud Text-to-Speech è basato su 1 milione di caratteri di testo elaborati dopo un milione di caratteri gratuiti. Per informazioni dettagliate, consulta la guida ai prezzi.

Funzionalità Livello gratuito mensile Utilizzo a pagamento
Voci standard (non WaveNet) Da 0 a 4 milioni di caratteri $ 4,00 USD/1 milione di caratteri
Voci WaveNet Da 0 a 1 milione di caratteri $ 16,00 USD/1 milione di caratteri
Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.
I prodotti o le funzionalità elencati in questa pagina sono in versione beta. Per ulteriori informazioni sulle fasi di lancio dei nostri prodotti, visita questa pagina.

Invia feedback per...

Cloud Text-to-Speech API