Documentazione di Text-to-Speech

Voce personalizzata

L'API Cloud Text-to-Speech ora offre voci personalizzate. Questa funzionalità consente di addestrare un modello vocale personalizzato utilizzando le tue registrazioni audio di qualità professionale per creare una voce esclusiva. Puoi usare la tua voce personalizzata per sintetizzare l'audio con l'API Cloud Text-to-Speech.

Per implementare la voce personalizzata, contatta un membro del team di vendita

Esempi di voci personalizzate

Puoi ascoltare esempi di voci personalizzate ascoltando i seguenti esempi. Il primo esempio audio è la voce originale. Dopodiché puoi ascoltare due esempi vocali personalizzati basati sull'originale.

Donna - Voce originale		Uomo - Voce originale
Femminile - Esempio di voce personalizzata n. 1		Uomo - Esempio di voce personalizzata n. 1
Femmina - Esempio di voce personalizzata n. 2		Uomo - Esempio di voce personalizzata n. 2

Dati audio di addestramento forniti dall'utente

La voce personalizzata offre un modello di Text-to-Speech (TTS) che ha un suono il più possibile simile ai dati audio forniti. Google ti invierà uno script per le registrazioni vocali dopo l'approvazione del tuo caso d'uso. Ti consigliamo di trovare e collaborare con un doppiatore che rappresenti la voce personalizzata che vuoi raggiungere. Devi registrare un audio di qualità professionale con il tuo doppiatore da usare come dati di addestramento. Se i dati di addestramento non superano la verifica interna di Google e il controllo di convalida, potrebbe essere necessario registrare di nuovo o inviare nuovamente i dati dopo aver risolto i problemi identificati.

Addestramento del modello

Google impiega diverse settimane per addestrare e valutare il tuo modello vocale personalizzato. Non è disponibile supporto SLA (accordo sul livello del servizio) per i bug critici per le funzionalità beta.

Test di valutazione e di accettazione da parte degli utenti

Google esegue una fase iniziale di valutazione del modello addestrato. Una volta superati i nostri criteri di qualità interni, ti invieremo alcuni campioni audio offline registrati utilizzando il tuo modello personalizzato. Quindi seguirai una procedura di test di accettazione dell'utente per valutare i risultati audio e approvare ufficialmente il modello.

Guida rapida

Impara in 5 minuti

API e riferimenti

Riferimento REST e gRPC