Nozioni di base su Voce personalizzata

Panoramica

L'API Cloud Text-to-Speech ora offre la voce personalizzata. Questa funzionalità consente di addestrare un modello vocale personalizzato utilizzando le tue registrazioni audio di qualità professionale per creare una voce unica. Puoi utilizzare la tua voce personalizzata per sintetizzare l'audio utilizzando l'API Cloud Text-to-Speech.

Dati audio di addestramento forniti dall'utente

Voce personalizzata fornisce un modello Text-to-Speech (TTS) che suona il più simile possibile ai dati audio forniti. Google ti invierà uno script per le registrazioni vocali dopo l'approvazione del tuo caso d'uso. Ti consigliamo di selezionare e assumere un doppiatore che rappresenti la voce personalizzata che vuoi ottenere. Devi registrare audio di qualità professionale con il tuo doppiatore da utilizzare come dati di addestramento (per ulteriori informazioni, consulta la pagina dei requisiti dei dati di addestramento). Se i dati di addestramento non superano i controlli di qualità interni di Google, potresti dover registrare di nuovo o inviare nuovamente i dati dopo aver risolto i problemi identificati.

Addestramento del modello

Google impiega diverse settimane per addestrare il tuo modello vocale personalizzato.

Deployment

Dopo l'addestramento, Google eseguirà il deployment del modello vocale personalizzato nei progetti di tua scelta.

Passaggi successivi

  • Implementa la funzionalità Voce personalizzata utilizzando la nostra guida rapida.