Nozioni di base su Voice personalizzato

Panoramica

L'API Cloud Text-to-Speech ora offre la voce personalizzata. Questa funzionalità consente di addestrare un modello vocale personalizzato utilizzando le tue registrazioni audio di qualità professionale per creare una voce esclusiva. Puoi usare la tua voce personalizzata per sintetizzare l'audio con l'API Cloud Text-to-Speech.

Dati audio di addestramento forniti dall'utente

La voce personalizzata offre un modello di Text-to-Speech (TTS) che ha un suono il più possibile simile ai dati audio forniti. Google ti invierà uno script per le registrazioni vocali dopo l'approvazione del tuo caso d'uso. Ti consigliamo di scegliere un doppiatore che rappresenti la voce personalizzata che vuoi raggiungere. Devi registrare un audio di qualità professionale con il tuo doppiatore da utilizzare come dati di addestramento (per ulteriori informazioni, consulta la pagina relativa ai requisiti per i dati di addestramento). Se i dati di addestramento non superano i controlli di qualità interni di Google, potrebbe essere necessario registrare di nuovo o inviare nuovamente i dati dopo aver risolto i problemi identificati.

Addestramento del modello

Google impiega diverse settimane per addestrare il tuo modello vocale personalizzato.

Deployment

Dopo l'addestramento, Google eseguirà il deployment del modello vocale personalizzato nei progetti da te scelti.

Passaggi successivi

  • Implementa la funzionalità Voice personalizzata utilizzando la nostra quickstart.