Puoi creare modelli vocali personalizzati all'interno dell'UI di Text-to-Speech.
Prerequisiti
- Abilita l'API Text-to-Speech.
- Registra l'audio seguendo i requisiti dei dati di addestramento.
- Creare un bucket Cloud Storage.
- Carica i file audio nel nuovo bucket nel formato specificato dai requisiti dei dati di addestramento (0001.wav, 0002.wav... 0200.wav e così via).
Addestra un nuovo modello vocale personalizzato
- Apri la scheda Voce personalizzata nell'interfaccia utente di Text-to-Speech.
- Fai clic su Crea nella parte superiore dello schermo.
- Assegna un nome al modello vocale.
- Specifica la lingua dall'elenco a discesa delle lingue supportate.
- Seleziona il file CSV corretto dalla configurazione del bucket nel passaggio 4 dei prerequisiti.
- Carica una dichiarazione di consenso del talento vocale. Esempio: "Io (nome) acconsento che la mia voce venga utilizzata per creare una voce sintetica personalizzata".
- Fai clic su Crea per avviare la creazione del modello. La creazione del modello può richiedere fino a 3 giorni.
- Per vedere lo stato del job di addestramento, visualizza le notifiche della console nell'intestazione di navigazione in alto a destra.
Passaggi successivi
Al termine dell'addestramento del modello, i file audio di output di esempio saranno disponibili nella console. Puoi utilizzare questi file per eseguire una valutazione iniziale della qualità del modello. Se soddisfa i tuoi requisiti, contatta il team di vendita per ricevere assistenza per l'implementazione del modello. Il deployment richiede due o tre settimane, quindi ti consigliamo di valutarlo rapidamente e di comunicarlo tempestivamente.