Domande frequenti

La voce personalizzata supporta SSML?

  • Voce personalizzata supporta tutte le funzionalità SSML, ad eccezione dell'enfasi (nella roadmap) e della prosodia del tono (disponibile a breve).

Quanto può essere lunga una frase SSML?

  • Ti consigliamo di evitare i tag di frase SSML e di consentirci di dedurre la struttura della frase. Se devi utilizzare frasi SSML, genereremo fino a 30 secondi di audio per frase SSML.

  • Ogni frase può contenere al massimo 480 fonemi. Se necessario, suddividi le frasi più lunghe con i segni di punteggiatura (ad es. i punti).

Ci saranno differenze nella voce tra due versioni di un modello di voce personalizzata?

  • Alcune modifiche tra due versioni di un modello Voce personalizzata sono da aspettarsi con l'evoluzione della nostra tecnologia, anche se i modelli vengono addestrati utilizzando gli stessi dati audio. Se riscontri questo problema, inviaci alcuni esempi per consentirci di effettuare accertamenti.

Dove posso segnalare i problemi a Google?