Addestramento di modelli

Ti consigliamo di trovare e collaborare con un doppiatore che rappresenti la voce personalizzata che vuoi ottenere. Devi registrare circa 10 secondi di audio con il doppiatore da usare come dati di addestramento. Devi anche registrare la dichiarazione di consenso dell'attore di doppiaggio. L'addestramento e la pubblicazione del modello clonato richiedono meno di qualche minuto. Non è disponibile il supporto SLA (accordo sul livello del servizio) per i bug critici per le funzionalità pre-GA.

Passaggio 1: crea i dati di addestramento per la clonazione

  1. Registra la dichiarazione di consenso: per rispettare le linee guida legali ed etiche relative alla clonazione vocale, registra la dichiarazione di consenso richiesta nella lingua appropriata (Sono il proprietario di questa voce e acconsento che Google utilizzi questa voce per creare un modello vocale sintetico).
  2. Registra l'audio iniziale: utilizza il microfono del computer per registrare 10 secondi di audio. Assicurati che non ci siano rumori di fondo durante la registrazione.
  3. Archivia i file audio: salva i file audio registrati in una posizione specifica di Cloud Storage.

Passaggio 2: crea un modello clonato

Puoi creare un progetto di clonazione tramite la console di Text-to-Speech.

  1. Vai alla pagina Synthesize nella console di Text-to-Speech.

  2. Inserisci il testo che verrà sintetizzato in voce e seleziona il codice della lingua di destinazione (si applica solo il criterio en-US).

  3. Seleziona la casella di controllo Voce personalizzata e fai clic su Genera chiave.

  4. Completa tutti i campi obbligatori nell'attività secondaria che si apre.

  5. Ora nel modulo di sintesi dovrebbe apparire una chiave di clonazione vocale:

    • Puoi salvare questa chiave per utilizzarla in futuro e saltare la procedura "Genera chiave"

  6. Attiva/disattiva la sezione Impostazioni avanzate e inserisci 24000 nel campo Frequenza di campionamento (Hertz), quindi fai clic su Sintetizza.

Al momento abbiamo sintetizzato solo le voci clonate a 24 kHz.

Puoi scaricare o riprodurre subito l'audio per ascoltarne il suono.