Creare un modello di traduzione personalizzato

Addestrare e utilizzare un modello di traduzione personalizzato utilizzando la console Google Cloud. L'esempio seguente utilizza Traduzione AutoML per addestrare un modello di traduzione dall'inglese allo spagnolo utilizzando un set di dati contenente coppie di segmenti orientati alla tecnologia provenienti dalla localizzazione del software.

Prima di iniziare

Prima di poter iniziare a utilizzare AutoML Translation, nel progetto deve essere attivata l'API Cloud Translation e devi disporre delle autorizzazioni concesse dai seguenti ruoli:

  • Ruolo Visualizzatore per visualizzare le risorse esistenti nel progetto
  • Il ruolo Editor dell'API Cloud Translation per creare e gestire set di dati e modelli
  • Il ruolo Amministratore archiviazione per caricare i dati di addestramento in un bucket Cloud Storage

Crea un set di dati per le traduzioni e importa coppie di segmenti

  1. Scarica il file dell'archivio contenente i dati di esempio per l'addestramento del modello ed estrae i file.

    Per questo tutorial, utilizzerai il file TSV dall'inglese allo spagnolo.

  2. Vai alla console di AutoML Translation.

    Vai alla pagina traduzione

  3. Nel riquadro di navigazione, fai clic su Set di dati per andare alla pagina Set di dati.

  4. Fai clic su Crea set di dati.

  5. Nella finestra di dialogo Crea set di dati, specifica i dettagli del set di dati:

    1. Inserisci tutorial_dataset come nome del set di dati.
    2. Seleziona Inglese (EN) come lingua di origine dall'elenco a discesa.
    3. Seleziona Spagnolo (ES) come lingua di destinazione.
    4. Fai clic su Crea.
  6. Una volta creato il set di dati, fai clic sul nome per visualizzarne i dettagli.

  7. Vai alla scheda Importa e carica il set di dati en-es.tsv in Cloud Storage:

    1. Seleziona Carica file dal computer.
    2. Fai clic su Seleziona file e scegli il file en-es.tsv che hai scaricato ed estratto in precedenza.
    3. Fai clic su Sfoglia per selezionare o creare un nuovo bucket Cloud Storage dove viene archiviato il file TSV. La regione del bucket deve essere us-central1.
  8. Fai clic su Continua.

    AutoML Translation suddivide automaticamente i dati in set di addestramento, convalida e test. Puoi visualizzare queste suddivisioni e le coppie di frasi importate nella scheda Frasi del tuo set di dati.

Addestra un modello

  1. Vai alla console di AutoML Translation.

    Vai alla pagina traduzione

  2. Nel riquadro di navigazione, vai alla pagina Set di dati.

  3. Fai clic sul set di dati tutorial_dataset.

  4. Vai alla scheda Addestramento.

  5. Fai clic su Inizia addestramento per aprire il riquadro Addestra nuovo modello.

  6. Inserisci tutorial_model per il nome del modello.

  7. Fai clic su Inizia addestramento.

L'addestramento di un modello può richiedere diverse ore.

Valuta il modello

Controlla il confronto tra il modello e il modello NMT predefinito di Google, basato su coppie di segmenti del set di test.

  1. Vai alla console di AutoML Translation.

    Vai alla pagina traduzione

  2. Nel riquadro di navigazione, vai alla pagina Modelli.

  3. Fai clic sul modello tutorial_model.

  4. Fai clic sulla scheda Valuta.

Nella sezione Valutazioni precedenti, Cloud Translation mostra il punteggio BLEU del tuo modello rispetto al modello NMT di Google. Il punteggio BLEU (Bilingual Evaluation Understudy) indica quanto il testo candidato sia simile ai testi di riferimento. I valori più vicini a 100 rappresentano testi più simili.

Utilizzare il modello di traduzione

Dalla console Google Cloud, puoi utilizzare il tuo modello personalizzato per tradurre del testo.

  1. Vai alla console di AutoML Translation.

    Vai alla pagina traduzione

  2. Nel riquadro di navigazione, vai alla pagina Modelli.

  3. Fai clic sul modello tutorial_model.

  4. Fai clic sulla scheda Prevedi.

  5. Nella casella di testo Inglese, inserisci il testo da tradurre e fai clic su Traduci.

    Puoi confrontare i risultati del tuo modello personalizzato con il modello NMT di Google.

Esegui la pulizia

Per evitare addebiti non necessari per Google Cloud , elimina il modello, il set di dati e il file en-es.tsv. Puoi anche utilizzare la console Google Cloud per eliminare il progetto se non ti serve.

Passaggi successivi