Crea un modello di traduzione personalizzato

Addestra e utilizza un modello di traduzione personalizzato con la console Google Cloud. La l'esempio seguente utilizza AutoML Translation per addestrare un modello da inglese a spagnolo di traduzione automatica utilizzando un set di dati contenente un segmento orientato alla tecnologia dalla localizzazione del software.

Prima di iniziare

Per poter iniziare a utilizzare AutoML Translation, il progetto deve avere L'API Cloud Translation è abilitata e devi disporre delle autorizzazioni concesse i seguenti ruoli:

  • Ruolo Visualizzatore per visualizzare le risorse esistenti nel progetto
  • Editor API Cloud Translation per creare e gestire set di dati e di base
  • Ruolo Storage Admin per caricare i dati di addestramento in un Cloud Storage del bucket rimanente

Creare un set di dati di traduzione e importare coppie di segmenti

  1. Scarica il un file di archivio contenente i dati di esempio per l'addestramento del modello estrarre i file.

    Per questo tutorial, utilizzerai il file TSV dall'inglese allo spagnolo.

  2. Vai alla console di AutoML Translation.

    Vai alla sezione Pagina di traduzione

  3. Dal riquadro di navigazione, fai clic su Set di dati per andare alla pagina Set di dati.

  4. Fai clic su Crea set di dati.

  5. Nella finestra di dialogo Crea set di dati, specifica i dettagli sul set di dati:

    1. Inserisci tutorial_dataset come nome per il set di dati.
    2. Seleziona Italiano (IT) come lingua di origine dall'elenco a discesa.
    3. Seleziona Spagnolo (ES) come lingua di destinazione.
    4. Fai clic su Crea.
  6. Dopo aver creato il set di dati, fai clic sul nome per visualizzarne i dettagli.

  7. Vai alla scheda Importa e carica il set di dati en-es.tsv in Cloud Storage:

    1. Seleziona Carica file dal computer.
    2. Fai clic su Seleziona file e scegli il file en-es.tsv che vuoi scaricati ed estratti in precedenza.
    3. Fai clic su Sfoglia per selezionare o creare un nuovo bucket Cloud Storage dove è archiviato il file TSV. La regione del bucket deve essere us-central1.
  8. Fai clic su Continua.

    AutoML Translation suddivide automaticamente i dati in addestramento, di convalida e test. Puoi visualizzare queste suddivisioni e disponibili nella scheda Sentences (Frasi) del set di dati.

Addestra un modello

  1. Vai alla console di AutoML Translation.

    Vai alla sezione Pagina di traduzione

  2. Dal riquadro di navigazione, vai alla pagina Set di dati.

  3. Fai clic sul set di dati tutorial_dataset.

  4. Vai alla scheda Addestra.

  5. Fai clic su Inizia addestramento per aprire il riquadro Addestra nuovo modello.

  6. Inserisci tutorial_model come nome del modello.

  7. Fai clic su Inizia addestramento.

L'addestramento di un modello può richiedere diverse ore.

Valuta il modello

Controlla le differenze tra il modello e il modello NMT di Google predefinito che è in base alle coppie di segmenti del set di test.

  1. Vai alla console di AutoML Translation.

    Vai alla sezione Pagina di traduzione

  2. Nel riquadro di navigazione, vai alla pagina Modelli.

  3. Fai clic sul modello tutorial_model.

  4. Fai clic sulla scheda Valuta.

Nella sezione Valutazioni precedenti, Cloud Translation mostra i dati BLEU rispetto al modello NMT di Google. Il BLEU (valutazione bilingue corso di formazione) "score" indica quanto è simile il testo candidato al riferimento SMS; valori più vicini a 100 rappresentano testi più simili.

Utilizzare il modello di traduzione

Dalla console Google Cloud, puoi utilizzare il modello personalizzato per tradurre testo.

  1. Vai alla console di AutoML Translation.

    Vai alla sezione Pagina di traduzione

  2. Nel riquadro di navigazione, vai alla pagina Modelli.

  3. Fai clic sul modello tutorial_model.

  4. Fai clic sulla scheda Previsione.

  5. Nella casella di testo Italiano, inserisci il testo da tradurre, quindi fai clic su Traduci.

    Puoi confrontare i risultati del tuo modello personalizzato con il modello NMT di Google.

Esegui la pulizia

Per evitare addebiti inutili per Google Cloud, elimina il tuo modello, set di dati e en-es.tsv. Puoi utilizzare anche Console Google Cloud per eliminare il progetto se non ti serve.

Passaggi successivi