Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Crea un modello di traduzione personalizzato
Addestra e utilizza un modello di traduzione personalizzato utilizzando la console Google Cloud . L'esempio
seguente utilizza AutoML Translation per addestrare un modello di traduzione
dall'inglese allo spagnolo utilizzando un set di dati contenente coppie di segmenti
orientati alla tecnologia dalla localizzazione del software.
Prima di iniziare
Prima di poter iniziare a utilizzare AutoML Translation, il tuo progetto deve avere l'API Cloud Translation abilitata e devi disporre delle autorizzazioni concesse dai seguenti ruoli:
Ruolo Visualizzatore per visualizzare le risorse esistenti nel progetto
Ruolo Editor API Cloud Translation per creare e gestire set di dati e modelli
Ruolo Amministratore storage per caricare i dati di addestramento in un bucket Cloud Storage
Creare un set di dati di traduzione e importare coppie di segmenti
Scarica il file
archivio che contiene i dati di esempio per l'addestramento del modello ed estrai i file.
Per questo tutorial, utilizzerai il file TSV dall'inglese allo spagnolo.
Nel riquadro di navigazione, fai clic su Set di dati per andare alla pagina Set di dati.
Fai clic su Crea set di dati.
Nella finestra di dialogo Crea set di dati, specifica i dettagli del set di dati:
Inserisci tutorial_dataset come nome del set di dati.
Seleziona Inglese (EN) come lingua di origine dall'elenco a discesa.
Seleziona Spagnolo (ES) come lingua di destinazione.
Fai clic su Crea.
Una volta creato il set di dati, fai clic sul suo nome per visualizzarne i dettagli.
Vai alla scheda Importa e carica il set di dati en-es.tsv in Cloud Storage:
Seleziona Carica file dal computer.
Fai clic su Seleziona file e scegli il file en-es.tsv che hai
scaricato ed estratto in precedenza.
Fai clic su Sfoglia per selezionare o creare un nuovo bucket Cloud Storage
in cui è archiviato il file TSV. La regione del bucket deve essere us-central1.
Fai clic su Continua.
AutoML Translation suddivide automaticamente i dati in set di addestramento,
convalida e test. Puoi visualizzare queste suddivisioni e le coppie di frasi importate nella scheda Frasi del set di dati.
Nel riquadro di navigazione, vai alla pagina Modelli.
Fai clic sul modello tutorial_model.
Fai clic sulla scheda Valuta.
Nella sezione Valutazioni precedenti, Cloud Translation mostra il punteggio BLEU del tuo modello rispetto al modello NMT di Google. Il punteggio BLEU (Bilingual Evaluation
Understudy)
indica la somiglianza tra il testo candidato e i testi di riferimento. I valori più vicini a 100 rappresentano testi più simili.
Utilizzare il modello di traduzione
Dalla console Google Cloud , puoi utilizzare il modello personalizzato per tradurre del
testo.
Nel riquadro di navigazione, vai alla pagina Modelli.
Fai clic sul modello tutorial_model.
Fai clic sulla scheda Prevedi.
Nella casella di testo Inglese, inserisci il testo da tradurre e poi fai clic su
Traduci.
Puoi confrontare i risultati del modello personalizzato con quelli del modello NMT di Google.
Esegui la pulizia
Per evitare addebiti non necessari Google Cloud , elimina il modello, il set di dati e il file en-es.tsv. Puoi anche utilizzareGoogle Cloud console per eliminare il progetto se non ti serve.
Per creare il tuo set di dati e il tuo modello personalizzato, consulta la sezione Preparare i dati di addestramento per istruzioni su come preparare i dati.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[],[],null,["# Create a custom translation model\n=================================\n\n| **Note:** Translation LLM can be customized with your training data using [Vertex AI supervised fine-tuning - Public Preview](/vertex-ai/generative-ai/docs/models/translation-supervised-tuning).\n\nTrain and use a custom translation model by using the Google Cloud console. The\nfollowing example uses AutoML Translation to train an English-to-Spanish\ntranslation model by using a dataset that contains technology-oriented segment\npairs from software localization.\n| **Note:** The following tutorial assumes that, for your project, the Google Cloud console is using the Cloud Translation API instead of the AutoML API to create datasets. This condition is true if you have at least one native Cloud Translation resource or no legacy AutoML resources in your project. If you have only legacy AutoML resources, see [Upgrade AutoML resources](/translate/docs/advanced/automl-upgrade) for more information.\n\nBefore you begin\n----------------\n\nBefore you can start using AutoML Translation, your project must have the\nCloud Translation API enabled, and you must have the permissions that are granted by\nthe following roles:\n\n- **Viewer** role to view existing resources in your project\n- **Cloud Translation API Editor** role to create and manage datasets and models\n- **Storage Admin** role to upload training data to a Cloud Storage bucket\n\nCreate a translation dataset and import segment pairs\n-----------------------------------------------------\n\n1. [Download](/static/translate/docs/advanced/sample/automl-translation-data.zip) the\n archive file that contains the sample data for training the model, and\n extract the files.\n\n For this tutorial, you'll use the English to Spanish TSV file.\n2. Go to the AutoML Translation console.\n\n [Go to the\n Translation page](https://console.cloud.google.com/translation)\n3. From the navigation pane, click **Datasets** to go to the **Datasets** page.\n\n4. Click **Create dataset**.\n\n5. In the **Create dataset** dialog, specify details about the dataset:\n\n 1. Enter `tutorial_dataset` as the name for the dataset.\n 2. Select **English (EN)** as your source language from the drop-down list.\n 3. Select **Spanish (ES)** as your target language.\n 4. Click **Create**.\n6. After the dataset is created, click the dataset name to view its details.\n\n7. Go to the **Import** tab and upload the `en-es.tsv` dataset to\n Cloud Storage:\n\n 1. Select **Upload files from your computer**.\n 2. Click **Select files** , and choose the `en-es.tsv` file that you previously downloaded and extracted.\n 3. Click **Browse** to select or create a new Cloud Storage bucket where your TSV is stored. The bucket region must be `us-central1`.\n8. Click **Continue**.\n\n AutoML Translation automatically splits your data into training,\n validation, and testing sets. You can view these splits and the imported\n sentence pairs in the **Sentences** tab of your dataset.\n\nTrain a model\n-------------\n\n1. Go to the AutoML Translation console.\n\n [Go to the\n Translation page](https://console.cloud.google.com/translation)\n2. From the navigation pane, go to the **Datasets** page.\n\n3. Click the **tutorial_dataset** dataset.\n\n4. Go to the **Train** tab.\n\n5. Click **Start training** , which opens the **Train new model** pane.\n\n6. Enter `tutorial_model` for the model name.\n\n7. Click **Start training**.\n\nTraining a model can take several hours to complete.\n\nEvaluate the model\n------------------\n\nCheck to see how the model compares to the default Google NMT model that is\nbased on segment pairs from your test set.\n\n1. Go to the AutoML Translation console.\n\n [Go to the\n Translation page](https://console.cloud.google.com/translation)\n2. From the navigation pane, go to the **Models** page.\n\n3. Click the **tutorial_model** model.\n\n4. Click the **Evaluate** tab.\n\nIn the **Previous evaluations** section, Cloud Translation shows your model's\nBLEU score compared to the Google NMT model. The [BLEU (Bilingual Evaluation\nUnderstudy)](/translate/docs/advanced/automl-evaluate#bleu)\nscore indicates how similar the candidate text is to the reference\ntexts; values closer to 100 represent more similar texts.\n\nUse the translation model\n-------------------------\n\nFrom the Google Cloud console, you can use your custom model to translate some\ntext.\n\n1. Go to the AutoML Translation console.\n\n [Go to the\n Translation page](https://console.cloud.google.com/translation)\n2. From the navigation pane, go to the **Models** page.\n\n3. Click the **tutorial_model** model.\n\n4. Click the **Predict** tab.\n\n5. In the **English** text box, enter text to translate and then click\n **Translate**.\n\n You can compare the results from your custom model to the Google NMT model.\n\nClean up\n--------\n\nTo avoid unnecessary Google Cloud charges, delete your [model](/translate/docs/advanced/automl-models#delete-model),\n[dataset](/translate/docs/advanced/automl-datasets#delete-dataset), and `en-es.tsv` file. You can also use the\n[Google Cloud console](https://console.cloud.google.com/) to delete your project if you don't need it.\n\nWhat's next\n-----------\n\n- To learn about custom models, see the [Beginner's guide](/translate/docs/advanced/automl-beginner).\n- To create your own dataset and custom model, see [Prepare training\n data](/translate/docs/advanced/automl-prepare) for instructions on how to prepare your data."]]