Guide de démarrage rapide : créer un modèle de traduction automatique

Créer un modèle de traduction automatique

Cette page explique comment entraîner et utiliser un modèle de traduction automatique personnalisé, avec l'interface utilisateur d'AutoML Translation. Ce service entraîne un modèle de traduction anglais-espagnol personnalisé, avec des paires de phrases axées sur la technologie et issues de la localisation de logiciels.

Avant de commencer

Ouvrez l'interface utilisateur d'AutoML Translation et sélectionnez votre projet dans la liste déroulante située dans l'angle supérieur droit de la barre de titre. Vous devez au moins disposer du rôle roles/editor pour le projet. L'application vous guide tout au long du processus de configuration nécessaire, également décrit dans la section Avant de commencer.

Créer un ensemble de données

  1. Téléchargez le fichier d'archive contenant les exemples de données pour l'entraînement du modèle, puis extrayez le fichier en-es.tsv.

  2. Accédez à l'interface utilisateur d'AutoML Translation.

  3. Sélectionnez le projet pour lequel vous avez activé AutoML Translation.

    Page Ensembles de données avec un ensemble de données

  4. Cliquez sur le bouton Créer un ensemble de données.

  5. Sur la page Créer un ensemble de données, saisissez le nom de l'ensemble de données, puis sélectionnez les langues source et cible.

    Lorsque vous sélectionnez l'anglais comme langue source, les langues cibles disponibles s'affichent. Sélectionnez Espagnol.

  6. Cliquez sur Créer.

  7. Dans l'onglet Importer de votre ensemble de données, procédez comme suit :

    Onglet Importer pour my_dataset

    • Sélectionnez Importer des fichiers à partir de votre ordinateur, cliquez sur Sélectionner des fichiers, puis choisissez le fichier en-es.tsv que vous avez téléchargé précédemment.
    • Lorsque vous choisissez des fichiers en local, vous devez indiquer le chemin d'accès Cloud Storage où stocker les fichiers importés. La région du bucket Cloud Storage doit être us-central1..
  8. Cliquez sur Continuer.

    Vous êtes redirigé vers la page Ensembles de données. Pendant l'importation de vos documents, l'ensemble de données affiche une animation indiquant que l'opération est en cours. Une fois l'ensemble de données importé, vous recevez un message à l'adresse e-mail avec laquelle vous vous êtes inscrit au programme.

  9. Examinez l'ensemble de données.

    Une fois les données importées, sélectionnez un ensemble sur la page "Ensembles de données" pour en afficher le détail (ou cliquez sur le lien dans la notification par e-mail). Le nom de l'ensemble de données sélectionné apparaît dans la barre de titre, et la page répertorie les paires de phrases, ainsi que l'étape de traitement à laquelle elles seront utilisées (ENTRAÎNEMENT, VALIDATION, ÉVALUATION).

Entraîner votre modèle

Pour commencer à entraîner votre modèle personnalisé, cliquez sur l'onglet Entraîner juste en dessous de la barre de titre, puis sur le bouton Démarrer l'entraînement.

Onglet Entraînement de l'ensemble de données my_dataset

L'entraînement d'un modèle peut prendre plusieurs heures. Quand le modèle est entraîné, vous recevez un message à l'adresse e-mail que vous avez utilisée pour vous inscrire au programme.

Lorsque vous recevez une notification indiquant que l'entraînement est terminé, ouvrez l'e-mail et cliquez sur le lien pour revenir à l'interface utilisateur d'AutoML Translation. La page Entraînement affiche les métriques générales du modèle, comme son score BLEU. Le score BLEU (Bilingual Evaluation Understudy) indique la similitude entre une traduction automatique et des textes de référence. Plus ce score est proche de 1, plus les textes sont similaires.

Onglet Entraînement de l'ensemble de données my_dataset affichant l'évaluation du modèle

Utiliser le modèle personnalisé

Cliquez sur l'onglet Prédiction juste en dessous de la barre de titre ou sur le lien Tester et utiliser sous les informations du modèle. Saisissez du texte à traduire et cliquez sur le bouton Traduire. Vous pouvez comparer les résultats de votre modèle personnalisé à ceux du modèle Google NMT.

Effectuer un nettoyage

Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud :

Pour éviter d'encourir des frais inutiles liés à Google Cloud, supprimez votre projet à l'aide de Cloud Console si vous n'en avez plus besoin.

Étape suivante