Créer un modèle de traduction personnalisé

Cette page explique comment entraîner et utiliser un modèle de traduction AutoML personnalisé à l'aide de la console Google Cloud. L'exemple suivant entraîne un modèle de traduction anglais-espagnol personnalisé à l'aide de paires de phrases axées sur la technologie et issues de la localisation de logiciels.

Avant de commencer

Accédez à la page AutoML Translation, puis sélectionnez votre projet dans la liste déroulante. Vous devez au moins disposer du rôle roles/editor pour le projet. La documentation AutoML vous explique comment configurer un projet et accorder les autorisations nécessaires.

Créer un ensemble de données de traduction et importer des paires de phrases

  1. Téléchargez le fichier d'archive contenant les exemples de données pour l'entraînement du modèle, puis extrayez le fichier en-es.tsv.

  2. Accédez à la page AutoML Translation de la console.

  3. Sélectionnez le projet pour lequel vous avez activé AutoML Translation.

    Page Ensembles de données avec un ensemble de données

  4. Cliquez sur le bouton Créer un ensemble de données.

  5. Sur la page Créer un ensemble de données, saisissez le nom de l'ensemble de données, puis sélectionnez les langues source et cible.

    Lorsque vous sélectionnez l'anglais comme langue source, les langues cibles disponibles s'affichent. Sélectionnez Espagnol.

  6. Cliquez sur Créer.

  7. Dans l'onglet Importer de votre ensemble de données, procédez comme suit :

    Onglet Importer pour my_dataset

    • Sélectionnez Importer des fichiers à partir de votre ordinateur, cliquez sur Sélectionner des fichiers, puis choisissez le fichier en-es.tsv que vous avez téléchargé précédemment.
    • Lorsque vous choisissez des fichiers en local, vous devez indiquer le chemin d'accès Cloud Storage où stocker les fichiers importés. La région du bucket Cloud Storage doit être us-central1..
  8. Cliquez sur Continuer.

    Vous êtes redirigé vers la page Ensembles de données. Pendant l'importation de vos documents, l'ensemble de données affiche une animation indiquant que l'opération est en cours. Une fois l'ensemble de données importé, vous recevez un message à l'adresse e-mail avec laquelle vous vous êtes inscrit au programme.

  9. Examinez l'ensemble de données.

    Une fois les données importées, sélectionnez un ensemble sur la page "Ensembles de données" pour en afficher le détail (ou cliquez sur le lien dans la notification par e-mail). Le nom de l'ensemble de données sélectionné apparaît dans la barre de titre, et la page répertorie les paires de phrases ainsi que l'étape de traitement à laquelle elles seront utilisées (ENTRAÎNEMENT, VALIDATION, ÉVALUATION).

Entraîner un modèle de traduction AutoML

Pour commencer à entraîner votre modèle personnalisé, cliquez sur l'onglet Entraîner juste en dessous de la barre de titre, puis sur le bouton Démarrer l'entraînement.

Onglet Entraînement de l'ensemble de données my_dataset

L'entraînement d'un modèle peut prendre plusieurs heures. Quand le modèle est entraîné, vous recevez un message à l'adresse e-mail que vous avez utilisée pour vous inscrire au programme.

Lorsque vous recevez une notification indiquant que l'entraînement est terminé, ouvrez l'e-mail et cliquez sur le lien pour accéder à la console Google Cloud. La page Entraînement affiche les métriques générales du modèle, comme son score BLEU. Le score BLEU (Bilingual Evaluation Understudy) indique la similitude entre une traduction automatique et des textes de référence. Plus ce score est proche de 1, plus les textes sont similaires.

Onglet Entraînement de l'ensemble de données my_dataset affichant l'évaluation du modèle

Utiliser le modèle de traduction AutoML

Cliquez sur l'onglet Prédiction juste en dessous de la barre de titre ou sur le lien Tester et utiliser sous les informations du modèle. Saisissez du texte à traduire et cliquez sur le bouton Traduire. Vous pouvez comparer les résultats de votre modèle personnalisé à ceux du modèle Google NMT.

Effectuer un nettoyage

Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud, procédez comme suit :

Pour éviter d'encourir des frais inutiles liés à Google Cloud, supprimez votre projet à l'aide de Google Cloud Console si vous n'en avez plus besoin.

Étape suivante