Crea un modelo de traducción personalizado

En esta página, se muestra cómo entrenar y usar un modelo de traducción de AutoML personalizado mediante la consola de Google Cloud. En el siguiente ejemplo, se entrena un modelo de traducción de inglés a español mediante el uso de pares de oraciones orientados hacia la tecnología sobre la localización de software.

Antes de comenzar

Ve a la página AutoML Translation y selecciona tu proyecto de la lista desplegable. Debes tener acceso de roles/editor al proyecto. La documentación de AutoML te explica cómo configurar un proyecto y otorgar los permisos necesarios.

Crea un conjunto de datos de traducción e importa pares de oraciones

  1. Descarga el archivo que contiene los datos de muestra para entrenar el modelo y extrae el archivo en-es.tsv.

  2. Ve a la página de la consola de AutoML Translation.

  3. Selecciona el proyecto para el que habilitaste AutoML Translation.

    Página de conjuntos de datos con un conjunto de datos

  4. Haz clic en el botón Crear conjunto de datos (Create dataset).

  5. En la página Crear conjunto de datos, ingresa un nombre para el conjunto de datos y selecciona los idiomas de origen y objetivo.

    Cuando seleccionas Inglés como el idioma para Traducir del, aparecen los idiomas disponibles en Traducir al. Selecciona Español.

  6. Haz clic en Crear.

  7. En la pestaña Importar (Import) de tu conjunto de datos, haz lo siguiente:

    Pestaña Importar (Import) para my_dataset

    • Selecciona Upload files from your computer (Subir archivos desde tu computadora), haz clic en Select files (Seleccionar archivos) y elige el archivo en-es.tsv que descargaste antes.
    • Cuando elijas archivos locales, debes especificar la ruta de acceso de Cloud Storage en la que se almacenarán los archivos subidos. La región del depósito de Cloud Storage debe ser us-central1.
  8. Haz clic en Continue (Continuar).

    Regresarás a la página Conjuntos de datos. En el conjunto de datos, se mostrará una animación de proceso en curso mientras se importan tus documentos. Cuando tu conjunto de datos se haya subido con éxito, recibirás un mensaje a la dirección de correo electrónico que usaste para registrarte en el programa.

  9. Revisa el conjunto de datos.

    Luego de que tus datos se importaron con éxito, selecciona el conjunto de datos de la página de la lista de conjuntos de datos (o haz clic en el vínculo en la notificación por correo electrónico) para ver los detalles del conjunto de datos. El nombre del conjunto de datos seleccionado aparece en la barra de título y la página enumera los pares de oraciones y en qué etapa del procesamiento se usarán (ENTRENAMIENTO, VALIDACIÓN, PRUEBA).

Entrena un modelo de traducción de AutoML

Para comenzar a entrenar tu modelo personalizado, haz clic en la pestaña Entrenar justo debajo de la barra de título, y luego en el botón Comenzar entrenamiento.

Pestaña Entrenar (Train) para el conjunto de datos my_dataset

El entrenamiento de un modelo puede tomar varias horas en completarse. Una vez que el modelo se entrenó con éxito, recibirás un mensaje en la dirección de correo electrónico que usaste para registrarte en el programa.

Cuando recibas la notificación de que se completó el entrenamiento, abre el mensaje de correo electrónico y haz clic en el vínculo para ir a la consola de Google Cloud. En la página Entrenar (Train), se muestran las métricas de alto nivel para el modelo, sobre todo su puntuación BLEU. La puntuación BLEU (Bilingual Evaluation Understudy) indica el grado de similitud entre el texto candidato y los textos de referencia; los valores cercanos a uno representan textos más similares.

Pestaña Entrenar (Train) de my_dataset que muestra la evaluación del modelo

Usa el modelo de traducción de AutoML

Haz clic en la pestaña Predecir justo debajo de la barra de título o en el vínculo Probar y usar debajo de la información del modelo. Ingresa el texto para traducir y haz clic en el botón Traducir. Puedes comparar los resultados de tu modelo personalizado con el modelo de NMT de Google.

Limpieza

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.

A fin de evitar cargos innecesarios de Google Cloud, usa la consola de Google Cloud para borrar tu proyecto si no lo necesitas.

¿Qué sigue?