Guía de inicio rápido: Crea un modelo de traducción automática

Crea un modelo de traducción automática

En esta página se muestra cómo entrenar y hacer uso del modelo de traducción automática personalizado mediante la IU de AutoML Translation. Entrena un modelo de traducción de inglés a español mediante el uso de pares de oraciones orientados hacia la tecnología de la localización de software.

Antes de comenzar

Abre la IU de AutoML Translation y selecciona tu proyecto de la lista desplegable en la parte superior derecha de la barra de título. (Debes tener acceso de funciones/editor al proyecto). La aplicación te guía a través de los pasos de configuración necesarios, que también se describen en Antes de comenzar.

Cree un conjunto de datos

  1. Descarga el archivo que contiene los datos de muestra para entrenar el modelo y extrae el archivo en-es.tsv.

  2. Ve a la IU de AutoML Translation.

  3. Selecciona el proyecto para el que habilitaste AutoML Translation.

    Página de conjuntos de datos con un conjunto de datos

  4. Haz clic en el botón Crear conjunto de datos (Create dataset).

  5. En la página Crear conjunto de datos, ingresa un nombre para el conjunto de datos y selecciona los idiomas de origen y objetivo.

    Cuando seleccionas Inglés como el idioma para Traducir del, aparecen los idiomas disponibles en Traducir al. Selecciona Español.

  6. Haz clic en Crear.

  7. En la pestaña Importar (Import) de tu conjunto de datos, haz lo siguiente:

    Pestaña Importar (Import) para my_dataset

    • Selecciona Upload files from your computer (Subir archivos desde tu computadora), haz clic en Select files (Seleccionar archivos) y elige el archivo en-es.tsv que descargaste antes.
    • Cuando elijas archivos locales, debes especificar la ruta de acceso de Cloud Storage en la que se almacenarán los archivos subidos. La región del depósito de Cloud Storage debe ser us-central1.
  8. Haz clic en Continue (Continuar).

    Regresarás a la página Conjuntos de datos. En el conjunto de datos, se mostrará una animación de proceso en curso mientras se importan tus documentos. Cuando tu conjunto de datos se haya subido con éxito, recibirás un mensaje a la dirección de correo electrónico que usaste para registrarte en el programa.

  9. Revisa el conjunto de datos.

    Luego de que tus datos se importaron con éxito, selecciona el conjunto de datos de la página de la lista de conjuntos de datos (o haz clic en el vínculo en la notificación por correo electrónico) para ver los detalles del conjunto de datos. El nombre del conjunto de datos seleccionado aparece en la barra de título y la página enumera los pares de oraciones y en qué etapa del procesamiento se usarán (ENTRENAMIENTO, VALIDACIÓN, PRUEBA).

Entrenar tu modelo

Para comenzar a entrenar tu modelo personalizado, haz clic en la pestaña Entrenar justo debajo de la barra de título, y luego en el botón Comenzar entrenamiento.

Pestaña Entrenar (Train) para el conjunto de datos my_dataset

El entrenamiento de un modelo puede tomar varias horas en completarse. Una vez que el modelo se entrenó con éxito, recibirás un mensaje en la dirección de correo electrónico que usaste para registrarte en el programa.

Cuando recibas la notificación de que se completó el entrenamiento, abre el mensaje de correo electrónico y haz clic en el vínculo para regresar a la IU de AutoML Translation. En la página Entrenar (Train), se muestran las métricas de alto nivel para el modelo, sobre todo su puntuación BLEU. La puntuación BLEU (Bilingual Evaluation Understudy) indica el grado de similitud entre el texto candidato y los textos de referencia; los valores cercanos a uno representan textos más similares.

Pestaña Entrenar (Train) para my_dataset en la que se muestra la evaluación del modelo

Usa el modelo personalizado

Haz clic en la pestaña Predecir justo debajo de la barra de título o en el vínculo Probar y usar debajo de la información del modelo. Ingresa el texto para traducir y haz clic en el botón Traducir. Puedes comparar los resultados de tu modelo personalizado con el modelo de NMT de Google.

Limpia

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.

Para evitar cargos innecesarios de Google Cloud, usa Cloud Console a fin de borrar tu proyecto si no lo necesitas.

¿Qué sigue?