Guía de inicio rápido

Esta guía de inicio rápido te muestra cómo usar AutoML Natural Language para crear un modelo de aprendizaje automático personalizado para clasificar contenido. Este entrena un modelo personalizado mediante un corpus de "momentos felices" de la comunidad del conjunto de datos de código abierto de Kaggle HappyDB. El modelo resultante clasifica los momentos felices en categorías que reflejan las causa de la felicidad.

Los datos están disponibles a través de una licencia CCO: de dominio público de Creative Commons.

Instalar el SDK de Google Cloud

AutoML Natural Language hace uso de la herramienta de línea de comandos de gcloud, que se distribuye en el SDK de Cloud de Google Cloud Platform. Sigue las instrucciones de la página para instalar y configurar el SDK de Cloud.

¿Necesitas un símbolo del sistema? Puedes usar Google Cloud Shell. Google Cloud Shell es un entorno de línea de comandos que ya incluye el SDK de Google Cloud, por lo que no es necesario que lo instales. (El SDK de Google Cloud también viene preinstalado en las máquinas virtuales de Google Compute Engine).

Configurar tu proyecto

Antes de poder usar AutoML Natural Language, debes habilitarlo para tu proyecto. Abre la IU de AutoML Natural Language y selecciona tu proyecto de la lista desplegable en la parte superior derecha de la barra de título. (Al menos debes tener el acceso de funciones/editor al proyecto). La aplicación te guía a través de los pasos necesarios, que también se describen en Antes de comenzar.

Crear un conjunto de datos

  1. Descarga el archivo .csv que contiene los artículos de texto etiquetados para usarlos para entrenar el modelo.

  2. Visita la página de AutoML Natural Language.

  3. Haz clic en el botón Conjunto de datos nuevo en la barra de título.

  4. En la página Crear conjunto de datos, ingresa un nombre para el conjunto de datos, selecciona Subir un archivo CSV desde tu computadora y elige el archivo que descargaste en el paso 1.

    1. Haz clic en Crear conjunto de datos.

    Has vuelto a la página Conjuntos de datos: tu conjunto de datos mostrará una animación en curso mientras se importan tus documentos. Este proceso suele tardar alrededor de 10 minutos cada 1,000 documentos en completarse, aunque esto puede variar.

    Una vez que el conjunto de datos se ha creado correctamente, recibirás un mensaje en la dirección de correo electrónico que utilizaste para registrarte en el programa.

Entrenar tu modelo

Luego de que tus datos se importaron con éxito, selecciona el conjunto de datos de la página de la lista de conjuntos de datos para ver los detalles. El nombre del conjunto de datos de entrenamiento seleccionado aparece en la barra de título y la página enumera los elementos de texto individuales del conjunto de datos junto con sus etiquetas. La barra de navegación a la izquierda resume el número de elementos etiquetados y no etiquetados, y te permite filtrar la lista de elementos por etiqueta.

Página de elementos de texto

Cuando hayas terminado de revisar el conjunto de datos, haz clic en la pestaña Train (Entrenar) justo debajo de la barra de título. Haz clic en el botón Start Training (Comenzar a entrenar) para comenzar a entrenar el modelo.

El entrenamiento de un modelo puede tardar varias horas en completarse. Una vez que el modelo se entrenó con éxito, recibirás un mensaje en la dirección de correo electrónico que usaste para registrarte en el programa.

Después del entrenamiento, la parte inferior de la página Train (Entrenar) muestra las métricas de nivel alto para el modelo, como la precisión y recuperación. Para ver más detalles, haz clic en la pestaña Evaluate (Evaluar).

Usar el modelo personalizado

Una vez que tu modelo ha sido entrenado con éxito, puedes usarlo para clasificar texto con tu modelo personalizado. Haz clic en la pestaña Predict (Predecir) justo debajo de la barra de título, ingresa el texto en el cuadro de texto y haz clic en Predict (Predecir). AutoML Natural Language evalúa el texto usando tu modelo y muestra la puntuación para cada etiqueta.

Limpiar

A fin de evitar cargos innecesarios en Google Cloud Platform, usa GCP Console para borrar tu proyecto si no lo necesitas.

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

AutoML Natural Language
¿Necesitas ayuda? Visita nuestra página de asistencia.