Datos tabulares de Hello: crea un conjunto de datos y entrena un modelo de clasificación de AutoML

Usa Google Cloud Console para crear un conjunto de datos tabular y entrenar un modelo de clasificación.

Cree un conjunto de datos tabular

  1. En Google Cloud Console, en la sección Vertex AI, ve a la página Conjuntos de datos.

    Ir a la página Conjuntos de datos

  2. Haz clic en Crear en la barra de botones para crear un conjunto de datos nuevo.

  3. Ingresa Structured_AutoML_Tutorial para el nombre del conjunto de datos y selecciona la pestaña Tabular.

  4. Selecciona el objetivo Regresión/Clasificación.

    Deja la Región configurada como us-central1.

  5. Haga clic en Crear para crear el conjunto de datos.

    Para este instructivo, usarás un conjunto de datos bancario disponible de forma pública y alojado en Cloud Storage.

  6. En Selecciona una fuente de datos, haz clic en Seleccionar archivos CSV desde Cloud Storage.

  7. En Importar ruta de archivo, ingresa cloud-ml-tables-data/bank-marketing.csv.

  8. Haz clic en Continuar.

Analiza el conjunto de datos

La sección de análisis te permite ver más información sobre el conjunto de datos, como los valores faltantes o NULL.

Debido a que el conjunto de datos tiene el formato correcto para este instructivo, no necesitas hacer nada en esta página y puedes omitir esta sección.

  1. Opcional. Haz clic en Generar estadísticas para ver la cantidad de valores faltantes o NULL en el conjunto de datos. Este proceso puede tardar 10 minutos o más.

  2. Opcional. Haz clic en una de las columnas de atributos para obtener más información sobre los valores de datos.

Entrene un modelo de clasificación de AutoML

  1. Haga clic en Entrenar un modelo nuevo.

  2. En el panel Método de entrenamiento, confirma que el conjunto de datos que creaste antes esté seleccionado para el campo Conjunto de datos.

  3. En el campo Objetivo, selecciona Clasificación.

  4. Confirma que el método de entrenamiento de AutoML esté seleccionado.

  5. Haz clic en Continuar.

  6. En el panel Detalles del modelo, selecciona Depósito para la columna de destino y haz clic en Continuar.

    La columna objetivo es lo que estamos entrenando el modelo para predecir. La columna de depósito indica si el cliente compró un depósito de términos (2 = sí, 1 = no).

    El panel Opciones de entrenamiento te da la oportunidad de agregar atributos y transformar datos de columna. Si no hay columnas seleccionadas, todas las columnas que no sean objetivo se usarán como atributos para el entrenamiento de forma predeterminada. Este conjunto de datos está listo para usarse, por lo que no es necesario aplicar transformaciones.

  7. Haz clic en Continuar.

  8. En el panel Procesamiento y precio, ingresa 1 para el presupuesto de entrenamiento.

    El presupuesto de entrenamiento determina el tiempo de entrenamiento real, pero el tiempo para completarlo incluye otras actividades, por lo que todo el proceso puede tardar más de una hora. Cuando el modelo termina de entrenarse, se muestra en la pestaña del modelo como un vínculo disponible junto a un ícono de estado con una marca de verificación verde.

  9. Haga clic en Comenzar entrenamiento.

¿Qué sigue?

Tu modelo ya se está entrenando y puede tardar una hora o más en completarse. Cuando termine el entrenamiento, recibirás un correo electrónico. Cuando tu modelo haya finalizado el entrenamiento, sigue la página siguiente de este instructivo para implementar tu modelo y solicitar una predicción.

En este instructivo, se usa un conjunto de datos que se limpió y con el formato necesario para el entrenamiento de AutoML, pero la mayoría de los datos necesitarán algo de trabajo antes de que estén listos para usarse. La calidad de los datos de entrenamiento afecta la efectividad de los modelos que creas. Obtén más información sobre cómo preparar datos.

La obtención y la preparación de tus datos es fundamental para garantizar un modelo de aprendizaje automático preciso. Obtén más información sobre las recomendaciones

Obtén más información sobre cómo crear un conjunto de datos tabular.

Vertex AI ofrece dos métodos de entrenamiento de modelos, AutoML y entrenamiento personalizado. AutoML te permite entrenar con experiencia mínima de aprendizaje automático y esfuerzo, mientras que el entrenamiento personalizado te brinda control total sobre la funcionalidad de entrenamiento. Obtén más información sobre los métodos de entrenamiento.

Vertex AI examina el tipo de datos de origen y los valores de los atributos, y también infiere cómo se usará esa función en el entrenamiento de modelos. Se recomienda que revises el tipo de datos de cada columna para verificar que se haya interpretado de forma correcta. Si es necesario, puedes especificar una transformación compatible diferente para un atributo. Obtén más información sobre las transformaciones.

Obtén más información sobre cómo entrenar AutoML para una clasificación o regresión.