Entrenar un modelo con Vertex AI y el SDK de Python

Este instructivo es una guía completa que muestra cómo usar el SDK de Vertex AI para Python para crear un modelo entrenado de forma personalizada. Ejecuta código en un notebook de Jupyter que usa un contenedor de Docker para entrenar y crear el modelo. El instructivo es para los científicos de datos que son nuevos en Vertex AI y están familiarizados con las notebooks, Python y el flujo de trabajo del aprendizaje automático (AA).

El proceso comienza con el uso de la consola de Google Cloud para crear el proyecto que contiene tu trabajo. En tu proyecto, usa Vertex AI Workbench para crear un notebook de Jupyter. El entorno del notebook es donde ejecutas el código que descarga y prepara un conjunto de datos, y, luego, usa el conjunto de datos para crear y entrenar un modelo. Al final del instructivo, el modelo entrenado genera predicciones.

El objetivo de este instructivo es guiarte por cada paso necesario para crear predicciones en menos de una hora. El conjunto de datos que se usa es relativamente pequeño, por lo que no tardará mucho tiempo en entrenar tu modelo. Cuando termines, puedes aplicar lo que aprendiste a conjuntos de datos más grandes. Cuanto más grande sea tu conjunto de datos, más precisas serán tus predicciones.

Pasos del instructivo

  1. Requisitos previos: Crea tu cuenta y proyecto de Google Cloud.

  2. Crear un notebook de Jupyter: Crea y prepara un notebook de Jupyter y su entorno. Usa el notebook para ejecutar el código que crea tu conjunto de datos, crea y entrena tu modelo, y genera tus predicciones.

  3. Crea un conjunto de datos: Descarga un conjunto de datos de BigQuery disponible de forma pública y, luego, úsalo para crear un conjunto de datos tabular de Vertex AI. El conjunto contiene los datos que usas para entrenar tu modelo.

  4. Crea una secuencia de comandos de entrenamiento: Crea una secuencia de comandos de Python que pasarás a tu trabajo de entrenamiento. La secuencia de comandos se ejecuta cuando el trabajo de entrenamiento entrena y crea tu modelo.

  5. Entrena un modelo: Usa tu conjunto de datos tabular para entrenar e implementar un modelo. Usa el modelo para crear tus predicciones.

  6. Realiza predicciones: Usa tu modelo para crear predicciones. En esta sección, también se explica cómo borrar recursos que creas mientras ejecutas este instructivo para no generar cargos innecesarios.

Qué consigues

En este instructivo, se explica cómo usar el SDK de Vertex AI para Python para hacer lo siguiente:

  • Crear un bucket de Cloud Storage para almacenar un conjunto de datos
  • Procesar previamente datos para el entrenamiento
  • Usar los datos procesados para crear un conjunto de datos en BigQuery
  • Usar el conjunto de datos de BigQuery para crear un conjunto de datos tabular de Vertex AI
  • Crear y entrenar un modelo entrenado personalizado
  • Implementar el modelo con entrenamiento personalizado en un extremo
  • Generar una predicción
  • Anula la implementación del modelo
  • Borrar todos los recursos creados en el instructivo para que no se generen más cargos

Recursos facturables usados

En este instructivo, se usan recursos facturables asociados con los servicios de Vertex AI, BigQuery y Cloud Storage de Google Cloud. Si es la primera vez que usas Google Cloud, es posible que puedas usar uno o más de estos servicios sin costo. Vertex AI ofrece $300 en créditos gratuitos a clientes nuevos, y Cloud Storage y BigQuery tienen niveles gratuitos. Para obtener más información, consulta lo siguiente:

Para evitar cargos adicionales, en el último paso de este instructivo se explica cómo quitar todos los recursos facturables de Google Cloud que creaste.