Entrenar un modelo con Vertex AI y el SDK de Python

Este instructivo es una guía completa que te muestra cómo usar el SDK de Vertex AI para Python a fin de crear un modelo entrenado de forma personalizada. Ejecuta el código en un notebook de JupyterLab que crea un contenedor de Docker para entrenar y crear el modelo. El instructivo es para científicos de datos que recién comienzan a usar Vertex AI y están familiarizados con notebooks, Python y el flujo de trabajo de aprendizaje automático (AA).

El proceso comienza con el uso de la consola de Google Cloud para crear el proyecto que contiene tu trabajo. En tu proyecto, debes usar Vertex AI Workbench para crear un notebook de JupyterLab. El entorno del notebook es donde ejecutas el código que descarga y prepara un conjunto de datos, y, luego, usa el conjunto de datos para crear y entrenar un modelo. Al final del instructivo, el modelo entrenado genera predicciones.

El objetivo de este instructivo es explicarte cada paso necesario para crear predicciones en menos de una hora. El conjunto de datos que se usa es relativamente pequeño, por lo que no lleva mucho tiempo entrenar el modelo. Cuando hayas terminado, puedes aplicar lo que aprendes a conjuntos de datos más grandes. Cuanto más grande sea el conjunto de datos, más precisas serán las predicciones.

Pasos del instructivo

  1. Requisitos: Crea tu cuenta y proyecto de Google Cloud.

  2. Crear un notebook: Crea y prepara un notebook de JupyterLab y su entorno. Usa el notebook para ejecutar código que cree el conjunto de datos y cree y entrene el modelo, y genere las predicciones.

  3. Crear un conjunto de datos: Descarga un conjunto de datos de BigQuery disponible públicamente y, luego, úsalo para crear un conjunto de datos tabular de Vertex AI. El conjunto de datos contiene los datos que usas para entrenar tu modelo.

  4. Crea una secuencia de comandos de entrenamiento: Crea una secuencia de comandos de Python que pases al trabajo de entrenamiento. La secuencia de comandos se ejecuta cuando el trabajo de entrenamiento entrena y crea tu modelo.

  5. Entrena un modelo: Usa tu conjunto de datos tabular para entrenar e implementar un modelo. Debes usar el modelo para crear tus predicciones.

  6. Realizar predicciones: Usa tu modelo para crear predicciones. En esta sección, también se explica cómo borrar recursos que creas mientras ejecutas este instructivo, de modo que no se generen cargos innecesarios.

Qué consigues

En este instructivo, se explica cómo usar el SDK de Vertex AI para Python a fin de hacer lo siguiente:

  • Crear un bucket de Cloud Storage para almacenar un conjunto de datos
  • Procesar previamente datos para el entrenamiento
  • Usar los datos procesados para crear un conjunto de datos en BigQuery
  • Usar el conjunto de datos de BigQuery para crear un conjunto de datos tabular de Vertex AI
  • Crear y entrenar un modelo entrenado personalizado
  • Implementar el modelo con entrenamiento personalizado en un extremo
  • Generar una predicción
  • Anula la implementación del modelo
  • Borra todos los recursos creados en el instructivo para que no se generen cargos adicionales.

Recursos facturables utilizados

En este instructivo, se usan recursos facturables asociados con los servicios de Google Cloud, Vertex AI, BigQuery y Cloud Storage. Si eres nuevo en Google Cloud, es posible que puedas usar uno o más de estos servicios sin costo. Vertex AI ofrece $300 en créditos gratuitos a clientes nuevos, y Cloud Storage y BigQuery tienen niveles gratuitos. Para obtener más información, consulta lo siguiente:

Para evitar que se apliquen cargos adicionales, el paso final de este instructivo te explica cómo quitar todos los recursos facturables de Google Cloud que creaste.