Entrenar un modelo con Vertex AI y el SDK de Python

En este tutorial se explica de principio a fin cómo usar el SDK de Vertex AI para Python con el fin de crear un modelo entrenado de forma personalizada. Ejecutas código en un archivo de cuaderno (IPYNB) que usa un contenedor Docker para entrenar y crear el modelo. Este tutorial está dirigido a científicos de datos que no tienen experiencia con Vertex AI y que están familiarizados con los cuadernos, Python y el flujo de trabajo de aprendizaje automático (AA).

El proceso empieza con la Google Cloud consola para crear el proyecto que contiene tu trabajo. En tu proyecto, usa Vertex AI Workbench para crear un cuaderno de Jupyter. El entorno de cuaderno es donde ejecutas el código que descarga y prepara un conjunto de datos, y luego usas el conjunto de datos para crear y entrenar un modelo. Al final del tutorial, el modelo entrenado genera predicciones.

El objetivo de este tutorial es mostrarte todos los pasos necesarios para crear predicciones en menos de una hora. El conjunto de datos utilizado es relativamente pequeño, por lo que no se tarda mucho en entrenar el modelo. Cuando hayas terminado, podrás aplicar lo que hayas aprendido a conjuntos de datos más grandes. Cuanto mayor sea el conjunto de datos, más precisas serán las predicciones.

Pasos del tutorial

  1. Requisitos previos: crea tu Google Cloud cuenta y tu proyecto.

  2. Crear un cuaderno: crea y prepara un cuaderno de Jupyter y su entorno. Usas el cuaderno para ejecutar el código que crea tu conjunto de datos, crea y entrena tu modelo, y genera tus predicciones.

  3. Crear un conjunto de datos: descarga un conjunto de datos de BigQuery disponible públicamente y, a continuación, úsalo para crear un conjunto de datos tabular de Vertex AI. El conjunto de datos contiene los datos que usas para entrenar tu modelo.

  4. Crea una secuencia de comandos de entrenamiento: crea una secuencia de comandos de Python que se pasa a tu trabajo de entrenamiento. La secuencia de comandos se ejecuta cuando la tarea de entrenamiento entrena y crea el modelo.

  5. Entrenar un modelo: usa tu conjunto de datos tabular para entrenar y desplegar un modelo. Usas el modelo para crear tus predicciones.

  6. Hacer predicciones: usa tu modelo para crear predicciones. En esta sección también se explica cómo eliminar los recursos que crees durante este tutorial para que no se te cobren cargos innecesarios.

Qué consigues

En este tutorial se explica cómo usar el SDK de Vertex AI para Python para hacer lo siguiente:

  • Crear un segmento de Cloud Storage para almacenar un conjunto de datos
  • Preprocesar datos para el entrenamiento
  • Usar los datos procesados para crear un conjunto de datos en BigQuery
  • Usar el conjunto de datos de BigQuery para crear un conjunto de datos tabular de Vertex AI
  • Crear y entrenar un modelo personalizado
  • Desplegar el modelo entrenado de forma personalizada en un endpoint
  • Generar una predicción
  • Anular el despliegue del modelo
  • Elimina todos los recursos creados en el tutorial para que no se te apliquen más cargos

Recursos facturables utilizados

En este tutorial se usan recursos facturables asociados a los servicios Vertex AI, BigQuery y Cloud Storage. Google Cloud Si no has usado Google Cloudantes, es posible que puedas usar uno o varios de estos servicios sin coste económico. Vertex AI ofrece 300 USD en crédito gratis a los nuevos clientes, y Cloud Storage y BigQuery tienen niveles gratuitos. Para obtener más información, consulta las siguientes secciones:

Para evitar que se te apliquen más cargos, en el último paso de este tutorial se explica cómo eliminar todos los recursos facturables Google Cloud que has creado.