Entrenar un modelo con Vertex AI y el SDK de Python
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Este instructivo es una guía completa que muestra cómo usar el SDK de Vertex AI para Python para crear un modelo entrenado de forma personalizada. Ejecutas código en un archivo de notebook (IPYNB) que usa un contenedor de Docker para entrenar y crear el modelo. El instructivo es para los científicos de datos que son nuevos en Vertex AI y están familiarizados con las notebooks, Python y el flujo de trabajo del aprendizaje automático (AA).
El proceso comienza con el uso de la consola de Google Cloud para crear el proyecto que contiene tu trabajo. En tu proyecto, usa Vertex AI Workbench para crear un notebook de Jupyter. El entorno del notebook es donde ejecutas el código que descarga y prepara un conjunto de datos, y, luego, usa el conjunto de datos para crear y entrenar un modelo. Al final del instructivo, el modelo entrenado genera predicciones.
El objetivo de este instructivo es guiarte por cada paso necesario para crear predicciones en menos de una hora. El conjunto de datos que se usa es relativamente pequeño, por lo que no tardará mucho tiempo en entrenar tu modelo. Cuando termines, puedes aplicar lo que aprendiste a conjuntos de datos más grandes. Cuanto más grande sea tu conjunto de datos, más precisas serán tus predicciones.
Crea un notebook: Crea y prepara un notebook de Jupyter y su entorno. Usa el notebook para ejecutar el código que crea tu conjunto de datos, crea y entrena tu modelo, y genera tus predicciones.
Crea un conjunto de datos: Descarga un conjunto de datos de BigQuery disponible de forma pública y, luego, úsalo para crear un conjunto de datos tabular de Vertex AI. El conjunto contiene los datos que usas para entrenar tu modelo.
Crea una secuencia de comandos de entrenamiento: Crea una secuencia de comandos de Python que pasarás a tu trabajo de entrenamiento. La secuencia de comandos se ejecuta cuando el trabajo de entrenamiento entrena y crea tu modelo.
Entrena un modelo: Usa tu conjunto de datos tabular para entrenar e implementar un modelo. Usa el modelo para crear tus predicciones.
Realiza predicciones: Usa tu modelo para crear predicciones. En esta sección, también se explica cómo borrar recursos que creas mientras ejecutas este instructivo para no generar cargos innecesarios.
Qué consigues
En este instructivo, se explica cómo usar el SDK de Vertex AI para Python para hacer lo siguiente:
Crear un bucket de Cloud Storage para almacenar un conjunto de datos
Procesar previamente datos para el entrenamiento
Usar los datos procesados para crear un conjunto de datos en BigQuery
Usar el conjunto de datos de BigQuery para crear un conjunto de datos tabular de Vertex AI
Crear y entrenar un modelo entrenado personalizado
Implementar el modelo con entrenamiento personalizado en un extremo
Generar una predicción
Anula la implementación del modelo
Borrar todos los recursos creados en el instructivo para que no se generen más cargos
Recursos facturables usados
En este instructivo, se usan recursos facturables asociados con los servicios de Vertex AI, BigQuery y Cloud Storage Google Cloud . Si es la primera vez que usas Google Cloud, es posible que puedas usar uno o más de estos servicios sin costo. Vertex AI ofrece $300 en créditos gratuitos a clientes nuevos, y Cloud Storage y BigQuery tienen niveles gratuitos. Para obtener más información, consulta lo siguiente:
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-04 (UTC)"],[],[],null,["# Train a model using Vertex AI and the Python SDK\n\n| This tutorial takes between 30 and 60 minutes to complete.\n\n\u003cbr /\u003e\n\nThis tutorial is a start-to-finish guide that shows you how to use the\nVertex AI SDK for Python to create a custom-trained model. You run code in a\nnotebook (IPYNB) file that uses a Docker container to train and create the\nmodel. The tutorial is for data scientists who are new to Vertex AI and\nfamiliar with notebooks, Python, and the Machine Learning (ML) workflow.\n\nThe process starts using the Google Cloud console to create the project that\ncontains your work. In your project, you use Vertex AI Workbench to\ncreate a Jupyter notebook. The notebook environment is where you run code\nthat downloads and prepares a dataset, then use the dataset to create and train\na model. At the end of the tutorial, the trained model generates predictions.\n\nThe goal of this tutorial is to walk you through every step required to create\npredictions in less than an hour. The dataset used is relatively small so that it\ndoesn't take very long to train your model. When you're done, you can apply what\nyou learn to larger datasets. The larger your dataset is, the more accurate your\npredictions are.\n\nTutorial steps\n--------------\n\n1. [Prerequisites](/vertex-ai/docs/tutorials/tabular-bq-prediction/prerequisites) - Create your Google Cloud\n account and project.\n\n2. [Create a\n notebook](/vertex-ai/docs/tutorials/tabular-bq-prediction/create-notebook) -\n Create and prepare a Jupyter notebook and its environment. You use the\n notebook to run code that creates your dataset, creates and trains your\n model, and generates your predictions.\n\n3. [Create a dataset](/vertex-ai/docs/tutorials/tabular-bq-prediction/create-dataset) - Download a publicly\n available BigQuery dataset, then use it to create a Vertex AI\n tabular dataset. The dataset contains the data you use to train your model.\n\n4. [Create a training script](/vertex-ai/docs/tutorials/tabular-bq-prediction/create-training-script) - Create\n a Python script that you pass to your training job. The script runs when the\n training job trains and creates your model.\n\n5. [Train a model](/vertex-ai/docs/tutorials/tabular-bq-prediction/train-and-deploy-model) - Use your tabular\n dataset to train and deploy a model. You use the model to create your\n predictions.\n\n6. [Make predictions](/vertex-ai/docs/tutorials/tabular-bq-prediction/make-prediction) - Use your model to\n create predictions. This section also walks you through deleting resources\n you create while running this tutorial so you don't incur unnecessary\n charges.\n\nWhat you accomplish\n-------------------\n\nThis tutorial walks you through how to use the Vertex AI SDK for Python to do the\nfollowing:\n\n- Create a Cloud Storage bucket to store a dataset\n- Preprocess data for training\n- Use the processed data to create a dataset in BigQuery\n- Use the BigQuery dataset to create a Vertex AI tabular dataset\n- Create and train a custom-trained model\n- Deploy the custom-trained model to an endpoint\n- Generate a prediction\n- Undeploy the model\n- Delete all resources created in the tutorial so you don't incur further charges\n\nBillable resources used\n-----------------------\n\nThis tutorial uses billable resources associated with the Vertex AI,\nBigQuery, and Cloud Storage Google Cloud services. If you're\nnew to Google Cloud, you might be able to use one or more of these services at\nno cost. Vertex AI offers $300 in free credits to new customers, and\nCloud Storage and BigQuery have [free\ntiers](https://cloud.google.com/free). For more information, see the following:\n\n- [Vertex AI pricing](/vertex-ai/pricing) and [Free cloud features and trial offer](https://cloud.google.com/free/docs/free-cloud-features#free-trial)\n- [BigQuery pricing](/bigquery/pricing) and [BigQuery free tier usage](https://cloud.google.com/free/docs/free-cloud-features?#bigquery)\n- [Cloud Storage pricing](/storage/pricing) and [Cloud Storage free tier usage](https://cloud.google.com/free/docs/free-cloud-features#storage)\n- [Google Cloud pricing calculator](/products/calculator)\n\nTo prevent further charges, the final step of this tutorial walks you\nthrough removing all billable Google Cloud resources you created."]]