Elegir un método de entrenamiento personalizado

Si escribes tu propio código de entrenamiento en lugar de usar AutoML, existen varias formas de realizar un entrenamiento personalizado para tener en cuenta. En este tema, se proporciona una breve descripción general y una comparación de las diferentes formas en las que puedes ejecutar el entrenamiento personalizado.

Recursos de entrenamiento personalizado en Vertex AI

Existen tres tipos de recursos de Vertex AI que puedes crear para entrenar modelos personalizados en Vertex AI:

Cuando creas un trabajo personalizado, especificas la configuración que necesita Vertex AI para ejecutar tu código de entrenamiento, incluido lo siguiente:

En los grupos de trabajadores, puedes especificar la siguiente configuración:

Los trabajos de ajuste de hiperparámetros tienen parámetros de configuración adicionales, como la métrica. Obtén más información sobre el ajuste de hiperparámetros.

Una canalización de entrenamiento organiza trabajos de entrenamiento personalizado o trabajos de ajuste de hiperparámetros con pasos adicionales, como cargar un conjunto de datos o subir el modelo a Vertex AI después de que el trabajo de entrenamiento se completa de forma correcta.

Recursos de entrenamiento personalizado

Para ver las canalizaciones de entrenamiento existentes en tu proyecto, ve a la página Canalizaciones de entrenamiento en la sección Vertex AI de Google Cloud Console.

Ir a Canalizaciones de entrenamiento

Para ver los trabajos personalizados existentes en tu proyecto, ve a la página Trabajos personalizados.

Ir a Trabajos personalizados

Para ver los trabajos de ajuste de hiperparámetros existentes en tu proyecto, ve a la página Ajuste de hiperparámetros.

Ir a Ajuste de hiperparámetros

Contenedores previamente compilados y personalizados

Antes de enviar un trabajo de entrenamiento personalizado, un trabajo de ajuste de hiperparámetros o una canalización de entrenamiento a Vertex AI, debes crear una Aplicación de entrenamiento de Python o un contenedor personalizado para definir el código de entrenamiento y las dependencias que deseas ejecutar en Vertex AI. Si creas una aplicación de entrenamiento de Python mediante TensorFlow, scikit-learn o XGBoost, puedes usar nuestros contenedores compilados con anterioridad para ejecutar tu código. Si no estás seguro de cuál de estas opciones elegir, consulta los requisitos del código de entrenamiento para obtener más información.

Entrenamiento distribuido

Puedes configurar un trabajo de entrenamiento personalizado, un trabajo de ajuste de hiperparámetros o una canalización de entrenamiento para el entrenamiento distribuido si especificas varios grupos de trabajadores:

  • Usa tu primer grupo de trabajadores para configurar la réplica principal y establece el recuento de réplicas en 1.
  • Agrega más grupos de trabajadores para configurar réplicas de trabajadores, réplicas del servidor de parámetros o réplicas de evaluadores si tu framework de aprendizaje automático admite estas tareas adicionales del clúster para el entrenamiento distribuido.

Obtén más información sobre cómo usar el entrenamiento distribuido.

¿Qué sigue?