Elegir un método de entrenamiento personalizado

Si vas a escribir tu propio código de entrenamiento en lugar de usar AutoML}, hay varias formas de llevar a cabo el entrenamiento personalizado. En este documento se ofrece una breve descripción general y una comparación de las diferentes formas de ejecutar un entrenamiento personalizado.

Recursos de entrenamiento personalizado en Vertex AI

Hay tres tipos de recursos de Vertex AI que puedes crear para entrenar modelos personalizados en Vertex AI:

Cuando creas un trabajo personalizado, especificas los ajustes que necesita Vertex AI para ejecutar tu código de entrenamiento, como los siguientes:

En los grupos de trabajadores, puede especificar los siguientes ajustes:

Las tareas de ajuste de hiperparámetros tienen ajustes adicionales que se pueden configurar, como la métrica. Más información sobre el ajuste de hiperparámetros

Una pipeline de entrenamiento coordina tareas de entrenamiento personalizadas o tareas de ajuste de hiperparámetros con pasos adicionales, como cargar un conjunto de datos o subir el modelo a Vertex AI una vez que se haya completado correctamente la tarea de entrenamiento.

Recursos de formación personalizados

Para ver las canalizaciones de entrenamiento de tu proyecto, ve a la página Canalizaciones de entrenamiento de la sección Vertex AI de la consolaGoogle Cloud .

Ir a Flujos de procesamiento de entrenamiento

Para ver los trabajos personalizados que ya hay en tu proyecto, ve a la página Trabajos personalizados.

Ir a Tareas personalizadas

Para ver las tareas de ajuste de hiperparámetros de tu proyecto, ve a la página Ajuste de hiperparámetros.

Ir a Ajuste de hiperparámetros

Contenedores prediseñados y personalizados

Antes de enviar una tarea de entrenamiento personalizada, una tarea de ajuste de hiperparámetros o una canalización de entrenamiento a Vertex AI, debes crear una aplicación de entrenamiento de Python o un contenedor personalizado para definir el código de entrenamiento y las dependencias que quieras ejecutar en Vertex AI. Si creas una aplicación de entrenamiento de Python con TensorFlow, PyTorch, scikit-learn o XGBoost, puedes usar nuestros contenedores prediseñados para ejecutar tu código. Si no sabes cuál de estas opciones elegir, consulta los requisitos de los códigos de formación para obtener más información.

Preparación distribuida

Puedes configurar una tarea de entrenamiento personalizada, una tarea de ajuste de hiperparámetros o un flujo de procesamiento de entrenamiento para el entrenamiento distribuido especificando varios grupos de trabajadores:

  • Usa tu primer grupo de trabajadores para configurar tu réplica principal y define el número de réplicas en 1.
  • Añade más grupos de trabajadores para configurar réplicas de trabajadores, réplicas de servidores de parámetros o réplicas de evaluadores si tu framework de aprendizaje automático admite estas tareas de clúster adicionales para el entrenamiento distribuido.

Más información sobre el entrenamiento distribuido

Siguientes pasos