Choisir une méthode d'entraînement personnalisé

Si vous écrivez votre propre code d'entraînement au lieu d'utiliser AutoML, plusieurs options s'offrent à vous pour l'entraînement personnalisé. Cet article présente brièvement les différentes manières de réaliser un entraînement personnalisé.

Ressources de formation personnalisées sur Vertex AI

Vous pouvez créer trois types de ressources Vertex AI pour entraîner des modèles personnalisés sur Vertex AI :

Lorsque vous créez une tâche personnalisée, vous spécifiez les paramètres dont Vertex AI a besoin pour exécuter votre code d'entraînement, y compris :

Au sein des pools de nœuds de calcul, vous pouvez spécifier les paramètres suivants :

Les tâches de réglage d'hyperparamètres bénéficient de paramètres supplémentaires à configurer, comme par exemple la métrique. En savoir plus sur les réglages d'hyperparamètres.

Un pipeline d'entraînement orchestre des tâches d'entraînement personnalisées ou des tâches de réglage d'hyperparamètres avec des étapes supplémentaires, telles que le chargement d'un ensemble de données ou l'importation du modèle dans Vertex AI une fois la tâche d'entraînement terminée avec succès.

Ressources d'entraînement personnalisé

Pour afficher les pipelines d'entraînement existants dans votre projet, accédez à la page Entraînement des pipelines dans la section Vertex AI de Google Cloud Console.

Accéder à la page Pipelines d'entraînement

Pour afficher les tâches personnalisées existantes dans votre projet, accédez à la page Tâches personnalisées.

Accéder à la page Tâches personnalisées

Pour afficher les tâches de réglage d'hyperparamètres existantes dans votre projet, accédez à la page Réglages d'hyperparamètres.

Accéder à la page Réglages d'hyperparamètres

Conteneurs prédéfinis et personnalisés

Avant d'envoyer un job d'entraînement personnalisé, un job de réglage d'hyperparamètres ou un pipeline d'entraînement à Vertex AI, vous devez créer une application d'entraînement Python ou un conteneur personnalisé pour définir le code d'entraînement et les dépendances que vous souhaitez exécuter dans Vertex AI. Si vous créez une application d'entraînement Python avec TensorFlow, PyTorch, scikit-learn ou XGBoost, vous pouvez exécuter votre code à l'aide de nos conteneurs prédéfinis. Si vous ne savez pas quelle option choisir, consultez les exigences concernant le code d'entraînement pour en savoir plus.

Entraînement distribué

Vous pouvez configurer une tâche d'entraînement personnalisée, une tâche de réglage d'hyperparamètres ou un pipeline d'entraînement pour l'entraînement distribué en spécifiant plusieurs pools de nœuds de calcul :

  • Utilisez votre premier pool de nœuds de calcul pour configurer votre instance dupliquée principale, puis définissez le nombre d'instances dupliquées sur 1.
  • Ajoutez ensuite d'autres pools de nœuds de calcul pour configurer des instances dupliquées de nœuds de calcul, des instances dupliquées de serveurs de paramètres ou des instances dupliquées d'évaluateurs, si votre framework de machine learning est compatible avec ces tâches de cluster supplémentaires pour l'entraînement distribué.

Découvrez comment utiliser l'entraînement distribué.

Étapes suivantes