Choisir une méthode d'entraînement

Cet article explique les principales différences entre l'entraînement d'un modèle dans Vertex AI à l'aide d'AutoML, l'entraînement personnalisé et l'entraînement d'un modèle à l'aide de BigQuery ML.

AutoML vous permet de créer et d'entraîner un modèle avec un minimum d'efforts techniques. Vous pouvez utiliser AutoML pour créer rapidement des prototypes de modèles et explorer de nouveaux ensembles de données avant d'investir dans le développement. Par exemple, vous pouvez l'utiliser pour connaître les fonctionnalités les plus adaptées à un ensemble de données spécifique.

Avec l'entraînement personnalisé, vous pouvez créer une application d'entraînement optimisée pour votre résultat ciblé. Vous contrôlez entièrement les fonctionnalités de l'application d'entraînement. En d'autres termes, vous pouvez cibler n'importe quel objectif, utiliser n'importe quel algorithme, développer vos propres fonctions ou métriques de perte, ou effectuer toute autre personnalisation.

Avec BigQuery ML, vous pouvez entraîner des modèles à l'aide de vos données BigQuery directement dans BigQuery. Les commandes SQL vous permettent de créer rapidement un modèle et de l'utiliser pour obtenir des prédictions par lot.

Pour comparer les différentes fonctionnalités ainsi que le niveau d'expertise pour chaque service, consultez le tableau suivant.

AutoML Entraînement personnalisé BigQuery ML
Connaissance de la science des données requise Non Oui, pour développer l'application d'entraînement et effectuer la préparation des données, par exemple avec une ingénierie des caractéristiques. Non.
Capacité de programmation nécessaire Non, AutoML s'utilise sans code. Oui, pour développer l'application d'entraînement. Capacité de programmation SQL nécessaire pour créer, évaluer et utiliser le modèle dans BigQuery ML
Temps nécessaire pour l'entraînement Inférieur. La préparation des données est réduite, et aucun développement n'est nécessaire. Élevé. Nécessite davantage de préparation des données en plus du développement de l'application d'entraînement. Durée plus courte. La vitesse de développement des modèles est augmentée puisque vous n'avez pas besoin de créer l'infrastructure requise pour les prédictions par lot ni pour l'entraînement de modèles, car BigQuery ML exploite le moteur de calcul BigQuery. L'entraînement, l'évaluation et la prédiction sont ainsi accélérés.
Limites sur les objectifs de machine learning Oui, vous devez cibler l'un des objectifs prédéfinis d'AutoML. Non Oui.
Optimiser manuellement les performances du modèle avec les réglages d'hyperparamètres Non. AutoML effectue certains réglages automatiques des hyperparamètres mais vous ne pouvez pas modifier les valeurs utilisées. Oui. Vous pouvez ajuster le modèle lors de chaque entraînement pour expérimenter et comparer. Oui. BigQuery ML permet de régler les hyperparamètres lors de l'entraînement de modèles de ML grâce aux instructions CREATE MODEL.
Contrôler les aspects de l'environnement d'entraînement Limité. Pour les ensembles de données d'images et de données tabulaires, vous pouvez spécifier le nombre d'heures de nœud pour l'entraînement et si vous souhaitez autoriser l'arrêt prématuré de l'entraînement. Oui. Vous pouvez spécifier certains aspects de l'environnement, tels que le type de machine, la taille du disque, le framework de machine learning et le nombre de nœuds. Non.
Limites de taille des données

Oui. AutoML utilise des ensembles de données gérés. Les limitations de taille varient en fonction du type de l'ensemble de données. Reportez-vous à l'une des rubriques suivantes pour plus de détails :

Pour les ensembles de données non gérés, non. Les ensembles de données gérés présentent les mêmes limites que les objets d'ensembles de données gérés créés et hébergés par Vertex AI et sont utilisés pour entraîner des modèles AutoML. Oui. BigQuery ML applique des quotas appropriés par projet. Pour en savoir plus, consultez la page Quotas et limites.

Étapes suivantes