Ce document explique les principales différences entre l'entraînement d'un modèle dans Vertex AI à l'aide d'AutoML, l'entraînement personnalisé et l'entraînement d'un modèle à l'aide de BigQuery ML.
AutoML vous permet de créer et d'entraîner un modèle avec un minimum d'efforts techniques. Vous pouvez utiliser AutoML pour créer rapidement des prototypes de modèles et explorer de nouveaux ensembles de données avant d'investir dans le développement. Par exemple, vous pouvez l'utiliser pour connaître les fonctionnalités les plus adaptées à un ensemble de données spécifique.
Avec l'entraînement personnalisé, vous pouvez créer une application d'entraînement optimisée pour votre résultat ciblé. Vous contrôlez entièrement les fonctionnalités de l'application d'entraînement. En d'autres termes, vous pouvez cibler n'importe quel objectif, utiliser n'importe quel algorithme, développer vos propres fonctions ou métriques de perte, ou effectuer toute autre personnalisation.
Avec BigQuery ML, vous pouvez entraîner des modèles à l'aide de vos données BigQuery directement dans BigQuery. Les commandes SQL vous permettent de créer rapidement un modèle et de l'utiliser pour obtenir des prédictions par lot.
Pour comparer les différentes fonctionnalités ainsi que le niveau d'expertise pour chaque service, consultez le tableau suivant.
AutoML | Entraînement personnalisé | BigQuery ML | |
---|---|---|---|
Connaissance de la data science requise | Non | Oui, pour développer l'application d'entraînement et effectuer la préparation des données, par exemple avec une ingénierie des caractéristiques. | Non. |
Capacité de programmation nécessaire | Non, AutoML s'utilise sans code. | Oui, pour développer l'application d'entraînement. | Capacité de programmation SQL nécessaire pour créer, évaluer et utiliser le modèle dans BigQuery ML |
Temps nécessaire pour l'entraînement | Durée plus courte. La préparation des données est réduite, et aucun développement n'est nécessaire. | Durée plus longue. Nécessite davantage de préparation des données en plus du développement de l'application d'entraînement. | Durée plus courte. La vitesse de développement des modèles est augmentée puisque vous n'avez pas besoin de créer l'infrastructure requise pour les prédictions par lot ni pour l'entraînement de modèles, car BigQuery ML exploite le moteur de calcul BigQuery. L'entraînement, l'évaluation et la prédiction sont ainsi accélérés. |
Limites sur les objectifs de machine learning | Oui, vous devez cibler l'un des objectifs prédéfinis d'AutoML. | Non | Oui. |
Optimiser manuellement les performances du modèle avec les réglages d'hyperparamètres | Non. AutoML effectue certains réglages automatiques des hyperparamètres mais vous ne pouvez pas modifier les valeurs utilisées. | Oui. Vous pouvez ajuster le modèle lors de chaque entraînement pour expérimenter et comparer. | Oui. BigQuery ML permet de régler les hyperparamètres lors de l'entraînement de modèles de ML grâce aux instructions CREATE MODEL. |
Contrôler les aspects de l'environnement d'entraînement | Limitée. Pour les ensembles de données d'images et de données tabulaires, vous pouvez spécifier le nombre d'heures-nœud pour l'entraînement et si vous souhaitez autoriser l'arrêt prématuré de l'entraînement. | Oui. Vous pouvez spécifier certains aspects de l'environnement, tels que le type de machine, la taille du disque, le framework de machine learning et le nombre de nœuds. | Non. |
Limites de taille des données |
Oui. AutoML utilise des ensembles de données gérés. Les limitations de taille varient en fonction du type de l'ensemble de données. Reportez-vous à l'une des rubriques suivantes pour plus de détails : |
Pour les ensembles de données non gérés, non. Les ensembles de données gérés présentent les mêmes limites que les objets d'ensembles de données gérés créés et hébergés par Vertex AI et sont utilisés pour entraîner des modèles AutoML. | Oui. BigQuery ML applique des quotas appropriés par projet. Pour en savoir plus, consultez la page Quotas et limites. |
Étapes suivantes
- Choisissez un tutoriel d'introduction pour commencer à utiliser l'entraînement de l'IA Vertex.
- En savoir plus sur l'entraînement d'un modèle AutoML.
- Découvrez comment créer un job d'entraînement personnalisé en utilisant Python.