Présentation de l'évaluation des modèles BigQuery ML

Ce document décrit la façon dont BigQuery ML prend en charge l'évaluation de modèles de machine learning (ML).

Présentation de l'évaluation de modèles

Vous pouvez utiliser les métriques d'évaluation de modèles de ML aux fins suivantes :

Évaluer la qualité de l'adéquation entre le modèle et les données.
Comparer différents modèles.
Prédire les performances attendues de chaque modèle sur un ensemble de données spécifique, dans le contexte de la sélection du modèle.

Les évaluations des modèles d'apprentissage supervisé et non supervisé fonctionnent différemment :

Pour les modèles d'apprentissage supervisé, l'évaluation des modèles est bien définie. Un ensemble d'évaluation, c'est-à-dire des données qui n'ont pas été analysées par le modèle, est généralement exclu de l'ensemble d'entraînement, puis utilisé pour évaluer les performances du modèle. Nous vous recommandons de ne pas utiliser l'ensemble d'entraînement pour l'évaluation, car cela ralentirait le modèle lors de la généralisation des résultats de la prédiction pour les nouvelles données. Ce résultat est appelé le surapprentissage.
Pour les modèles d'apprentissage non supervisés, l'évaluation des modèles est moins définie et varie généralement d'un modèle à l'autre. Étant donné que les modèles d'apprentissage non supervisés ne réservent pas d'ensemble d'évaluation, les métriques d'évaluation sont calculées à l'aide de l'ensemble de données d'entrée complet.

Pour en savoir plus sur les instructions et les fonctions SQL compatibles avec chaque type de modèle, consultez la section Parcours utilisateur de bout en bout pour chaque modèle.

Offres d'évaluation de modèles

BigQuery ML fournit les fonctions suivantes pour calculer les métriques d'évaluation des modèles de ML :

Catégorie de modèle	Types de modèles	Fonctions d'évaluation de modèle	Fonction
Apprentissage supervisé	Régression linéaire Régresseur d'arbres de décision à boosting Régresseur de forêt d'arbres décisionnels Régresseur DNN Régresseur wide et deep Régresseur AutoML Tables	`ML.EVALUATE`	Indique les métriques suivantes : Erreur absolue moyenne Erreur quadratique moyenne Erreur logarithmique quadratique moyenne Erreur absolue médiane Score R2 Variance expliquée
	Régression logistique Classificateur d'arbres de décision à boosting Classificateur de forêt d'arbres décisionnels Classificateur DNN Classeur wide et deep Classificateur AutoML Tables	`ML.EVALUATE`	Indique les métriques suivantes : precision recall accuracy Score F1 Perte logistique ROC AUC
		`ML.CONFUSION_MATRIX`	Indique la matrice de confusion.
		`ML.ROC_CURVE`	Indique les métriques pour différentes valeurs de seuil, y compris les suivantes : recall Taux de faux positifs Vrais positifs Faux positifs Vrais négatifs Faux négatifs Ne s'applique qu'aux modèles de classification de classes binaires.
Apprentissage non supervisé	K-moyennes	`ML.EVALUATE`	Indique l'index Davies-Bouldin, ainsi que la distance quadratique moyenne entre les points de données et les centroïdes des clusters attribués.
	Factorisation matricielle	`ML.EVALUATE`	Pour les modèles basés sur des commentaires explicites, indique les métriques suivantes : Erreur absolue moyenne Erreur quadratique moyenne Erreur logarithmique quadratique moyenne Erreur absolue médiane Score R2 Variance expliquée
	Factorisation matricielle	`ML.EVALUATE`	Pour les modèles basés sur des commentaires implicites, indique les métriques suivantes : Précision moyenne Erreur quadratique moyenne Bénéfice cumulé réduit normalisé Classement moyen
	ACP	`ML.EVALUATE`	Indique le taux de variance totale expliquée.
	Auto-encodeur	`ML.EVALUATE`	Indique les métriques suivantes : Erreur absolue moyenne Erreur quadratique moyenne Erreur logarithmique quadratique moyenne
Séries temporelles	ARIMA_PLUS	`ML.EVALUATE`	Indique les métriques suivantes : Erreur absolue moyenne Erreur quadratique moyenne Erreur absolue moyenne en pourcentage Erreur absolue moyenne symétrique en pourcentage Cette fonction nécessite de nouvelles données en entrée.
Séries temporelles	ARIMA_PLUS	`ML.ARIMA_EVALUATE`	Indique les métriques suivantes pour tous les modèles candidats ARIMA caractérisés par différents tuples (p, d, q, has_drift) : Log-vraisemblance AIC Variance Fournit également d'autres informations sur la saisonnalité, les effets des jours fériés et les anomalies liées aux pics et aux creux. Cette fonction ne nécessite pas de nouvelles données en entrée.

Évaluation automatique dans les instructions `CREATE MODEL`

BigQuery ML accepte l'évaluation automatique lors de la création du modèle. Selon le type de modèle, les options d'entraînement de répartition des données et l'utilisation ou non des réglages d'hyperparamètres, les métriques d'évaluation sont calculées sur l'ensemble de données d'évaluation réservé, l'ensemble de données de test réservé ou l'intégralité de l'ensemble de données d'entrée.

Pour les modèles de k-moyennes, d'ACP, d'auto-encodeur et d'ARIMA_PLUS, BigQuery ML utilise toutes les données d'entrée comme données d'entraînement, et les métriques d'évaluation sont calculées sur l'intégralité de l'ensemble de données d'entrée.
Pour les modèles de régression linéaire et logistique, d'arbre de décision à boosting, de forêt d'arbres décisionnels, de DNN, de wide et deep learning et de factorisation matricielle, les métriques d'évaluation sont calculées par rapport à l'ensemble de données spécifié par les options CREATE MODEL suivantes :
Lorsque vous entraînez ces types de modèles à l'aide des réglages d'hyperparamètres, l'option DATA_SPLIT_TEST_FRACTION permet également de définir l'ensemble de données par rapport auquel les métriques d'évaluation sont calculées. Pour en savoir plus, consultez la page Répartition des données.
Pour les modèles AutoML Tables, découvrez comment la répartition des données est utilisée pour l'entraînement et l'évaluation.

Pour obtenir des métriques d'évaluation calculées lors de la création du modèle, utilisez des fonctions d'évaluation telles que ML.EVALUATE sur le modèle, sans données d'entrée spécifiées. Pour obtenir un exemple, consultez la section ML.EVALUATE sans données d'entrée spécifiées.

Évaluation avec un nouvel ensemble de données

Après avoir créé un modèle, vous pouvez spécifier de nouveaux ensembles de données à des fins d'évaluation. Pour fournir un nouvel ensemble de données, utilisez des fonctions d'évaluation telles que ML.EVALUATE dans le modèle avec des données d'entrée spécifiées. Pour obtenir un exemple, consultez la section ML.EVALUATE avec un seuil personnalisé et des données d'entrée.

Présentation de l'évaluation des modèles BigQuery ML

Présentation de l'évaluation de modèles

Offres d'évaluation de modèles

Évaluation automatique dans les instructions CREATE MODEL

Évaluation avec un nouvel ensemble de données

Évaluation automatique dans les instructions `CREATE MODEL`