Présentation de l'analyse des contributions
Vous pouvez utiliser l'analyse des contributions, également appelée analyse des principaux facteurs, pour générer des insights sur les modifications apportées aux métriques clés de vos données multidimensionnelles. Par exemple, vous pouvez utiliser l'analyse des contributions pour voir l'évolution des revenus sur deux trimestres ou pour comparer deux ensembles de données d'entraînement afin de comprendre les changements de performances d'un modèle de ML. Vous pouvez utiliser une instruction CREATE MODEL
pour créer un modèle d'analyse des contributions dans BigQuery.
L'analyse des contributions est une forme d'analyse augmentée, qui consiste à utiliser l'intelligence artificielle (IA) pour améliorer et automatiser l'analyse et la compréhension des données. L'analyse des contributions répond à l'un des principaux objectifs de l'analyse augmentée, qui est d'aider les utilisateurs à identifier des tendances dans leurs données.
Un modèle d'analyse des contributions détecte les segments de données qui montrent des changements statistiquement significatifs dans une métrique au fil du temps, en comparant un ensemble de données de test à un ensemble de données de contrôle. Vous pouvez ainsi voir comment les données évoluent en fonction du temps, de la zone géographique, du segment de clientèle ou de toute autre métrique qui vous intéresse. Par exemple, vous pouvez comparer un instantané de table pris à la fin de l'année 2023 à un instantané de table pris à la fin de l'année 2022 pour voir comment les données diffèrent sur deux ans.
La métrique est la valeur numérique utilisée par les modèles d'analyse des contributions pour mesurer et comparer les modifications entre les données de test et de contrôle. Vous pouvez spécifier une métrique sommable ou une métrique sommable en pourcentage avec des modèles d'analyse des contributions.
Un segment est une tranche de données identifiée par une combinaison donnée de valeurs de dimension. Par exemple, pour un modèle d'analyse des contributions basé sur les dimensions store_number
, customer_id
et day
, chaque combinaison unique de ces valeurs de dimension représente un segment. Dans le tableau suivant, chaque ligne représente un segment différent :
store_number |
customer_id |
day |
Magasin 1 | ||
Magasin 1 | Client 1 | |
Magasin 1 | Client 1 | Lundi |
Magasin 1 | Client 1 | Mardi |
Magasin 1 | Client 2 | |
Magasin 2 |
Pour ne modéliser que les segments les plus importants et donc les plus pertinents, spécifiez un seuil de support a priori qui empêche le modèle d'utiliser les petits segments. Cela réduit également le temps de création du modèle.
Après avoir créé un modèle d'analyse des contributions, vous pouvez utiliser la fonction ML.GET_INSIGHTS
pour récupérer les informations de métrique calculées par le modèle.
Étape suivante
- Créer un modèle d'analyse des contributions
- Obtenir des insights à partir d'un modèle d'analyse des contributions