Prévisions dans les visualisations

Les prévisions permettent aux analystes d'ajouter rapidement des projections de données à des requêtes d'exploration nouvelles ou existantes, afin d'aider les utilisateurs à prévoir et à surveiller des points de données spécifiques. Les résultats et visualisations des explorations prévues peuvent être ajoutés aux tableaux de bord et enregistrés en tant que présentations. Vous pouvez également créer et consulter des visualisations et des résultats prévus dans du contenu Looker intégré.

Pour pouvoir générer des données de prévision, vous devez être autorisé à créer des prévisions.

Comment les résultats prévus sont-ils créés et affichés ?

La fonctionnalité Prévision utilise les résultats des données de la table de données d'une exploration pour calculer les points de données futurs. Les calculs de prévision incluent uniquement les résultats affichés d'une requête d'exploration ; les résultats qui ne sont pas affichés en raison du nombre maximal de lignes ne sont pas inclus. Pour en savoir plus sur l'algorithme utilisé pour calculer les prévisions, consultez la section Algorithme ARIMA sur cette page.

Les résultats prévus s'affichent dans la continuité des visualisations d'exploration existantes et sont soumis aux paramètres de visualisation configurés. Les points de données prévus se distinguent des points de données non prévus de la manière suivante:

  1. Dans les graphiques cartésiens compatibles, les points de données prévus se différencient des points de données non prévus par le rendu dans une teinte plus claire ou par des lignes en pointillés.
  2. Dans les types de graphiques texte et de tableaux acceptés, les points de données prévus sont indiqués en italique et suivis d'un astérisque.

Les données prévues sont également identifiées explicitement dans l'info-bulle qui s'affiche lorsque vous pointez sur un point de données prévu.

Seuls certains types de visualisations prennent en charge les données prévues, comme indiqué dans la section suivante.

Algorithme ARIMA

Les prévisions utilisent un algorithme ARIMA (AutoRegressive Integrated Moving Average) pour créer une équation correspondant le mieux aux données entrées dans une prévision. Pour trouver la meilleure correspondance pour les données, Looker exécute ARIMA avec un ensemble de variables initiales, crée une liste de variantes des variables initiales, puis exécute à nouveau ARIMA avec ces variantes. Si l'une des variantes crée une équation qui correspond mieux aux données d'entrée, Looker utilise ces variantes comme nouvelles variables initiales et crée des variantes supplémentaires qui sont ensuite évaluées. Looker continue de répéter ce processus jusqu'à ce que les meilleures variables soient identifiées ou jusqu'à ce que toutes les options ou le temps de calcul alloué soient épuisés.

Ce processus peut être considéré comme un algorithme génétique : les individus de plusieurs centaines de générations créent chacun entre 1 et 10 enfants (variations de variables en fonction du parent), où les meilleurs survivent pour potentiellement créer de "meilleures" générations. AutoARIMA désigne la façon dont Looker utilise de nombreux appels d'ARIMA dans une approche basée sur un algorithme génétique.

Pour en savoir plus sur AutoARIMA, consultez la section Conseils d'utilisation de auto_arima du guide de l'utilisateur de pmdarima. Bien qu'il ne s'agisse pas de la bibliothèque que Looker utilise pour exécuter AutoARIMA, pmdarima fournit la meilleure explication du processus et des différentes variables utilisées.

Types de visualisations prises en charge

Les types de visualisation cartésiens suivants sont compatibles avec l'affichage des données de prévision:

Les types de graphiques (texte et tableaux) suivants sont compatibles avec l'affichage des données de prévision:

Pour le moment, les autres types de visualisation, y compris les visualisations personnalisées, ne peuvent pas afficher les données prévues.

Découvrir les exigences des requêtes pour les prévisions

Pour créer une prévision, une exploration doit répondre aux exigences suivantes:

  • Incluez exactement une dimension, qui doit être une dimension de période, avec le remplissage de dimension activé
  • Incluez au moins une mesure ou une mesure personnalisée (une prévision peut inclure jusqu'à cinq mesures ou mesures personnalisées)
  • Trier les résultats par dimension temporelle dans l'ordre décroissant

Éléments à prendre en compte

Vous trouverez ci-dessous des critères supplémentaires à prendre en compte lorsque vous créez une requête d'exploration pour effectuer des prévisions ou pour ajouter une prévision à une requête d'exploration existante:

  • Pivots : les prévisions peuvent être effectuées sur des explorations pivot, à condition que les exigences précédentes soient respectées.
  • Totaux et sous-totaux des lignes : les totaux et les sous-totaux des lignes n'incluent pas les valeurs prévues. Nous vous déconseillons de les utiliser pour les prévisions, car cela peut produire des résultats inattendus.
  • Filtres incluant des périodes incomplètes : pour des projections précises, les prévisions ne doivent être utilisées qu'avec une logique temporelle complète dans les filtres d'exploration lorsque les explorations incluent des données pour des périodes incomplètes. Par exemple, si un utilisateur prévoit des données pour un mois à venir alors qu'une exploration est filtrée pour afficher les données des trois derniers mois, celle-ci inclut les données du mois incomplet en cours. La prévision intégrera les données incomplètes dans son calcul et affichera des résultats moins fiables. Utilisez plutôt une logique de filtre comme au cours des 3 derniers mois complets, et non au cours des 3 derniers mois, lorsqu'une exploration inclut des périodes incomplètes (par exemple, lorsqu'une exploration inclut des données mensuelles incomplètes pour le mois en cours) afin d'obtenir des prévisions plus précises.
  • Calculs de table : les calculs de table basés sur une ou plusieurs mesures prévues sont automatiquement inclus dans une prévision.
  • Nombre maximal de lignes : découvrez comment les limites de lignes s'appliquent à l'ensemble du tableau de données, y compris les lignes prévues.

Pour obtenir des conseils supplémentaires et des ressources de dépannage, consultez la section Problèmes courants et points à connaître de cette page.

Généralement, un ensemble de données comportant plus de lignes et une longueur de prévision plus courte permet d'obtenir des prévisions plus précises.

Options du menu "Prévisions"

Vous pouvez utiliser les options du menu Prévision, situé dans l'onglet Visualisation de l'exploration, pour personnaliser les données prévues. Le menu Prévision comprend les options suivantes:

Sélectionner un champ

Le menu déroulant Sélectionner un champ affiche les mesures ou les mesures personnalisées de la requête d'exploration disponibles pour la prévision. Vous pouvez sélectionner jusqu'à cinq mesures ou mesures personnalisées.

Longueur

L'option Longueur indique le nombre de lignes, c'est-à-dire la durée pour laquelle les valeurs de données doivent être prévues. L'intervalle de durée de prévision est automatiquement renseigné en fonction de la dimension de période dans la requête d'exploration.

En général, un ensemble de données comportant plus de lignes et une longueur de prévision plus courte, les prévisions sont plus précises.

Intervalle de prédiction

L'option Intervalle de prédiction permet aux analystes d'exprimer une certaine incertitude au niveau des prévisions pour améliorer la précision. Lorsqu'elle est activée, l'option Intervalle de prédiction vous permet de sélectionner les limites des valeurs de données prévues. Par exemple, un intervalle de prédiction de 95% indique une probabilité de 95% que les valeurs de mesure prévues se situent entre les limites supérieure et inférieure de la prévision.

Plus l'intervalle de prédiction sélectionné est grand, plus les limites supérieure et inférieure sont larges.

Saisonnalité

L'option Saisonnalité permet aux analystes de tenir compte des cycles connus ou des tendances de données répétitives dans une prévision. Elle fait référence au nombre de lignes de données dans le cycle. Par exemple, si une table de données d'exploration comporte une ligne par heure et des cycles de données quotidiens, la saisonnalité est de 24.

Avec les paramètres de prévision par défaut, Looker référence la dimension de date dans une exploration et analyse plusieurs cycles de saisonnalité possibles pour trouver la meilleure correspondance pour la prévision finale. Par exemple, si vous utilisez des données horaires, Looker peut essayer des cycles de saisonnalité quotidiens, hebdomadaires ou de quatre semaines. Looker tient également compte de la fréquence de la dimension : si une dimension représente une période de six heures, Looker sait qu'il n'y aura que quatre lignes par jour et ajustera la saisonnalité en conséquence.

Pour les cas d'utilisation courants, l'option Automatique détecte la meilleure saisonnalité pour un ensemble de données spécifique. Si vous connaissez des cycles spécifiques dans l'ensemble de données, l'option Personnalisé vous permet de spécifier le nombre de lignes qui constituent un cycle pour les mesures individuelles d'une prévision.

Lorsque vous prévoyez des valeurs de données pour plusieurs mesures, vous pouvez sélectionner différentes options de saisonnalité, y compris aucune, pour chaque mesure. Le menu déroulant Saisonnalité propose plusieurs options:

Par défaut, les prévisions appliquent l'option de saisonnalité Automatique aux prévisions, même si l'option Saisonnalité n'est pas activée.

Automatique

Avec l'option de saisonnalité Automatique, Looker sélectionne la meilleure option pour vos données issues de plusieurs périodes de saisonnalité courantes (quotidienne, horaire, mensuelle, etc.).

Personnalisée

Lorsque vous connaissez le nombre spécifique de lignes qui composent chaque saison ou cycle de votre ensemble de données, vous pouvez spécifier le nombre dans le champ Période. Il peut être utile de sélectionner Personnalisé si vous savez que vos données s'exécutent par cycle dans un nombre spécifique de lignes.

Lorsque vous travaillez avec des données qui circulent en mois, mais qui sont exprimées de manière plus précise (par exemple, à l'aide d'une précision de date ou de semaine dans une exploration), une période de 4 semaines ou 30 jours correspond généralement aux cycles mensuels.

Aucune

La saisonnalité est un élément important des prévisions. Toutefois, elle n'est pas toujours recommandée en fonction des données d'entrée. En l'absence de cycles prévisibles dans les données, l'activation de la saisonnalité peut parfois donner lieu à des prévisions inexactes lorsque l'algorithme tente d'identifier une tendance, puis de l'adapter à la prévision. Cela peut entraîner une prédiction peu claire.

Lorsque vous prévoyez des valeurs de données pour plusieurs mesures et que vous souhaitez activer la saisonnalité uniquement pour une ou plusieurs d'entre elles, vous pouvez sélectionner Aucune pour toutes les mesures pour lesquelles vous ne souhaitez pas activer la saisonnalité.

Créer une prévision

Seuls les utilisateurs disposant d'une autorisation peuvent créer des prévisions.

Pour créer une prévision, procédez comme suit:

  1. Assurez-vous que votre exploration respecte les exigences de prévision. Par exemple, un utilisateur souhaite créer une prévision pour une requête d'exploration avec les valeurs Users Created Month (Mois de création d'utilisateurs), Users Count (Nombre d'utilisateurs) et Orders Count (Nombre de commandes), triées en fonction de Users Created Month (Mois de création d'utilisateurs) dans l'ordre décroissant. Les résultats affichent les données jusqu'en décembre 2019.

  2. Cliquez sur Prévision dans l'onglet "Explorer" Visualisation pour ouvrir le menu Prévision.

  3. Cliquez sur le menu déroulant Sélectionner un champ pour choisir jusqu'à cinq mesures ou mesures personnalisées à prévoir. Dans cet exemple, l'utilisateur sélectionne Users Count (Nombre d'utilisateurs) et Orders Count (Nombre de commandes).

  4. Saisissez la durée de la prévision dans le champ Durée. Dans cet exemple, l'utilisateur saisit 6 mois.

  5. Si vous le souhaitez, vous pouvez cliquer sur le bouton bascule Intervalle de prédiction ou Saisonnalité pour activer l'une ou l'autre de ces fonctions et personnaliser les options associées. L'utilisateur de cet exemple n'active aucune des options.

  6. Cliquez sur x dans l'onglet du menu à côté de Prévisions pour enregistrer vos paramètres et quitter le menu.

  7. Cliquez sur Exécuter pour réexécuter la requête d'exploration. (Vous devez réexécuter l'exploration après avoir apporté des modifications à la prévision.)

Les résultats de l'exploration et votre visualisation afficheront désormais les valeurs prévues pour la durée spécifiée. Avec les options spécifiées, l'exemple d'exploration affiche les données prévues pour le Nombre d'utilisateurs et le Nombre de commandes sur six mois, du 01/01/2020 au 06/2020.

Étant donné que les calculs prévus dépendent de l'ordre dans lequel les données sont triées, le tri est désactivé une fois la requête de prévision exécutée.

Modifier une prévision

Seuls les utilisateurs disposant d'une autorisation peuvent modifier les prévisions.

Pour modifier une prévision:

  1. Si nécessaire, modifiez la requête d'exploration pour ajouter ou supprimer différentes mesures ou champs de période. Assurez-vous que votre exploration respecte les exigences de prévision.
  2. Cliquez sur Prévision dans l'onglet "Explorer" Visualisation pour ouvrir le menu Prévision.
  3. Cliquez sur le menu déroulant Sélectionner un champ pour modifier les champs prévus. Pour supprimer les champs prévus :
    • Cochez les cases à côté des champs de prévision dans le menu déroulant Sélectionner un champ développé pour supprimer les champs de la prévision.
    • Vous pouvez également cliquer sur x à côté du nom du champ dans le menu Sélectionner un champ réduit.
  4. Modifiez la durée du futur pour effectuer une prévision dans le champ Durée, si vous le souhaitez.
  5. Si vous le souhaitez, vous pouvez cliquer sur le bouton bascule Intervalle de prédiction ou Saisonnalité pour activer l'une ou l'autre de ces fonctions et personnaliser les options associées.
    • Si l'option Intervalle de prédiction ou Saisonnalité était déjà activée, les personnalisations seront affichées. Modifiez les paramètres personnalisés à votre convenance ou cliquez sur le bouton bascule pour supprimer la fonction de la prévision.
  6. Cliquez sur x dans l'onglet du menu à côté de Prévisions pour enregistrer vos paramètres et quitter le menu.
  7. Cliquez sur Exécuter pour réexécuter la requête d'exploration. (Vous devez réexécuter l'exploration après avoir modifié la prévision.)

Les résultats et la visualisation de l'exploration afficheront à présent la prévision modifiée. Étant donné que les calculs prévus dépendent de l'ordre dans lequel les données sont triées, le tri est désactivé une fois la requête de prévision exécutée.

Supprimer une prévision

Seuls les utilisateurs disposant d'une autorisation peuvent supprimer des prévisions.

Pour supprimer une prévision d'une exploration:

  1. Cliquez sur Prévision dans l'onglet "Explorer" Visualisation pour ouvrir le menu Prévision.
  2. Cliquez sur Effacer en haut du menu Prévision.

La requête sera automatiquement réexécutée pour produire les résultats sans application de prévision.

Problèmes courants et choses à savoir

Quel est son degré de précision ?

La précision d'une prévision dépend des données d'entrée. L'implémentation AutoARIMA de Looker permet d'obtenir des prédictions incroyablement précises qui combinent avec succès de nombreuses nuances issues des données d'entrée. Dans certains cas, l'algorithme se retrouve pris dans des schémas inhabituels dans les données d'entrée et les met trop en avant dans la prédiction. Assurez-vous que suffisamment de données sont fournies et qu'elles sont aussi précises que possible pour tirer le meilleur parti des prévisions.

Impossible de générer une prévision

Il existe des raisons légitimes pour lesquelles une prévision ne peut pas être générée. Cela est généralement dû au fait que la quantité de données d'entrée est trop faible ou que la durée de prévision demandée est trop importante. Il n'y a pas de limite spécifique pour chaque facteur et il n'existe pas de ratio exact de données d'entrée requises pour une certaine durée de prévision. Plus les données d'entrée sont dispersées et imprévisibles, plus il sera difficile pour l'algorithme AutoARIMA de trouver une correspondance. Le moyen le plus efficace de générer une prévision consiste à augmenter la quantité de données d'entrée propres, à s'assurer que les paramètres de saisonnalité sont corrects et à réduire la durée des prévisions aux seules données nécessaires. Lorsque vous utilisez l'option Intervalle de prédiction, il peut être utile de choisir un intervalle plus faible.

Le nettoyage des données d'entrée peut impliquer les opérations suivantes:

  • Couper les lignes de début ou de fin correspondant à des périodes ne contenant pas de données
  • Réduire le bruit dans l'ensemble de données en choisissant une dimension de date plus grande
  • Modifier les valeurs aberrantes de filtre qui ne profitent pas à la prédiction

Le résultat de la requête n'a renvoyé aucune prévision et j'ai reçu une erreur inconnue

Cela ne devrait pas se produire. Si c'est le cas, essayez de supprimer la ou les mesures de la configuration de prévision, puis de les ajouter à nouveau.

La prévision s'affiche, mais elle est manifestement fausse ou inutile

Dans ce cas, la meilleure chose à faire est d'ajouter davantage de données d'entrée, de les nettoyer autant que possible et éventuellement de définir une saisonnalité personnalisée (si vous connaissez des cycles spécifiques dans les données) ou de désactiver complètement l'option Saisonnalité en sélectionnant Aucune.

Le nettoyage des données d'entrée peut impliquer les tâches suivantes:

  • Couper les lignes de début ou de fin correspondant à des périodes ne contenant pas de données
  • Réduire le bruit dans l'ensemble de données en choisissant une dimension de date plus grande
  • Modifier les valeurs aberrantes de filtre qui ne profitent pas à la prédiction