Prévisions dans les visualisations

Les prévisions permettent aux analystes d'ajouter rapidement des projections de données à des requêtes d'exploration nouvelles ou existantes, afin d'aider les utilisateurs à prédire et à surveiller des points de données spécifiques. Vous pouvez ajouter les résultats et visualisations des explorations prévues aux tableaux de bord et les enregistrer en tant que Looks. Vous pouvez également créer et afficher les résultats et les visualisations prévus dans du contenu Looker intégré.

Vous pouvez prévoir des données si vous êtes autorisé à créer des prévisions.

Création et affichage des résultats prévus

La fonctionnalité Prévision utilise les résultats de la table de données d'une exploration pour calculer les points de données futurs. Les calculs de prévision n'incluent que les résultats affichés d'une requête d'exploration. Les résultats qui ne sont pas affichés en raison du nombre maximal de lignes ne sont pas inclus. Pour en savoir plus sur l'algorithme utilisé pour calculer les prévisions, consultez la section Algorithme ARIMA de cette page.

Les résultats prévus s'affichent dans la continuité des visualisations Explorer existantes et sont soumis aux paramètres de visualisation configurés. Les points de données prévus se distinguent des points de données non prévus de la manière suivante:

  1. Dans les graphiques cartésiens compatibles, les points de données prévus sont différenciés des points de données non prévus par un rendu avec une nuance plus claire ou par des lignes en pointillés.
  2. Dans les types de graphiques "Texte" et "Tableau" compatibles, les points de données prévus apparaissent en italique et sont suivis d'un astérisque.

Les données prévues sont aussi explicitement identifiées dans l'info-bulle qui s'affiche lorsque vous passez le curseur sur un point de données prévu.

Seuls certains types de visualisations sont compatibles avec les données prévisionnelles, comme indiqué dans la section suivante.

Algorithme ARIMA

Les prévisions utilisent un algorithme de moyenne mobile intégrée et autorégressive (ARIMA) pour créer l'équation la mieux adaptée aux données saisies dans une prévision. Pour trouver la meilleure correspondance pour les données, Looker exécute ARIMA avec un ensemble de variables initiales, crée une liste de variantes de ces variables, puis exécute à nouveau ARIMA avec ces variantes. Si l'une des variantes crée une équation qui correspond mieux aux données d'entrée, Looker utilise ces variantes comme nouvelles variables initiales et en crée d'autres qui sont ensuite évaluées. Looker continue de répéter ce processus jusqu'à ce que les meilleures variables soient identifiées ou jusqu'à ce que toutes les options ou le temps de calcul alloué soient épuisés.

Ce processus peut être considéré comme un algorithme génétique dans lequel les individus, sur des centaines de générations, créent chacun de 1 à 10 enfant (variantes de variables en fonction du parent), et où les meilleurs survivent pour créer potentiellement de "meilleures" générations. Looker utilise de nombreuses invocations d'ARIMA dans le cadre d'un algorithme génétique sous le nom d'AutoARIMA.

Pour plus d’informations sur AutoARIMA, consultez la section Conseils d’utilisation auto_arima du Guide de l’utilisateur pmdarima. Bien qu'il ne s'agisse pas de la bibliothèque utilisée par Looker pour exécuter AutoARIMA, pmdarima fournit la meilleure explication du processus et des différentes variables utilisées.

Types de visualisations prises en charge

Les types de visualisation cartésiennes suivants sont compatibles avec le rendu des données prévues:

Les types de graphiques texte et tableaux suivants sont compatibles avec l'affichage des données prévues:

Pour le moment, les autres types de visualisation, y compris les visualisations personnalisées, ne peuvent pas afficher les données prévues.

Découvrir les exigences concernant les requêtes pour les prévisions

Pour créer une prévision, une exploration doit remplir les conditions suivantes:

  • Inclure exactement une dimension, qui doit être une dimension temporelle, avec le remplissage des dimensions activé
  • Incluez au moins une mesure ou une mesure personnalisée (une prévision peut inclure jusqu'à cinq mesures ou mesures personnalisées)
  • Trier les résultats en fonction de la dimension temporelle, par ordre décroissant

Éléments à prendre en compte

Voici d'autres critères à prendre en compte lorsque vous créez une requête d'exploration pour effectuer des prévisions ou ajouter une prévision à une requête d'exploration existante:

  • Tableaux croisés dynamiques : les prévisions peuvent être effectuées sur des explorations pivotés, à condition que les exigences précédentes soient remplies.
  • Totaux et sous-totaux des lignes : les totaux et sous-totaux des lignes n'incluent pas les valeurs prévues. Nous vous déconseillons d'utiliser les sous-totaux ou les totaux des lignes avec les prévisions, car cela peut produire des chiffres inattendus.
  • Filtres incluant des périodes incomplètes : pour des projections précises, les prévisions ne doivent être utilisées qu'en conjonction avec une logique de période complète dans les filtres d'exploration lorsque les explorations incluent des données pour des périodes incomplètes. Par exemple, si un utilisateur prévoit des données pour un mois à venir alors qu'une exploration est filtrée pour afficher les données des trois derniers mois, l'exploration inclut les données du mois incomplet en cours. La prévision intègre les données incomplètes dans son calcul et affiche des résultats moins fiables. Pour obtenir des prévisions plus précises, utilisez plutôt une logique de filtrage telle que au cours des 3 derniers mois complets, plutôt que au cours des 3 derniers mois, lorsqu'une exploration inclut des périodes incomplètes (par exemple, lorsqu'une exploration inclut des données mensuelles incomplètes pour le mois en cours).
  • Calculs de table : les calculs de table basés sur une ou plusieurs mesures prévues sont automatiquement inclus dans une prévision.
  • Limites de lignes : découvrez comment les limites de lignes s'appliquent à l'ensemble du tableau de données, y compris aux lignes prévues.

Pour obtenir des conseils supplémentaires et des ressources de dépannage, consultez la section Problèmes courants et points à retenir de cette page.

Généralement, un ensemble de données comportant plus de lignes, associé à une durée de prévision plus courte, permet d'obtenir une prévision plus précise.

Options du menu "Prévisions"

Vous pouvez utiliser les options du menu Prévision, situé dans l'onglet Explorer Visualisation, pour personnaliser les données prévues. Le menu Prévision comprend les options suivantes:

Sélectionner un champ

Le menu déroulant Sélectionner un champ affiche les mesures ou les mesures personnalisées de la requête d'exploration disponibles pour les prévisions. Vous pouvez sélectionner jusqu'à cinq mesures ou mesures personnalisées.

Longueur

L'option Longueur indique le nombre de lignes, ou la durée pour laquelle prévoir les valeurs des données. L'intervalle de durée des prévisions est automatiquement renseigné en fonction de la dimension temporelle de la requête d'exploration.

En règle générale, un ensemble de données comportant plus de lignes et une prévision plus courte permet d'obtenir une prévision plus précise.

Intervalle de prédiction

L'option Intervalle de prédiction permet aux analystes d'exprimer une certaine incertitude dans les prévisions pour améliorer la précision. Lorsqu'elle est activée, l'option Intervalle de prédiction vous permet de sélectionner les limites des valeurs des données prévues. Par exemple, un intervalle de prédiction de 95% indique une probabilité de 95% que les valeurs de mesure prévues se situent entre les limites supérieure et inférieure de la prévision.

Plus l'intervalle de prédiction sélectionné est grand, plus les limites supérieure et inférieure sont larges.

Saisonnalité

L'option Saisonnalité permet aux analystes de tenir compte des cycles connus ou des tendances de données répétitives dans une prévision. Elle fait référence au nombre de lignes de données dans le cycle. Par exemple, si une table de données d'exploration comporte une ligne par heure et que les cycles de données sont quotidiens, la saisonnalité est de 24.

Avec les paramètres de prévision par défaut, Looker référence la dimension de date dans une exploration et analyse plusieurs cycles de saisonnalité possibles pour trouver la meilleure correspondance pour la prévision finale. Par exemple, avec des données horaires, Looker peut essayer des cycles de saisonnalité quotidiens, hebdomadaires et de quatre semaines. Looker tient également compte de la fréquence de la dimension : si une dimension représente une période de six heures, Looker sait qu'il n'y aura que quatre lignes par jour et ajustera la saisonnalité en conséquence.

Dans les cas d'utilisation courants, l'option Automatique détecte la meilleure saisonnalité pour un ensemble de données donné. Si vous connaissez des cycles spécifiques dans l'ensemble de données, l'option Personnalisé vous permet de spécifier le nombre de lignes qui composent un cycle pour des mesures individuelles dans une prévision.

Lorsque vous prévoyez des valeurs de données pour plusieurs mesures, vous pouvez sélectionner différentes options de saisonnalité, y compris aucune, pour chaque mesure. Le menu déroulant Saisonnalité comporte plusieurs options:

Par défaut, les prévisions appliquent l'option de saisonnalité Automatique, même si l'option Saisonnalité n'est pas activée.

Automatique

Avec l'option de saisonnalité Automatique, Looker sélectionne la meilleure option pour vos données issues de plusieurs périodes saisonnières courantes (quotidienne, horaire, mensuelle, etc.).

Personnalisée

Lorsque vous connaissez le nombre spécifique de lignes qui composent chaque saison ou cycle de votre ensemble de données, vous pouvez le spécifier dans le champ Période. Il peut être utile de sélectionner Personnalisé si vous savez que vos données sont générées dans un nombre spécifique de lignes.

Lorsque vous travaillez avec des données qui suivent un cycle en mois, mais qui sont exprimées avec une plus grande précision (par exemple, à l'aide d'une précision de date ou de semaine dans une exploration), généralement une période de 4 semaines ou de 30 jours correspond aux cycles mensuels.

Aucun

La saisonnalité est un élément important des prévisions. Toutefois, selon les données d'entrée, elle n'est pas toujours recommandée. En l'absence de cycles prévisibles dans les données, l'activation de la saisonnalité peut parfois donner lieu à des prévisions inexactes lorsque l'algorithme tente de trouver une tendance, puis d'adapter le faux modèle à la prévision. Cela peut entraîner une prédiction obscure.

Lorsque vous prévoyez des valeurs de données pour plusieurs mesures et que vous souhaitez activer la saisonnalité pour une ou plusieurs seulement, vous pouvez sélectionner Aucune pour toutes les mesures pour lesquelles vous ne souhaitez pas activer la saisonnalité.

Créer une prévision

Seuls les utilisateurs autorisés peuvent créer des prévisions.

Pour créer une prévision, procédez comme suit:

  1. Assurez-vous que votre exploration respecte les exigences de prévision. Par exemple, un utilisateur souhaite créer une prévision pour une requête d'exploration avec Mois de création d'utilisateurs, Nombre d'utilisateurs et Nombre de commandes, triée par Mois de création d'utilisateurs dans l'ordre décroissant. Les résultats affichent les données jusqu'en décembre 2019.

  2. Cliquez sur Prévision dans l'onglet Visualisation de l'exploration pour ouvrir le menu Prévision.

  3. Cliquez sur le menu déroulant Sélectionner un champ pour choisir jusqu'à cinq mesures ou des mesures personnalisées à prévoir. Dans cet exemple, l'utilisateur sélectionne Nombre d'utilisateurs et Nombre de commandes.

  4. Saisissez la durée de la prévision dans le champ Durée. Dans cet exemple, l'utilisateur saisit 6 mois.

  5. Vous pouvez également cliquer sur le bouton bascule Intervalle de prédiction ou Saisonnalité pour activer l'une de ces fonctions et personnaliser les options associées. Dans cet exemple, l'utilisateur n'active aucune des deux options.

  6. Cliquez sur le x dans l'onglet de menu à côté de Prévision pour enregistrer vos paramètres et quitter le menu.

  7. Cliquez sur Run (Exécuter) pour exécuter à nouveau la requête d'exploration. (Vous devez réexécuter l'exploration après avoir modifié la prévision.)

Les résultats et la visualisation de l'exploration affichent désormais les valeurs prévues pour la période spécifiée. Avec les options spécifiées, l'exemple d'exploration affiche les données prévues pour le nombre d'utilisateurs et le nombre de commandes pour l'année 2020-01-06.

Étant donné que les calculs prévus dépendent de l'ordre de tri des données, le tri est désactivé une fois qu'une requête prévue a été exécutée.

Modifier une prévision

Seuls les utilisateurs autorisés peuvent modifier les prévisions.

Pour modifier une prévision:

  1. Si nécessaire, modifiez la requête d'exploration pour ajouter ou supprimer différents champs de mesure ou de période. Assurez-vous que votre exploration respecte les exigences de prévision.
  2. Cliquez sur Prévision dans l'onglet Visualisation de l'exploration pour ouvrir le menu Prévision.
  3. Cliquez sur le menu déroulant Sélectionner un champ pour modifier les champs prévus. Pour supprimer les champs prévus :
    • Cochez les cases à côté des champs prévus dans le menu déroulant Sélectionner un champ développé pour supprimer les champs de la prévision.
    • Vous pouvez également cliquer sur le x à côté du nom du champ dans le menu Sélectionner un champ réduit.
  4. Si vous le souhaitez, modifiez la durée spécifiée pour la prévision dans le champ Durée.
  5. Vous pouvez également cliquer sur le bouton bascule Intervalle de prédiction ou Saisonnalité pour activer l'une de ces fonctions et personnaliser les options associées.
    • Si l'intervalle de prédiction ou la saisonnalité sont déjà activés, les personnalisations s'affichent. Modifiez les paramètres personnalisés comme vous le souhaitez ou sélectionnez le bouton bascule pour supprimer la fonction de la prévision.
  6. Cliquez sur le x dans l'onglet de menu à côté de Prévision pour enregistrer vos paramètres et quitter le menu.
  7. Cliquez sur Run (Exécuter) pour exécuter à nouveau la requête d'exploration. (Vous devez réexécuter l'exploration après avoir modifié la prévision.)

Les résultats et la visualisation de l'exploration affichent désormais la prévision modifiée. Étant donné que les calculs prévus dépendent de l'ordre de tri des données, le tri est désactivé une fois qu'une requête prévue a été exécutée.

Supprimer une prévision

Seuls les utilisateurs autorisés peuvent supprimer des prévisions.

Pour supprimer une prévision d'une exploration:

  1. Cliquez sur Prévision dans l'onglet Visualisation de l'exploration pour ouvrir le menu Prévision.
  2. Cliquez sur Effacer en haut du menu Prévision.

La requête sera automatiquement réexécutée pour produire les résultats sans application de prévision.

Problèmes courants et choses à savoir

Quel est son degré de précision ?

La précision d'une prévision dépend des données d'entrée. L'implémentation AutoARIMA de Looker permet d'effectuer des prédictions incroyablement précises qui combinent avec succès de nombreuses nuances des données d'entrée. Dans certains cas, l'algorithme se retrouve pris dans des schémas étranges dans les données d'entrée et les met trop en avant dans la prédiction. Assurez-vous que suffisamment de données sont fournies et qu'elles sont aussi précises que possible afin d'exploiter tout le potentiel des prévisions.

Impossible de générer une prévision

Il existe des raisons légitimes pour lesquelles une prévision ne peut pas être générée. Cela est généralement dû au fait que la quantité de données d'entrée est trop faible ou que la durée de prévision demandée est trop importante. Il n'y a pas de limite spécifique à l'un ou l'autre des facteurs, et il n'y a pas de ratio exact des données d'entrée requises pour une certaine durée de prévision. Plus les données d'entrée sont dispersées et imprévisibles, plus il sera difficile pour l'algorithme AutoARIMA de trouver une correspondance. Le moyen le plus efficace de générer une prévision consiste à augmenter la quantité de données d'entrée propres, à s'assurer que les paramètres de saisonnalité sont corrects et à réduire la durée de la prévision au strict nécessaire. Lorsque vous utilisez l'option Intervalle de prédiction, il peut être utile de choisir un intervalle inférieur.

Le nettoyage des données d'entrée peut impliquer les actions suivantes:

  • Couper les lignes de début ou de fin qui correspondent à des périodes qui ne contiennent pas de données
  • Réduire le bruit dans l'ensemble de données en choisissant une dimension de date plus grande
  • Modifier les valeurs aberrantes des filtres qui ne bénéficient pas de la prédiction

Le résultat de la requête s'est affiché sans prévision, et j'ai reçu une erreur obscure

Cela ne devrait pas se produire. Si c'est le cas, essayez de supprimer la ou les mesures de la configuration de prévision, puis de les ajouter de nouveau.

Les prévisions s'affichent, mais elles sont manifestement incorrectes ou inutiles

Dans ce cas, la meilleure chose à faire est d'ajouter davantage de données d'entrée, de les nettoyer autant que possible et éventuellement de définir une saisonnalité personnalisée (si vous connaissez des cycles spécifiques dans les données) ou de désactiver complètement l'option Saisonnalité en sélectionnant Aucune.

Le nettoyage des données d'entrée peut impliquer les tâches suivantes:

  • Couper les lignes de début ou de fin qui correspondent à des périodes qui ne contiennent pas de données
  • Réduire le bruit dans l'ensemble de données en choisissant une dimension de date plus grande
  • Modifier les valeurs aberrantes des filtres qui ne bénéficient pas de la prédiction