Prévisions dans les visualisations

Les prévisions permettent aux analystes d'ajouter rapidement des projections de données aux requêtes Explorer nouvelles ou existantes afin d'aider les utilisateurs à prédire et surveiller des points de données spécifiques. Les résultats et les visualisations de l'exploration prévue peuvent être ajoutés aux tableaux de bord et enregistrés dans la section Looks. Vous pouvez également créer et visualiser des résultats et des visualisations prévus sur le contenu Looker intégré.

Vous pouvez prévoir des données si vous disposez de l'autorisation de créer des prévisions.

Création et affichage des résultats prévisionnels

La fonctionnalité Prévision utilise les résultats des données du tableau de données "Explorer" pour calculer les futurs points de données. Les calculs des prévisions ne comprennent que les résultats affichés d'une requête Explorer. Les résultats non affichés en raison des limites du nombre de lignes ne sont pas inclus. Pour en savoir plus sur l'algorithme utilisé pour calculer les prévisions, consultez la section Algorithme ARIMA sur cette page.

Les résultats prévisionnels s'affichent comme une continuation des visualisations Explorer existantes et sont soumis aux paramètres de visualisation configurés. Les points de données prévus se distinguent des points de données non prévus de la manière suivante:

  1. Dans les graphiques cartésiens compatibles, les points de données prévus se différencient des points de données non prévus par un affichage plus clair ou par des lignes en pointillés.
  2. Dans les types de texte et de tableau compatibles, les points de données prévus sont en italique et suivis d'un astérisque.

Les données prévues sont également indiquées explicitement dans l'info-bulle qui s'affiche lorsque vous pointez le curseur sur un point de données prévu:

Seuls certains types de visualisations sont compatibles avec les données prévues, comme indiqué dans la section suivante.

Algorithme ARIMA

Les prévisions utilisent l'algorithme ARIMA (AutoRegressive Integrated Moving Average) pour créer l'équation qui correspond le mieux aux données saisies dans une prévision. Pour trouver la meilleure correspondance pour les données, Looker exécute ARIMA avec un ensemble de variables initiales, crée une liste de variantes des variables initiales, puis exécute à nouveau ARIMA avec ces variantes. Si l'une des variantes crée une équation qui correspond mieux aux données d'entrée, Looker utilise ces variantes comme nouvelles variables initiales et crée des variantes supplémentaires qui sont ensuite évaluées. Looker continue de répéter ce processus jusqu'à ce que les meilleures variables soient identifiées ou que toutes les options ou le temps de calcul alloué soient épuisés.

Ce processus peut être considéré comme un algorithme génétique, dans lequel des individus de centaines de générations créent de 1 à 10 générations chacune (variantes de variables en fonction du parent), et les meilleurs descendants subsistent pour créer des "générations" de meilleure qualité. La manière dont Looker utilise de nombreux appels d'ARIMA dans une approche d'algorithme génétique est appelée AutoARIMA.

Pour en savoir plus sur AutoARIMA, consultez la section Conseils d'utilisation de auto_arima du Guide de l'utilisateur de pmdarima. Bien qu'il ne s'agisse pas de la bibliothèque utilisée par Looker pour exécuter AutoARIMA, pmdarima fournit la meilleure explication du processus et des différentes variables utilisées.

Types de visualisations prises en charge

Les types de visualisation cartésiens suivants permettent d'afficher les données prévues:

Les types de graphiques suivants sont compatibles avec l'affichage des données prévues:

Actuellement, les autres types de visualisation, y compris les visualisations personnalisées, ne permettent pas d'afficher les données prévues.

Découvrir les exigences liées aux requêtes pour les prévisions

Pour créer une prévision, une exploration doit remplir les conditions suivantes:

  • Incluez exactement une dimension, qui doit être une dimension temporelle avec le remplissage de dimension activé.
  • Incluez au moins une mesure ou une mesure personnalisée (une prévision peut inclure jusqu'à cinq mesures ou mesures personnalisées).
  • Trier les résultats en fonction de la dimension de période dans l'ordre décroissant

Éléments à prendre en compte

Vous trouverez ci-dessous d'autres critères à prendre en compte lorsque vous créez une requête Explorer pour effectuer des prévisions ou que vous ajoutez une prévision à une requête Explorer existante:

  • Pivots : les prévisions peuvent être effectuées sur les explorations pivotées, à condition que les exigences qui précèdent soient remplies.
  • Nombre total de lignes et sous-totaux : les totaux et sous-totaux des lignes n'incluent pas les valeurs prévues. Nous vous déconseillons d'utiliser les sous-totaux et les totaux des lignes avec les prévisions, car ils peuvent produire des résultats inattendus.
  • Filtres qui incluent des périodes incomplètes : pour des projections précises, les prévisions ne doivent être utilisées qu'avec une logique de période complète dans les filtres "Explorer" lorsque les explorations incluent des données pour des périodes incomplètes. Par exemple, si un utilisateur prévoit des données pour un mois à venir alors qu'une exploration est filtrée pour afficher les données des trois derniers mois, l'exploration inclut les données du mois incomplet en cours. Les prévisions incorporent les données incomplètes dans leur calcul et affichent des résultats plus peu fiables. Employez plutôt une logique de filtrage comme au cours des trois derniers mois complets plutôt qu'au cours des trois derniers mois, lorsqu'une exploration comprend des périodes incomplètes (par exemple, lorsqu'une exploration comprend des données mensuelles incomplètes pour le mois en cours) afin d'obtenir des prévisions plus précises.
  • Calculs du tableau : les calculs du tableau basés sur une ou plusieurs mesures prévues sont automatiquement inclus dans les prévisions.
  • Limites de lignes : découvrez comment les limites des lignes s'appliquent à l'ensemble du tableau de données, y compris aux lignes prévues.

Pour obtenir des conseils et des ressources de dépannage supplémentaires, consultez la section Problèmes courants et informations à retenir sur cette page.

En règle générale, plus un ensemble de données comporte de lignes, plus la longueur des prévisions est courte, plus la prévision est précise.

Options du menu "Prévisions"

Vous pouvez utiliser les options du menu Prévisions dans l'onglet Explorer de l'onglet "Explorer" pour personnaliser les données prévues. Le menu Prévision comprend les options suivantes:

Sélectionner un champ

Le menu déroulant Sélectionner un champ affiche les mesures ou les mesures personnalisées de la requête "Explorer" disponibles pour les prévisions. Vous pouvez sélectionner jusqu'à cinq mesures ou mesures personnalisées.

Durée

L'option Longueur indique le nombre de lignes, ou la durée pendant laquelle des valeurs de données sont prévues. L'intervalle de prévision est automatiquement renseigné en fonction de la dimension "Période" de la requête "Explorer".

En général, un ensemble de données comportant plus de lignes, associé à une longueur de prévision plus courte, permet d'obtenir une prévision plus précise.

Intervalle de prédiction

Paramètre d'intervalle de prédiction affichant les options d'intervalle de 99%, 98%, 95%, 90% et 80%

L'option Intervalle de prédiction permet aux analystes d'exprimer certaines incertitudes dans les prévisions pour faciliter la précision. Lorsque cette option est activée, l'option Intervalle de prédiction vous permet de sélectionner les limites des valeurs de données prévues. Par exemple, un intervalle de prédiction de 95% indique 95% de chances que les valeurs des mesures prévues se situent entre les limites supérieure et inférieure de la prévision.

Plus l'intervalle de prédiction sélectionné est grand, plus les limites supérieure et inférieure sont larges.

Périodicité

L'option Saisonnalité permet aux analystes de tenir compte des cycles connus ou des tendances répétitives des données dans une prévision. Elle fait référence au nombre de lignes de données dans le cycle. Par exemple, si un tableau de données "Explorer" comporte une ligne par heure et que les données sont diffusées quotidiennement, la saisonnalité est de 24.

Avec les paramètres de prévision par défaut, Looker référence la dimension "Date" dans une exploration et analyse plusieurs cycles de saisonnalité possibles pour trouver la meilleure correspondance pour la prévision finale. Par exemple, lorsque vous utilisez des données horaires, Looker peut essayer des cycles de saisonnalité quotidiens, hebdomadaires et quatre semaines. Looker prend également en compte la fréquence de la dimension. Si une dimension représente une période de six heures, Looker sait qu'il n'y aura que quatre lignes par jour et ajustera la saisonnalité en conséquence.

Pour les cas d'utilisation courants, l'option Automatique détecte la meilleure saisonnalité pour un ensemble de données spécifique. Si vous connaissez des cycles spécifiques dans l'ensemble de données, l'option Personnalisé vous permet de spécifier le nombre de lignes qui constituent un cycle pour des mesures individuelles dans une prévision.

Lorsque vous prévoyez des valeurs de données pour plusieurs mesures, vous pouvez sélectionner différentes options de saisonnalité, y compris aucune, pour chaque mesure. Le menu déroulant Saisonnalité comporte plusieurs options:

L'option de saisonnalité Automatique est appliquée par défaut aux prévisions, même lorsque l'option Saisonnalité n'est pas activée.

Automatic

Avec l'option de saisonnalité Automatique, Looker sélectionne la meilleure option pour vos données en fonction de plusieurs périodes saisonnières courantes, telles que les périodes quotidiennes, horaires, mensuelles, etc.

Personnalisé

Lorsque vous connaissez le nombre spécifique de lignes qui composent chaque saison ou cycle dans votre ensemble de données, vous pouvez spécifier ce nombre dans le champ Période. Il peut être utile de sélectionner Personnalisé si vous savez que vos données s'affichent dans un nombre spécifique de lignes.

Lorsque vous utilisez des données qui s'affichent en plusieurs mois, mais qui sont exprimées de façon plus détaillée (par exemple, en utilisant une précision de date ou de semaine dans une exploration), une période de quatre semaines ou 30 jours convient généralement aux cycles mensuels.

Aucune

La saisonnalité est un composant puissant de prévision. Toutefois, en fonction des données d'entrée, elle n'est pas toujours recommandée. Si les données ne contiennent pas de cycles prévisibles, l'activation de la saisonnalité peut parfois donner lieu à des prévisions inexactes, lorsque l'algorithme tente d'identifier une tendance, puis tente d'adapter la fausse tendance à la prévision. Cela peut entraîner une prédiction obscurcie.

Lorsque vous prévoyez des valeurs de données pour plusieurs mesures et que vous souhaitez activer la saisonnalité pour une seule ou plusieurs, vous pouvez sélectionner Aucune pour toutes les mesures pour lesquelles vous ne souhaitez pas activer la saisonnalité.

Créer une prévision

Seuls les utilisateurs disposant des autorisations peuvent créer des prévisions.

Pour créer une prévision:

  1. Vérifiez que l'onglet "Explorer" respecte les exigences concernant les prévisions. Prenons l'exemple d'une requête "Explorer" qui affiche le nombre d'utilisateurs créés, le nombre d'utilisateurs et le nombre d'ordres, puis les trie par nombre d'utilisateurs créés par mois, dans l'ordre décroissant:

  2. Dans l'onglet Explorer, sélectionnez Prévision pour ouvrir le menu Prévision.

  3. Cliquez sur le menu déroulant Sélectionner un champ pour choisir jusqu'à cinq mesures ou des mesures personnalisées pour les prévisions.

  4. Saisissez la longueurà venir dans le champ Length.

  5. Sélectionnez l'option Intervalle de prédiction ou Saisonnalité pour activer chaque fonction et personnaliser les options associées.

  6. Sélectionnez x dans l'onglet de menu à côté de Prévision pour enregistrer vos paramètres et quitter le menu.

  7. Sélectionnez Exécuter pour réexécuter la requête Explorer. (Vous devez l'exécuter à nouveau après avoir modifié la prévision.)

Vos résultats et votre visualisation Explorer affichent maintenant les valeurs prévues pour la durée spécifiée. L'exemple d'exploration affiche maintenant les données prévues pour les nombres d'utilisateurs et le nombre de commandes pour six mois entre le 01/01/2020 et le 06/06/2020:

Les calculs prévisionnels dépendent de l'ordre de tri des données. Par conséquent, le tri est désactivé lorsqu'une requête prévisionnelle est exécutée.

Modifier une prévision

Seuls les utilisateurs disposant de droits peuvent modifier les prévisions.

Pour modifier une prévision:

  1. Vous pouvez également modifier la requête "Explorer" si nécessaire pour ajouter ou supprimer différentes mesures ou différents champs de période. Vérifiez que l'onglet "Explorer" respecte les exigences concernant les prévisions.

  2. Dans l'onglet Explorer, sélectionnez Prévision pour ouvrir le menu Prévision.

  3. Cliquez sur le menu déroulant Sélectionner un champ pour modifier les champs prévus. Pour supprimer des champs prévus:

    • Cochez les cases à côté des champs prévus dans le menu déroulant Sélectionner un champ pour supprimer les champs de la prévision.
    • Vous pouvez également sélectionner x à côté du nom du champ dans le menu réduit Sélectionner un champ.

  4. Modifiez la longueur spécifiée pour la durée dans le champ Longueur, selon vos besoins.

  5. Sélectionnez l'option Intervalle de prédiction ou Saisonnalité pour activer chaque fonction et personnaliser les options associées.

    • Si les options Intervalle de prédiction ou Saisonnalité sont déjà activées, les personnalisations s'affichent. Modifiez les paramètres personnalisés si vous le souhaitez, ou appuyez sur le bouton pour supprimer la fonction de la prévision.
  6. Sélectionnez x dans l'onglet de menu à côté de Prévision pour enregistrer vos paramètres et quitter le menu.

  7. Sélectionnez Exécuter pour réexécuter la requête Explorer. (Vous devez réexécuter l'exploration après avoir modifié les prévisions.)

Les prévisions et les résultats de la section "Explorer" s'affichent maintenant. Les calculs prévisionnels dépendent de l'ordre de tri des données. Par conséquent, le tri est désactivé lorsqu'une requête prévisionnelle est exécutée.

Supprimer une prévision

Seuls les utilisateurs disposant des autorisations peuvent supprimer des prévisions.

Pour supprimer une prévision d'une exploration:

  1. Dans l'onglet Explorer, sélectionnez Prévision pour ouvrir le menu Prévision.
  2. Sélectionnez Effacer.

La requête sera réexécutée automatiquement pour produire les résultats sans prévision.

Problèmes courants et points importants

Est-il précis ?

La précision d'une prévision dépend des données d'entrée. L'implémentation AutoARIMA de Looker permet d'obtenir des prédictions incroyablement précises qui combinent avec succès de nombreuses nuances à partir des données d'entrée. Dans certains cas, l'algorithme est pris dans des motifs étranges dans les données d'entrée et les met davantage en avant dans la prédiction. Pour tirer le meilleur parti des prévisions, assurez-vous d'avoir fourni suffisamment de données et d'être aussi précises que possible.

Impossible de générer une prévision

Une prévision ne peut pas être générée pour des raisons légitimes. Cela est généralement dû au fait que la quantité de données d'entrée est trop faible ou que la longueur de prévision prévue est trop élevée. Il n'y a pas de limite spécifique à ces deux facteurs, et il n'existe pas de ratio exact de données d'entrée requises pour une certaine durée de prévision. Plus les données d'entrée sont dispersées et imprévisibles, plus il est difficile pour l'algorithme AutoARIMA de trouver une correspondance. Le moyen le plus efficace de générer des prévisions est d'augmenter la quantité de données d'entrée nettoyées, de vous assurer que les paramètres de saisonnalité sont corrects et de limiter la durée de la prévision à seulement ce qui est nécessaire. Lorsque vous utilisez l'option Intervalle de prédiction, il peut être utile de choisir un intervalle plus faible.

Le nettoyage des données d'entrée peut impliquer les actions suivantes:

  • Couper les lignes de début ou de fin pour les périodes qui ne contiennent pas de données
  • Réduire le bruit dans l'ensemble de données en choisissant une dimension "Date" plus grande
  • Modification des anomalies de filtre qui ne profitent pas à la prédiction

Le résultat de la requête a été renvoyé sans prévision, et une erreur inconnue s'est produite

Cela ne devrait pas se produire. Si c'est le cas, essayez de supprimer la ou les mesures de la configuration de prévision, puis de les ajouter à nouveau.

Les prévisions s'affichent, mais elles sont manifestement fausses ou inutiles

Dans ce cas, la meilleure chose à faire est d'ajouter d'autres données d'entrée, de les nettoyer autant que possible et éventuellement de définir une saisonnalité personnalisée (si vous connaissez des cycles spécifiques dans les données) ou de désactiver complètement l'option Saisonnalité en sélectionnant Aucun.

Le nettoyage des données d'entrée peut impliquer les tâches suivantes:

  • Couper les lignes de début ou de fin pour les périodes qui ne contiennent pas de données
  • Réduire le bruit dans l'ensemble de données en choisissant une dimension "Date" plus grande
  • Modification des anomalies de filtre qui ne profitent pas à la prédiction