Prognosen in Visualisierungen

Mithilfe von Prognosen können Fachkräfte für Datenanalyse neuen oder vorhandenen Explore-Abfragen schnell Datenprojektionen hinzufügen, um Benutzern die Vorhersage und Überwachung bestimmter Datenpunkte zu erleichtern. Prognostizierte Explore-Ergebnisse und -Visualisierungen können Dashboards hinzugefügt und als Looks gespeichert werden. Prognostizierte Ergebnisse und Visualisierungen können auch auf eingebetteten Looker-Inhalten erstellt und angesehen werden.

Sie können Prognosedaten erstellen, wenn Sie die Berechtigung zum Erstellen von Prognosen haben.

So werden prognostizierte Ergebnisse erstellt und angezeigt

Die Funktion Prognose verwendet die Datenergebnisse aus der Datentabelle eines Explores, um zukünftige Datenpunkte zu berechnen. Prognoseberechnungen umfassen nur die angezeigten Ergebnisse einer Explore-Abfrage. Ergebnisse, die aufgrund von Zeilenlimits nicht angezeigt werden, sind nicht eingeschlossen. Weitere Informationen zu dem Algorithmus, der zur Berechnung von Prognosen verwendet wird, finden Sie im Abschnitt ARIMA-Algorithmus auf dieser Seite.

Prognostizierte Ergebnisse werden als Fortsetzung vorhandener Explore-Visualisierungen angezeigt und unterliegen den konfigurierten Visualisierungseinstellungen. So unterscheiden sich prognostizierte Datenpunkte von nicht prognostizierten Datenpunkten:

  1. In unterstützten kartesischen Diagrammen unterscheiden sich prognostizierte Datenpunkte von nicht prognostizierten Datenpunkten, indem sie in einer helleren Schattierung oder durch gestrichelte Linien gerendert werden.
  2. In unterstützten Text- und Tabellendiagrammtypen werden prognostizierte Datenpunkte kursiv dargestellt und mit einem Sternchen versehen.

Prognostizierte Daten werden auch explizit in der Kurzinfo angezeigt, die angezeigt wird, wenn Sie den Mauszeiger auf einen prognostizierten Datenpunkt bewegen.

Wie im folgenden Abschnitt erläutert, werden prognostizierte Daten nur von bestimmten Visualisierungstypen unterstützt.

ARIMA-Algorithmus

Bei der Prognose wird ein ARIMA-Algorithmus (AutoRegressive Integrated Integrated Durchschnitt) verwendet, um eine Gleichung zu erstellen, die den in eine Prognose eingegebenen Daten am besten entspricht. Um die beste Übereinstimmung für die Daten zu finden, führt Looker ARIMA mit einer Reihe von Anfangsvariablen aus, erstellt eine Liste von Varianten der Anfangsvariablen und führt ARIMA erneut mit diesen Varianten aus. Wenn eine der Varianten eine Gleichung ergibt, die besser zu den Eingabedaten passt, verwendet Looker diese als neue Anfangsvariablen und erstellt zusätzliche Varianten, die dann ausgewertet werden. Looker wiederholt diesen Prozess so lange, bis die besten Variablen identifiziert wurden oder bis alle Optionen oder die zugewiesene Rechenzeit aufgebraucht ist.

Dieser Prozess kann man sich als einen genetischen Algorithmus vorstellen, bei dem Individuen aus Hunderten von Generationen jeweils 1 bis 10 Nachwuchs erzeugen (verschiedene Variablen je nach Elternteil) und die besten Nachkommen überleben, um potenziell „bessere“ Generationen zu schaffen. Die Art und Weise, wie Looker viele Aufrufe von ARIMA in einem Ansatz mit einem genetischen Algorithmus verwendet, heißt AutoARIMA.

Weitere Informationen zu AutoARIMA finden Sie im Abschnitt Tipps zur Verwendung von auto_arima des pmdarima-Nutzerhandbuchs. Obwohl dies nicht die Bibliothek ist, die Looker zum Ausführen von AutoARIMA verwendet, liefert pmdarima die beste Erklärung des Prozesses und der verschiedenen verwendeten Variablen.

Unterstützte Visualisierungsarten

Die folgenden kartesischen Visualisierungstypen unterstützen das Rendern von prognostizierten Daten:

Die folgenden Text- und Tabellendiagrammtypen unterstützen das Rendern von prognostizierten Daten:

Andere Visualisierungsarten, einschließlich benutzerdefinierter Visualisierungen, können derzeit keine prognostizierten Daten darstellen.

Abfrageanforderungen für Prognosen

Zum Erstellen einer Prognose muss ein Explore die folgenden Anforderungen erfüllen:

  • Schließen Sie genau eine Dimension ein. Dabei muss es sich um eine Zeitraumdimension handeln und die Dimensionsergänzung muss aktiviert sein.
  • Schließen Sie mindestens einen Messwert oder einen benutzerdefinierten Messwert ein. Eine Prognose kann bis zu fünf Messungen oder benutzerdefinierte Messwerte enthalten.
  • Ergebnisse nach der Zeitrahmendimension in absteigender Reihenfolge sortieren

Wichtige Punkte

Folgende zusätzliche Kriterien müssen berücksichtigt werden, wenn Sie eine neue Explore-Abfrage für eine Prognose erstellen oder einer vorhandenen Explore-Abfrage eine Prognose hinzufügen:

  • Pivot-Tabellen: Prognosen können für pivotierte Explores erstellt werden, sofern die vorherigen Anforderungen erfüllt sind.
  • Zeilensummen und Zwischensummen: Zeilensummen und Zwischensummen enthalten keine prognostizierten Werte. Wir raten davon ab, Zwischensummen oder Zeilensummen für Prognosen zu verwenden, da dies zu unerwarteten Zahlen führen kann.
  • Filter, die unvollständige Zeitrahmen enthalten – Für genaue Projektionen sollten Prognosen nur in Verbindung mit einer vollständigen Zeitrahmenlogik in Explore-Filtern verwendet werden, wenn Explores Daten für unvollständige Zeitrahmen enthalten. Wenn ein User beispielsweise Daten für einen Monat in der Zukunft prognostiziert, während ein Explore gefiltert ist, um Daten für die vergangenen drei Monate anzuzeigen, enthält das Explore die Daten für den aktuell unvollständigen Monat. Die Prognose berücksichtigt die unvollständigen Daten in ihrer Berechnung und zeigt unzuverlässige Ergebnisse an. Verwenden Sie stattdessen eine Filterlogik wie in den letzten 3 vollständigen Monaten statt in den letzten 3 Monaten, wenn ein Explore unvollständige Zeitrahmen enthält (z. B. wenn ein Explore unvollständige monatliche Daten für den aktuellen Monat enthält), um eine genauere Prognose zu erhalten.
  • Tabellenkalkulationen: Tabellenkalkulationen, die auf einem oder mehreren prognostizierten Messwerten basieren, werden automatisch in eine Prognose einbezogen.
  • Zeilenlimits: Hier erfahren Sie, wie Zeilenlimits auf die gesamte Datentabelle angewendet werden, einschließlich prognostizierter Zeilen.

Zusätzliche Tipps und Ressourcen zur Fehlerbehebung finden Sie im Abschnitt Häufige Probleme und Informationen auf dieser Seite.

Normalerweise führt ein Dataset mit mehr Zeilen in Verbindung mit einer kürzeren Prognosedauer zu einer genaueren Prognose.

Menüoptionen für Prognosen

Mit den Optionen im Menü Prognose auf dem Tab Visualisierung können Sie prognostizierte Daten anpassen. Das Menü Prognose enthält die folgenden Optionen:

Feld auswählen

Im Drop-down-Menü Feld auswählen werden die Messwerte oder benutzerdefinierten Messwerte in der Explore-Abfrage angezeigt, die für Prognosen verfügbar sind. Sie können bis zu fünf Messungen oder benutzerdefinierte Messungen auswählen.

Länge

Die Option Länge gibt die Anzahl der Zeilen oder den Zeitraum an, für die Datenwerte vorhergesagt werden sollen. Das Intervall für die Prognosedauer wird automatisch anhand der Zeitrahmendimension in der Explore-Abfrage ausgefüllt.

Normalerweise führt ein Dataset mit mehr Zeilen in Verbindung mit einer kürzeren Prognosedauer zu einer genaueren Prognose.

Vorhersageintervall

Mit der Option Vorhersageintervall können Analysten bei Prognosen eine gewisse Unsicherheit ausdrücken, um die Genauigkeit zu erhöhen. Wenn die Option Vorhersageintervall aktiviert ist, können Sie die Grenzen der prognostizierten Datenwerte auswählen. Ein Vorhersageintervall von 95% bedeutet beispielsweise eine Wahrscheinlichkeit von 95 %, dass prognostizierte Messwerte zwischen der Ober- und Untergrenze der Prognose liegen.

Je größer das ausgewählte Vorhersageintervall ist, desto breiter sind die Ober- und Untergrenzen.

Saisonalität

Mit der Option Saisonalität können Analysten bekannte Zyklen oder sich wiederholende Datentrends in einer Prognose berücksichtigen. Sie bezieht sich auf die Anzahl der Datenzeilen im Zyklus. Wenn beispielsweise eine Explore-Datentabelle eine Zeile pro Stunde hat und die Datenzyklen täglich aktualisiert werden, beträgt die Saisonabhängigkeit 24.

Bei den Standardeinstellungen für Prognosen verweist Looker auf die Datumsdimension in einem Explore und scannt mehrere mögliche saisonale Zyklen, um die beste Übereinstimmung für die endgültige Prognose zu finden. Bei der Verwendung von stündlichen Daten kann Looker beispielsweise tägliche, wöchentliche und vierwöchige Saisonzyklen ausprobieren. Looker berücksichtigt auch die Häufigkeit der Dimension. Wenn eine Dimension einen Zeitraum von sechs Stunden darstellt, weiß Looker, dass es nur vier Zeilen pro Tag gibt, und passt die Saisonalität entsprechend an.

Für häufige Anwendungsfälle wird mit der Option Automatisch die beste Saisonabhängigkeit für einen bestimmten Datensatz ermittelt. Wenn Ihnen bestimmte Zyklen im Dataset bekannt sind, können Sie mit der Option Benutzerdefiniert die Anzahl der Zeilen angeben, aus denen ein Zyklus für einzelne Messungen in einer Prognose besteht.

Wenn Sie die Datenwerte für mehrere Messwerte prognostizieren, können Sie für jede einzelne Messung verschiedene saisonale Optionen auswählen, einschließlich keine. Das Drop-down-Menü Saisonalität enthält mehrere Optionen:

Bei der Prognose wird die saisonale Option Automatisch standardmäßig auf Prognosen angewendet, auch wenn die Option Saisonalität nicht aktiviert ist.

Automatisch

Bei der saisonalen Option Automatisch wählt Looker die beste Option für Ihre Daten aus mehreren häufigen saisonalen Zeiträumen aus, z. B. täglich, stündlich, monatlich usw.

Benutzerdefiniert

Wenn Sie die genaue Anzahl der Zeilen kennen, aus denen jede Staffel oder jeder Zyklus in Ihrem Dataset besteht, können Sie die Zahl im Feld Period angeben. Es kann hilfreich sein, Benutzerdefiniert auszuwählen, wenn Sie wissen, dass sich Ihre Daten in einer bestimmten Anzahl von Zeilen befinden.

Wenn Sie mit Daten arbeiten, deren Zyklen in Monaten erfolgt, aber in einem größeren Detaillierungsgrad ausgedrückt wird (z. B. durch Verwendung der Granularität Datum oder Woche in einem Explore), passt ein Zeitraum von 4 Wochen oder 30 Tagen in der Regel zu monatlichen Zyklen.

Ohne

Saisonabhängigkeit ist ein wichtiger Bestandteil der Prognose, wird jedoch je nach Eingabedaten nicht immer empfohlen. Wenn die Daten keine vorhersehbaren Zyklen enthalten, kann die Aktivierung der Saisonabhängigkeit gelegentlich zu ungenauen Prognosen führen, wenn der Algorithmus versucht, ein Muster zu finden und dann versucht, das falsche Muster an die Prognose anzupassen. Dies kann zu einer unklaren Vervollständigung führen.

Wenn Sie Datenwerte für mehrere Messungen prognostizieren und die Saisonalität nur für einen oder mehrere Messwerte aktivieren möchten, können Sie Keine für alle Messungen auswählen, für die Sie Saisonalität nicht aktivieren möchten.

Prognose erstellen

Nur Nutzer mit Berechtigung können Prognosen erstellen.

So erstellen Sie eine Prognose:

  1. Achten Sie darauf, dass Ihr Explore die Anforderungen an Prognosen erfüllt. Beispiel: Ein Nutzer möchte eine Prognose für eine Explore-Abfrage mit Nutzer erstellt im Monat, Anzahl der Nutzer und Anzahl der Aufträge erstellen, die in absteigender Reihenfolge nach Monat der Nutzererstellung sortiert ist. Die Ergebnisse umfassen Daten bis Dezember 2019.

  2. Klicken Sie auf dem Tab Visualisierung auf Prognose, um das Menü Prognose zu öffnen.

  3. Klicken Sie auf das Drop-down-Menü Feld auswählen, um bis zu fünf Messwerte oder benutzerdefinierte Messwerte für die Prognose auszuwählen. Der Nutzer im Beispiel wählt Nutzeranzahl und Anzahl der Bestellungen aus.

  4. Geben Sie in das Feld Länge die Dauer des Zeitraums in der Zukunft ein, für den Sie eine Prognose erstellen möchten. Der Nutzer im Beispiel gibt 6 Monate ein.

  5. Klicken Sie optional auf den Schalter Vorhersageintervall oder Saisonalität, um eine der beiden Funktionen zu aktivieren und die zugehörigen Optionen anzupassen. Der Nutzer im Beispiel aktiviert keine der beiden Optionen.

  6. Klicken Sie auf dem Tab „Menü“ neben Prognose auf das x, um die Einstellungen zu speichern und das Menü zu schließen.

  7. Klicken Sie auf Ausführen, um die Explore-Abfrage noch einmal auszuführen. (Sie müssen das Explore noch einmal ausführen, nachdem Sie Änderungen an der Prognose vorgenommen haben.)

Die Explore-Ergebnisse und -Visualisierung zeigen jetzt prognostizierte Werte für den angegebenen Zeitraum an. Mit den angegebenen Optionen zeigt das Beispiel-Explore prognostizierte Daten für Nutzeranzahl und Anzahl der Aufträge für sechs Monate vom 1. bis zum 6. Juni 2020 an.

Da prognostizierte Berechnungen von der Reihenfolge abhängen, in der Daten sortiert werden, ist die Sortierung nach Ausführung einer prognostizierten Abfrage deaktiviert.

Prognosen bearbeiten

Nur Nutzer mit Berechtigung können Prognosen bearbeiten.

So bearbeiten Sie eine Prognose:

  1. Optional können Sie die Explore-Abfrage nach Bedarf bearbeiten, um verschiedene Kennzahlen- oder Zeitrahmenfelder hinzuzufügen oder zu entfernen. Achten Sie darauf, dass Ihr Explore die Anforderungen an Prognosen erfüllt.
  2. Klicken Sie auf dem Tab Visualisierung auf Prognose, um das Menü Prognose zu öffnen.
  3. Klicken Sie auf das Drop-down-Menü Feld auswählen, um Änderungen an den prognostizierten Feldern vorzunehmen. So entfernen Sie prognostizierte Felder:
    • Klicken Sie im erweiterten Drop-down-Menü Feld auswählen auf die Kästchen neben den prognostizierten Feldern, um die Felder aus der Prognose zu entfernen.
    • Alternativ können Sie im minimierten Menü Feld auswählen neben dem Feldnamen auf das x klicken.
  4. Bearbeiten Sie die angegebene Länge für die Prognose im Feld Länge nach Bedarf.
  5. Klicken Sie optional auf den Schalter Vorhersageintervall oder Saisonalität, um eine der beiden Funktionen zu aktivieren und die zugehörigen Optionen anzupassen.
    • Wenn entweder Vorhersageintervall oder Saisonalität bereits aktiviert waren, werden die Anpassungen angezeigt. Bearbeiten Sie die benutzerdefinierten Einstellungen nach Bedarf oder wählen Sie den Schalter aus, um die Funktion aus der Prognose zu entfernen.
  6. Klicken Sie auf dem Tab „Menü“ neben Prognose auf das x, um die Einstellungen zu speichern und das Menü zu schließen.
  7. Klicken Sie auf Ausführen, um die Explore-Abfrage noch einmal auszuführen. (Sie müssen das Explore erneut ausführen, nachdem Sie Änderungen an der Prognose vorgenommen haben.)

In den Explore-Ergebnissen und ‐Visualisierungen wird jetzt die geänderte Prognose angezeigt. Da prognostizierte Berechnungen von der Reihenfolge abhängen, in der Daten sortiert werden, ist die Sortierung nach Ausführung einer prognostizierten Abfrage deaktiviert.

Prognose entfernen

Nur Nutzer mit Berechtigung können Prognosen entfernen.

So entfernen Sie eine Prognose aus einem Explore:

  1. Klicken Sie auf dem Tab Visualisierung auf Prognose, um das Menü Prognose zu öffnen.
  2. Klicken Sie oben im Menü Prognose auf Löschen.

Die Abfrage wird automatisch noch einmal ausgeführt, um Ergebnisse ohne Prognose zu erhalten.

Häufige Probleme und Hinweise

Wie genau ist er?

Die Genauigkeit einer Prognose hängt von den Eingabedaten ab. Die AutoARIMA-Implementierung von Looker kann unglaublich genaue Vorhersagen treffen, mit denen viele Nuancen aus den Eingabedaten erfolgreich kombiniert werden können. Es gibt auch Fälle, in denen sich der Algorithmus in den Eingabedaten in ungerade Muster verfängt und diese in der Vorhersage zu stark betont. Stellen Sie sicher, dass genügend Daten zur Verfügung gestellt werden und so genau wie möglich sind, um Prognosen optimal zu nutzen.

Es konnte keine Prognose erstellt werden

Es gibt legitime Gründe dafür, dass keine Prognose erstellt werden kann. Dies liegt normalerweise daran, dass die Menge der Eingabedaten zu gering oder die angeforderte Länge der Prognose zu groß ist. Keiner der Faktoren ist begrenzt und es gibt kein genaues Verhältnis der erforderlichen Eingabedaten für eine bestimmte Dauer der Prognose. Je verteilter und unvorhersehbarer die Eingabedaten, desto schwieriger wird es für den AutoARIMA-Algorithmus, eine Übereinstimmung zu finden. Die effektivste Methode zum Generieren einer Prognose besteht darin, die Menge der sauberen Eingabedaten zu erhöhen, sicherzustellen, dass die saisonalen Einstellungen korrekt sind, und die Prognosedauer auf das Nötigste zu verkürzen. Wenn Sie die Option Vorhersageintervall verwenden, kann es hilfreich sein, ein niedrigeres Intervall auszuwählen.

Das Bereinigen von Eingabedaten kann Folgendes beinhalten:

  • Voran- oder nachgestellte Zeilen für Zeiträume entfernen, die keine Daten enthalten
  • Rauschen im Datensatz durch Auswahl einer größeren Datumsdimension reduzieren
  • Filterausreißer ändern, die für die Vorhersage nicht von Vorteil sind

Das Ergebnis der Abfrage wurde ohne Prognosen zurückgegeben und ich habe einen unklaren Fehler erhalten.

Das ist nicht der Fall. Versuchen Sie in diesem Fall, die Messwerte aus der Prognosekonfiguration zu entfernen und dann wieder hinzuzufügen.

Die Prognose wird angezeigt, ist aber offensichtlich falsch oder nicht hilfreich

In diesem Fall empfiehlt es sich, weitere Eingabedaten hinzuzufügen, diese so weit wie möglich zu bereinigen und möglicherweise eine benutzerdefinierte Saisonabhängigkeit festzulegen (wenn Sie bestimmte Zyklen in den Daten kennen) oder die Option Saisonalität vollständig zu deaktivieren, indem Sie Keine auswählen.

Das Bereinigen von Eingabedaten kann die folgenden Aufgaben umfassen:

  • Voran- oder nachgestellte Zeilen für Zeiträume entfernen, die keine Daten enthalten
  • Rauschen im Datensatz durch Auswahl einer größeren Datumsdimension reduzieren
  • Filterausreißer ändern, die für die Vorhersage nicht von Vorteil sind