Mit Prognosen können Analysten neuen oder vorhandenen Explore-Abfragen schnell Datenprojektionen hinzufügen, um Nutzer bei der Vorhersage und Überwachung bestimmter Datenpunkte zu unterstützen. Vorhergesagte Explore-Ergebnisse und -Visualisierungen können Dashboards hinzugefügt und als Looks gespeichert werden. Prognosen und Visualisierungen können auch in eingebetteten Looker-Inhalten erstellt und angezeigt werden.
Sie können Daten prognostizieren, wenn Sie die Berechtigung zum Erstellen von Prognosen haben.
So werden prognostizierte Ergebnisse erstellt und angezeigt
Die Funktion Prognose verwendet die Datenergebnisse aus der Datentabelle eines Explores, um zukünftige Datenpunkte zu berechnen. Prognoseberechnungen umfassen nur die angezeigten Ergebnisse einer Explore-Abfrage. Ergebnisse, die aufgrund von Zeilenlimits nicht angezeigt werden, werden nicht berücksichtigt. Weitere Informationen zu dem Algorithmus, der zur Berechnung von Prognosen verwendet wird, finden Sie im Abschnitt ARIMA-Algorithmus auf dieser Seite.
Die prognostizierten Ergebnisse werden als Fortsetzung der vorhandenen explorativen Datenanalyse-Visualisierungen angezeigt und unterliegen den konfigurierten Visualisierungseinstellungen. So unterscheiden sich prognostizierte Datenpunkte von nicht prognostizierten Datenpunkten:
- In unterstützten kartesischen Diagrammen werden prognostizierte Datenpunkte durch eine hellere Schattierung oder durch gestrichelte Linien von nicht prognostizierten Datenpunkten unterschieden.
- In unterstützten Text- und Tabellendiagrammtypen werden prognostizierte Datenpunkte kursiv dargestellt und mit einem Sternchen versehen.
Prognosedaten werden auch in der Kurzinfo angegeben, die eingeblendet wird, wenn Sie den Mauszeiger auf einen prognostizierten Datenpunkt bewegen.
Prognosedaten werden nur für bestimmte Visualisierungstypen unterstützt, wie im folgenden Abschnitt erläutert.
ARIMA-Algorithmus
Bei der Prognose wird ein ARIMA-Algorithmus (AutoRegressive Integrated Moving Average) verwendet, um eine Gleichung zu erstellen, die am besten zu den Daten passt, die in eine Prognose eingegeben werden. Um die beste Übereinstimmung für die Daten zu finden, führt Looker ARIMA mit einer Reihe von Anfangsvariablen aus, erstellt eine Liste von Varianten der Anfangsvariablen und führt ARIMA erneut mit diesen Varianten aus. Wenn eine der Varianten eine Gleichung ergibt, die besser zu den Eingabedaten passt, verwendet Looker diese Varianten als neue Anfangsvariablen und erstellt zusätzliche Varianten, die dann ausgewertet werden. Looker wiederholt diesen Vorgang so lange, bis die besten Variablen gefunden wurden oder alle Optionen oder die zugewiesene Rechenzeit aufgebraucht sind.
Dieser Prozess kann als genetischer Algorithmus betrachtet werden, bei dem Individuen über Hunderte von Generationen hinweg jeweils ein bis zehn Nachkommen erzeugen (Varianten von Variablen, die auf dem Elternteil basieren), und die besten Nachkommen überleben, um potenziell „bessere“ Generationen zu schaffen. Die Art und Weise, wie Looker viele ARIMA-Aufrufe in einem genetischen Algorithmus verwendet, wird als AutoARIMA bezeichnet.
Weitere Informationen zu AutoARIMA finden Sie im Abschnitt Tipps zur Verwendung von auto_arima
des pmdarima-Nutzerhandbuchs. Obwohl dies nicht die Bibliothek ist, die Looker zum Ausführen von AutoARIMA verwendet, bietet pmdarima die beste Erklärung des Prozesses und der verschiedenen verwendeten Variablen.
Unterstützte Visualisierungsarten
Die folgenden kartesischen Visualisierungstypen unterstützen das Rendern von prognostizierten Daten:
Die folgenden Text- und Tabellendiagrammtypen unterstützen das Rendern von Prognosedaten:
Andere Visualisierungsarten, einschließlich benutzerdefinierter Visualisierungen, können derzeit keine vorhergesagten Daten darstellen.
Abfrageanforderungen für Prognosen
Damit eine Prognose erstellt werden kann, muss ein Explore die folgenden Anforderungen erfüllen:
- Schließen Sie genau eine Dimension ein. Dabei muss es sich um eine Zeitraumdimension handeln und die Dimensionsergänzung muss aktiviert sein.
- Fügen Sie mindestens einen Messwert oder benutzerdefinierten Messwert hinzu. Eine Prognose kann bis zu fünf Messwerte oder benutzerdefinierte Messwerte enthalten.
- Ergebnisse nach dem Zeitraum in absteigender Reihenfolge sortieren
Wichtige Punkte
Folgende zusätzliche Kriterien müssen berücksichtigt werden, wenn Sie eine neue Explore-Abfrage für eine Prognose erstellen oder einer vorhandenen Explore-Abfrage eine Prognose hinzufügen:
- Pivot-Tabellen: Prognosen können für pivotierte Explores erstellt werden, sofern die vorstehenden Anforderungen erfüllt sind.
- Zeilensummen und Zwischensummen: Zeilensummen und Zwischensummen enthalten keine prognostizierten Werte. Zwischensummen oder Summen für Zeilen sollten nicht in Prognosen verwendet werden, da dies zu unerwarteten Zahlen führen kann.
- Filter, die unvollständige Zeitrahmen enthalten – Für genaue Projektionen sollten Prognosen nur in Verbindung mit einer vollständigen Zeitrahmenlogik in Explore-Filtern verwendet werden, wenn Explores Daten für unvollständige Zeitrahmen enthalten. Wenn ein Nutzer beispielsweise Daten für einen Monat in der Zukunft prognostiziert, während ein Explore so gefiltert ist, dass Daten für die letzten drei Monate angezeigt werden, enthält das Explore die Daten für den aktuellen unvollständigen Monat. Die Prognose berücksichtigt die unvollständigen Daten in ihrer Berechnung und zeigt unzuverlässige Ergebnisse an. Verwenden Sie stattdessen eine Filterlogik wie in den letzten 3 vollständigen Monaten statt in den letzten 3 Monaten, wenn ein Explore unvollständige Zeitrahmen enthält (z. B. wenn ein Explore unvollständige monatliche Daten für den aktuellen Monat enthält), um eine genauere Prognose zu erhalten.
- Tabellenkalkulationen: Tabellenkalkulationen, die auf einem oder mehreren prognostizierten Messwerten basieren, werden automatisch in eine Prognose aufgenommen.
- Zeilenlimits: Hier erfahren Sie, wie sich Zeilenlimits auf die gesamte Datentabelle auswirken, einschließlich der prognostizierten Zeilen.
Weitere Tipps und Ressourcen zur Fehlerbehebung finden Sie im Abschnitt Häufige Probleme und wichtige Informationen auf dieser Seite.
In der Regel führt ein Datensatz mit mehr Zeilen in Verbindung mit einer kürzeren Prognosedauer zu einer genaueren Prognose.
Menüoptionen für die Prognose
Mit den Optionen im Menü Prognose auf dem Tab Visualisierung der explorativen Datenanalyse können Sie die prognostizierten Daten anpassen. Das Menü Prognose enthält die folgenden Optionen:
Feld auswählen
Im Drop-down-Menü Feld auswählen werden die Messwerte oder benutzerdefinierten Messwerte in der explorativen Datenanalyse angezeigt, die für die Prognose verfügbar sind. Sie können bis zu fünf Messungen oder benutzerdefinierte Messungen auswählen.
Länge
Mit der Option Länge geben Sie die Anzahl der Zeilen oder die Zeitspanne an, für die Datenwerte prognostiziert werden sollen. Das Intervall für die Prognosedauer wird automatisch basierend auf der Zeitrahmendimension in der explorativen Datenanalyse ausgefüllt.
In der Regel führt ein Datensatz mit mehr Zeilen in Verbindung mit einer kürzeren Prognosedauer zu einer genaueren Prognose.
Vorhersageintervall
Mit der Option Prognoseintervall können Analysten Unsicherheiten in Prognosen ausdrücken, um die Genauigkeit zu verbessern. Wenn die Option Vorhersageintervall aktiviert ist, können Sie die Grenzen der prognostizierten Datenwerte auswählen. Ein Vorhersageintervall von 95 % gibt beispielsweise an, dass die prognostizierten Messwerte mit einer Wahrscheinlichkeit von 95 % zwischen der Ober- und Untergrenze der Prognose liegen.
Je größer das ausgewählte Vorhersageintervall ist, desto breiter sind die Ober- und Untergrenzen.
Saisonalität
Mit der Option Saisonalität können Analysten bekannte Zyklen oder wiederkehrende Datentrends in einer Prognose berücksichtigen. Sie bezieht sich auf die Anzahl der Datenzeilen im Zyklus. Wenn eine Explore-Datentabelle beispielsweise eine Zeile pro Stunde enthält und die Daten täglich aktualisiert werden, beträgt die Saisonabhängigkeit 24.
Bei den Standardeinstellungen für Prognosen verweist Looker auf die Datumsdimension in einem Explore und scannt mehrere mögliche saisonale Zyklen, um die beste Übereinstimmung für die endgültige Prognose zu finden. Bei der Verwendung von stündlichen Daten kann Looker beispielsweise tägliche, wöchentliche und vierwöchige saisonale Zyklen ausprobieren. Looker berücksichtigt auch die Häufigkeit der Dimension. Wenn eine Dimension einen Zeitraum von sechs Stunden darstellt, weiß Looker, dass es nur vier Zeilen pro Tag gibt, und passt die Saisonalität entsprechend an.
Bei gängigen Anwendungsfällen wird mit der Option Automatisch die beste Saisonabhängigkeit für einen bestimmten Datensatz ermittelt. Wenn Ihnen bestimmte Zyklen im Dataset bekannt sind, können Sie mit der Option Benutzerdefiniert die Anzahl der Zeilen angeben, aus denen ein Zyklus für einzelne Messungen in einer Prognose besteht.
Wenn Sie die Datenwerte für mehrere Messwerte prognostizieren, können Sie für jede einzelne Messung verschiedene saisonale Optionen auswählen, einschließlich keine. Das Drop-down-Menü Saisonalität enthält mehrere Optionen:
Bei der Prognose wird die Option Automatisch standardmäßig auf Prognosen angewendet, auch wenn die Option Saisonalität nicht aktiviert ist.
Automatisch
Mit der Option Automatisch wählt Looker die beste Option für Ihre Daten aus mehreren gängigen saisonalen Zeiträumen aus, z. B. täglich, stündlich oder monatlich.
Benutzerdefiniert
Wenn Sie die genaue Anzahl der Zeilen kennen, aus denen jede Staffel oder jeder Zyklus in Ihrem Dataset besteht, können Sie die Zahl im Feld Period angeben. Wenn Sie wissen, dass Ihre Daten in einer bestimmten Anzahl von Zeilen durchlaufen, kann es hilfreich sein, Benutzerdefiniert auszuwählen.
Wenn Sie mit Daten arbeiten, deren Zyklen in Monaten erfolgt, aber in einem größeren Detaillierungsgrad ausgedrückt wird (z. B. durch Verwendung der Granularität Datum oder Woche in einem Explore), passt ein Zeitraum von 4 Wochen oder 30 Tagen in der Regel zu monatlichen Zyklen.
Keine
Saisonabhängigkeiten sind eine leistungsstarke Komponente der Prognose. Je nach Eingabedaten ist sie jedoch nicht immer empfehlenswert. Wenn die Daten keine vorhersehbaren Zyklen enthalten, kann die Aktivierung der Saisonabhängigkeit gelegentlich zu ungenauen Prognosen führen, wenn der Algorithmus versucht, ein Muster zu finden und dann versucht, das falsche Muster an die Prognose anzupassen. Das kann zu einer ungenauen Vorhersage führen.
Wenn Sie Datenwerte für mehrere Messungen prognostizieren und die Saisonalität nur für einen oder mehrere Messwerte aktivieren möchten, können Sie Keine für alle Messungen auswählen, für die Sie Saisonalität nicht aktivieren möchten.
Prognose erstellen
Nur Nutzer mit Berechtigung können Prognosen erstellen.
So erstellen Sie eine Prognose:
Achten Sie darauf, dass Ihr Explore die Anforderungen an Prognosen erfüllt. Beispiel: Ein Nutzer möchte eine Prognose für eine Explore-Abfrage mit Nutzer erstellt im Monat, Anzahl der Nutzer und Anzahl der Aufträge erstellen, die in absteigender Reihenfolge nach Monat der Nutzererstellung sortiert ist. Die Ergebnisse umfassen Daten bis Dezember 2019.
Klicken Sie auf dem Tab Visualisierung auf Prognose, um das Menü Prognose zu öffnen.
Klicken Sie auf das Drop-down-Menü Feld auswählen, um bis zu fünf Messwerte oder benutzerdefinierte Messwerte für die Prognose auszuwählen. Der Nutzer im Beispiel wählt Nutzeranzahl und Anzahl der Bestellungen aus.
Geben Sie in das Feld Länge die Dauer des Zeitraums in der Zukunft ein, für den Sie eine Prognose erstellen möchten. Der Nutzer im Beispiel gibt 6 Monate ein.
Optional können Sie auf den Schalter Prognoseintervall oder Saisonalität klicken, um die jeweilige Funktion zu aktivieren und die zugehörigen Optionen anzupassen. Der Nutzer im Beispiel aktiviert keine der beiden Optionen.
Klicken Sie auf dem Menüband neben Prognose auf das x, um die Einstellungen zu speichern und das Menü zu schließen.
Klicken Sie auf Ausführen, um die Explore-Abfrage noch einmal auszuführen. Nachdem Sie Änderungen an der Prognose vorgenommen haben, müssen Sie die explorative Trichteranalyse noch einmal ausführen.
Die Explore-Ergebnisse und -Visualisierung zeigen jetzt prognostizierte Werte für den angegebenen Zeitraum an. Mit den angegebenen Optionen werden im Beispiel-Explore für sechs Monate vom 1. bis zum 6. Juni 2020 prognostizierte Daten für Nutzeranzahl und Anzahl der Aufträge angezeigt.
Da prognostizierte Berechnungen von der Reihenfolge abhängen, in der Daten sortiert werden, ist das Sortieren nach Ausführung einer prognostizierten Abfrage deaktiviert.
Prognosen bearbeiten
Nur Nutzer mit Berechtigung können Prognosen bearbeiten.
So bearbeiten Sie eine Prognose:
- Sie können die explorative Datenanalyse nach Bedarf bearbeiten, um verschiedene Messwerte oder Zeitrahmenfelder hinzuzufügen oder zu entfernen. Achten Sie darauf, dass Ihr Explore die Anforderungen an Prognosen erfüllt.
- Klicken Sie auf dem Tab Visualisierung auf Prognose, um das Menü Prognose zu öffnen.
- Klicken Sie auf das Drop-down-Menü Feld auswählen, um Änderungen an den prognostizierten Feldern vorzunehmen. So entfernen Sie prognostizierte Felder:
- Klicken Sie im erweiterten Drop-down-Menü Feld auswählen auf die Kästchen neben den prognostizierten Feldern, um die Felder aus der Prognose zu entfernen.
- Alternativ können Sie im minimierten Menü Feld auswählen neben dem Feldnamen auf das x klicken.
- Bearbeiten Sie die angegebene Zeitraum in der Zukunft, für den eine Prognose erstellt werden soll, im Feld Zeitraum.
- Optional können Sie auf den Schalter Prognoseintervall oder Saisonalität klicken, um die jeweilige Funktion zu aktivieren und die zugehörigen Optionen anzupassen.
- Wenn entweder Prognoseintervall oder Saisonalität bereits aktiviert war, werden die Anpassungen angezeigt. Bearbeiten Sie die benutzerdefinierten Einstellungen nach Bedarf oder deaktivieren Sie die Funktion, indem Sie den Schalter auswählen.
- Klicken Sie auf dem Menüband neben Prognose auf das x, um die Einstellungen zu speichern und das Menü zu schließen.
- Klicken Sie auf Ausführen, um die explorative Datenanalyse noch einmal auszuführen. (Sie müssen das Explore erneut ausführen, nachdem Sie Änderungen an der Prognose vorgenommen haben.)
In den Ergebnissen und der Visualisierung des explorativen Datenanalysetools wird jetzt die geänderte Prognose angezeigt. Da Prognoseberechnungen von der Reihenfolge abhängen, in der Daten sortiert werden, wird die Sortierung deaktiviert, sobald eine Prognoseabfrage ausgeführt wurde.
Prognose entfernen
Nur Nutzer mit der entsprechenden Berechtigung können Prognosen entfernen.
So entfernen Sie eine Prognose aus einem Explore:
- Klicken Sie auf dem Tab Visualisierung auf Prognose, um das Menü Prognose zu öffnen.
- Klicken Sie oben im Menü Prognose auf Löschen.
Die Abfrage wird automatisch noch einmal ausgeführt, um die Ergebnisse ohne angewendete Prognose zu erhalten.
Häufige Probleme und wichtige Informationen
Wie genau ist sie?
Die Genauigkeit einer Prognose hängt von den Eingabedaten ab. Die AutoARIMA-Implementierung von Looker kann unglaublich genaue Vorhersagen treffen, mit denen viele Nuancen aus den Eingabedaten erfolgreich kombiniert werden können. Es gibt auch Fälle, in denen der Algorithmus von seltsamen Mustern in den Eingabedaten beeinflusst wird und diese bei der Vorhersage überbetont. Achten Sie darauf, dass genügend Daten vorhanden sind und dass die Daten möglichst genau sind, damit Sie die Vorhersagen optimal nutzen können.
Es konnte keine Prognose erstellt werden
Es gibt legitime Gründe dafür, dass keine Prognose erstellt werden kann. In der Regel liegt das daran, dass die Menge der Eingabedaten zu gering oder die angeforderte Prognosedauer zu lang ist. Keiner der Faktoren ist begrenzt und es gibt kein genaues Verhältnis der erforderlichen Eingabedaten für eine bestimmte Dauer der Prognose. Je ungleichmäßiger und unvorhersehbarer die Eingabedaten sind, desto schwieriger ist es für den AutoARIMA-Algorithmus, eine Übereinstimmung zu finden. Die effektivste Methode zur Erstellung einer Prognose besteht darin, die Menge der sauberen Eingabedaten zu erhöhen, dafür zu sorgen, dass die Einstellungen für die Saisonabhängigkeit korrekt sind, und die Prognosedauer auf das Nötigste zu beschränken. Wenn Sie die Option Vorhersageintervall verwenden, kann es hilfreich sein, ein niedrigeres Intervall auszuwählen.
Die Bereinigung von Eingabedaten kann Folgendes umfassen:
- Voran- oder nachgestellte Zeilen für Zeiträume entfernen, die keine Daten enthalten
- Rauschen im Datensatz durch Auswahl einer größeren Datumsdimension reduzieren
- Filterausreißer ändern, die für die Vorhersage nicht von Vorteil sind
Das Ergebnis der Abfrage wurde ohne Prognosen zurückgegeben und ich habe einen unklaren Fehler erhalten.
Das sollte nicht passieren. Falls doch, entfernen Sie die Messwerte aus der Prognosekonfiguration und fügen Sie sie dann wieder hinzu.
Die Vorhersage wird angezeigt, ist aber offensichtlich falsch oder nicht hilfreich.
In diesem Fall sollten Sie am besten weitere Eingabedaten hinzufügen, diese so weit wie möglich bereinigen und gegebenenfalls eine benutzerdefinierte Saisonabhängigkeit festlegen (falls Sie bestimmte Zyklen in den Daten kennen) oder die Option Saisonabhängigkeit deaktivieren, indem Sie Kein auswählen.
Das Bereinigen von Eingabedaten kann die folgenden Aufgaben umfassen:
- Anfängliche oder abschließende Zeilen für Zeiträume ohne Daten zuschneiden
- Rauschen im Datensatz durch Auswahl einer größeren Datumsdimension reduzieren
- Ausreißer herausfiltern, die die Vorhersage nicht verbessern