Previsione nelle visualizzazioni

La previsione consente agli analisti di aggiungere rapidamente proiezioni di dati a query Esplora nuove o esistenti per aiutare gli utenti a prevedere e monitorare punti dati specifici. I risultati e le visualizzazioni delle esplorazioni previste possono essere aggiunti alle dashboard e salvati come look. I risultati e le visualizzazioni previsti possono anche essere creati e visualizzati nei contenuti Looker incorporati.

Puoi prevedere i dati se hai l'autorizzazione per creare previsioni.

Come vengono creati e visualizzati i risultati previsti

La funzionalità Previsione utilizza i risultati dei dati in una tabella dati di Esplora per calcolare i punti dati futuri. I calcoli della previsione includono solo i risultati visualizzati di una query di Explore; non vengono inclusi eventuali risultati che non sono visualizzati a causa dei limiti di righe. Per ulteriori informazioni sull'algoritmo utilizzato per calcolare le previsioni, consulta la sezione Algoritmo ARIMA in questa pagina.

I risultati previsti vengono visualizzati come continuazione delle visualizzazioni di Explore esistenti e sono soggetti alle impostazioni di visualizzazione configurate. I punti dati previsti si distinguono dai punti dati non previsti per i seguenti motivi:

  1. Nei grafici cartesiani supportati, i punti dati previsti vengono differenziati dai punti dati non previsti eseguendo il rendering in una zona più chiara o con linee tratteggiate.
  2. Nei tipi di grafici e tabelle supportati, i punti dati previsti sono in corsivo e aggiunti con un asterisco.

I dati previsti vengono identificati esplicitamente anche nella descrizione comando visualizzata quando passi il mouse sopra un punto dati previsto:

Solo alcuni tipi di visualizzazioni supportano i dati previsti, come illustrato nella sezione seguente.

Algoritmo ARIMA

La previsione utilizza un algoritmo ARRE (AutoRegressive Integrated Average Average) per creare un'equazione che corrisponda meglio ai dati inseriti in una previsione. Per trovare la corrispondenza migliore per i dati, Looker esegue ARIMA con un set di variabili iniziali, crea un elenco di varianti delle variabili iniziali ed esegue di nuovo ARIMA con queste varianti. Se una qualsiasi delle varianti crea un'equazione più adatta ai dati di input, Looker utilizza tali varianti come nuove variabili iniziali e crea ulteriori varianti che vengono quindi valutate. Looker continua a ripetere questo processo fino a quando non vengono identificate le migliori variabili o fino a quando tutte le opzioni o il tempo di calcolo allocato non sono esauriti.

Questo processo può essere considerato un algoritmo genetico, in cui le persone di centinaia di generazioni creano da 1 a 10 figli (variazioni di variabili in base al genitore), e la migliore prole sopravvive per creare potenzialmente "migliori". generazioni. Il modo in cui Looker utilizza molte chiamate ad ARIMA in un algoritmo genetico è chiamato AutoARIMA.

Per ulteriori dettagli su AutoARIMA, consulta la sezione Suggerimenti per l'utilizzo di auto_arima della guida dell'utente di pmdarima. Sebbene questa non sia la libreria utilizzata da Looker per eseguire AutoARIMA, pmdarima fornisce la migliore spiegazione del processo e le diverse variabili utilizzate.

Tipi di visualizzazione supportati

I seguenti tipi di visualizzazione cartesiana supportano il rendering dei dati previsti:

I seguenti tipi di grafici a tabella e testo supportano il rendering dei dati previsti:

Al momento altri tipi di visualizzazione, incluse le visualizzazioni personalizzate, non possono eseguire il rendering dei dati previsti.

Esplora i requisiti delle query per la previsione

Per creare una previsione, un'esplorazione deve soddisfare i seguenti requisiti:

  • Includi esattamente una dimensione, che deve essere una dimensione temporale, con la funzionalità Riempimento dimensione attivata.
  • Includi almeno una misura o una misura personalizzata (una previsione può includere fino a cinque misure o misure personalizzate).
  • Ordinare i risultati in base alla dimensione del periodo di tempo nell'ordine in decrescente.

Aspetti da considerare

Di seguito sono riportati i criteri aggiuntivi da considerare quando crei una nuova query di Explore per fare previsioni o aggiungere una previsione a una query di Explore esistente:

  • Pivot: le previsioni possono essere eseguite sulle esplorazioni con pivot, purché siano soddisfatti i requisiti precedenti.
  • Totali riga e subtotali: i totali riga e subtotali non includono i valori previsti; sconsigliamo di utilizzare subtotali o totali riga con previsione, poiché possono produrre numeri imprevisti.
  • Filtri che includono periodi di tempo incompleti: per proiezioni accurate, le previsioni devono essere utilizzate solo insieme a una logica di completamento del periodo di tempo nei filtri Esplora quando le esplorazioni includono dati per periodi di tempo incompleti. Ad esempio, se un utente prevede dati per un mese futuro mentre un'esplorazione viene filtrata in modo da visualizzare i dati degli ultimi tre mesi, l'esplorazione include i dati del mese incompleto incompleto. La previsione includerà i dati incompleti nel calcolo e mostrerà risultati più inaffidabili. Utilizza invece una logica di filtro come negli ultimi 3 mesi interi, anziché negli ultimi 3 mesi, quando un'esplorazione include periodi di tempo incompleti (ad esempio, quando l'esplorazione include dati mensili incompleti per il mese corrente) per garantire una previsione più precisa.
  • Calcoli della tabella: i calcoli della tabella basati su una o più misurazioni previste verranno inclusi automaticamente in una previsione.
  • Limiti di righe: scopri in che modo i limiti di riga vengono applicati all'intera tabella di dati, incluse le righe previste.

Per ulteriori suggerimenti e risorse per la risoluzione dei problemi, consulta la sezione Problemi comuni e cose da sapere in questa pagina.

In genere, un set di dati con più righe, insieme a una lunghezza della previsione più breve, comporterà una previsione più precisa.

Opzioni del menu di previsione

Per personalizzare i dati previsti, puoi utilizzare le opzioni del menu Previsione, che si trova nella scheda Visualizzazione della scheda Esplora. Il menu Previsione include le seguenti opzioni:

Seleziona campo

Il menu a discesa Seleziona campo mostra le misure o le misure personalizzate nella query Esplora che sono disponibili per la previsione. Puoi selezionare fino a cinque misure o misure personalizzate.

Lunghezza

L'opzione Lunghezza indica il numero di righe o il periodo di tempo per cui prevedere i valori dei dati. L'intervallo della durata della previsione viene completato automaticamente in base alla dimensione dell'intervallo di tempo nella query di esplorazione.

In genere, un set di dati con più righe, insieme a una lunghezza della previsione più breve, consente una previsione più precisa.

Intervallo di previsione

Impostazione dell'intervallo di previsione che mostra le opzioni di intervallo del 99%, 98%, 95%, 90% e 80%

L'opzione Intervallo di previsione consente agli analisti di esprimere incertezza nelle previsioni per migliorare l'accuratezza. Quando è abilitata, l'opzione Intervallo di previsione ti consente di selezionare i limiti dei valori dei dati previsti. Ad esempio, un intervallo di previsione del 95% indica una probabilità del 95% che i valori di misurazione previsti rientrino nei limiti superiore e inferiore della previsione.

Maggiore è l'intervallo di previsione selezionato, maggiore è il limite superiore e inferiore.

Stagionalità

L'opzione Stagionalità consente agli analisti di tenere conto dei cicli noti o di tendenze dei dati ripetitive in una previsione e si riferisce al numero di righe di dati nel ciclo. Ad esempio, se una tabella di dati Esplora ha una riga all'ora e i cicli di dati si verificano ogni giorno, la stagionalità è 24.

Con le impostazioni di previsione predefinite, Looker fa riferimento alla dimensione di data in un'esplorazione e analizza diversi possibili cicli di stagionalità per trovare la corrispondenza migliore per la previsione finale. Ad esempio, quando utilizzi i dati orari, Looker può provare cicli stagionali con cadenza giornaliera, settimanale e di quattro settimane. Looker considera anche la frequenza della dimensione: se una dimensione rappresenta un periodo di sei ore, Looker sa che ci saranno solo quattro righe al giorno e regolerà la stagionalità di conseguenza.

Per i casi d'uso comuni, l'opzione Automatica rileva la migliore stagionalità per un determinato set di dati. Se sei a conoscenza di cicli specifici nel set di dati, l'opzione Personalizzato ti consente di specificare il numero di righe che costituiscono un ciclo per le singole misure in una previsione.

Quando esegui la previsione dei valori dei dati per più misurazioni, puoi selezionare diverse opzioni stagionali, tra cui nessuna, per ogni singola misura. Il menu a discesa Stagionalità offre diverse opzioni:

La previsione applica l'opzione di stagionalità Automatica alle previsioni per impostazione predefinita, anche quando l'opzione Stagionalità non è abilitata.

Automatica

Con l'opzione di stagionalità Automatica, Looker seleziona l'opzione migliore per i tuoi dati provenienti da più periodi di stagionalità comuni, ad esempio giornaliera, oraria, mensile e così via.

Personalizzato

Quando conosci il numero specifico di righe che costituiscono ogni stagione o ciclo nel tuo set di dati, puoi specificare il numero nel campo Periodo. Può essere utile selezionare Personalizzato se sai che i tuoi dati si spostano in base a un numero specifico di righe.

Quando lavori con dati che variano in mesi, ma vengono espressi in modo più granulare (ad esempio utilizzando una data o settimana in un'esplorazione), in genere un periodo di 4 o 30 giorni si adatta a cicli mensili.

Nessuno

La stagionalità è un componente potente della previsione; tuttavia, a seconda dei dati di input, non è sempre consigliata. Se nei dati non ci sono cicli prevedibili, l'attivazione della stagionalità può occasionalmente causare previsioni imprecise quando l'algoritmo tenterà di trovare un pattern e quindi cercherà di adattare il falso pattern alla previsione. Questo può generare una previsione oscura.

Quando esegui la previsione dei valori dei dati per più misure e vuoi attivare la Stagionalità solo per una o più, puoi selezionare Nessuna per tutte le misure per cui non vuoi attivare Stagionalità.

Creare una previsione

Solo gli utenti con autorizzazione possono creare previsioni.

Per creare una previsione:

  1. Verifica che la funzionalità Esplora soddisfi i requisiti di previsione. Ad esempio, una query Esplora che mostra Mese di creazione utenti, Conteggio utenti e Conteggio ordini selezionati e ordinati per Mese di creazione utenti in ordine decrescente:

  2. Seleziona Previsione nella scheda Esplora Visualizzazione per aprire il menu Previsione.

  3. Seleziona il menu a discesa Seleziona campo per scegliere fino a cinque misure o misure personalizzate per la previsione.

  4. Inserisci la durata futura nel campo Lunghezza.

  5. Seleziona l'opzione Intervallo di previsione o l'opzione Stagionalità per abilitare ciascuna funzione e personalizzare le opzioni associate.

  6. Seleziona la x nella scheda Menu accanto a Previsione per salvare le impostazioni ed uscire dal menu.

  7. Seleziona Esegui per eseguire di nuovo la query Esplora. Devi ripetere l'esplorazione dopo aver apportato modifiche alla previsione.

Nei risultati e nella visualizzazione di Esplora verranno visualizzati i valori previsti per il periodo di tempo specificato. L'esplorazione di esempio ora mostra i dati previsti per il conteggio degli utenti e il conteggio degli ordini per 6 mesi dal 1° al 10 aprile 2020.

Poiché i calcoli previsti dipendono dall'ordine di ordinamento dei dati, l'ordinamento viene disattivato dopo l'esecuzione di una query prevista.

Modificare una previsione

Solo gli utenti con autorizzazione possono modificare le previsioni.

Per modificare una previsione:

  1. In via facoltativa, puoi modificare la query Esplora in base alle tue esigenze per aggiungere o rimuovere campi di misura o intervalli di tempo diversi. Verifica che la funzionalità Esplora soddisfi i requisiti di previsione.

  2. Seleziona Previsione nella scheda Esplora Visualizzazione per aprire il menu Previsione.

  3. Seleziona il menu a discesa Seleziona campo per apportare modifiche ai campi previsti. Per rimuovere i campi previsti:

    • Seleziona le caselle accanto ai campi previsti nel menu a discesa Seleziona campo espanso per rimuovere i campi dalla previsione.
    • In alternativa, seleziona la x accanto al nome del campo nel menu Seleziona campo compresso.

  4. Modifica la durata specificata in futuro per la previsione nel campo Lunghezza, come vuoi.

  5. Seleziona l'opzione Intervallo di previsione o l'opzione Stagionalità per abilitare ciascuna funzione e personalizzare le opzioni associate.

    • Se hai già attivato Intervallo di previsione o Stagionalità, verranno visualizzate le personalizzazioni. Modifica le impostazioni personalizzate come preferisci oppure seleziona l'opzione per rimuovere la funzione dalla previsione.
  6. Seleziona la x nella scheda Menu accanto a Previsione per salvare le impostazioni ed uscire dal menu.

  7. Seleziona Esegui per eseguire di nuovo la query Esplora. Devi ripetere l'esplorazione dopo aver apportato eventuali modifiche alla previsione.

I risultati e la visualizzazione Esplora ora mostreranno la previsione modificata. Poiché i calcoli previsti dipendono dall'ordine di ordinamento dei dati, l'ordinamento viene disattivato dopo l'esecuzione di una query prevista.

Rimuovere una previsione

Solo gli utenti con autorizzazione possono rimuovere le previsioni.

Per rimuovere una previsione da un'esplorazione, procedi nel seguente modo:

  1. Seleziona Previsione nella scheda Esplora Visualizzazione per aprire il menu Previsione.
  2. Seleziona Cancella.

La query viene eseguita di nuovo automaticamente per produrre i risultati senza applicare una previsione.

Problemi comuni e cose da sapere

Quanto è preciso?

La precisione di una previsione dipende dai dati di input. L'implementazione di AutoARIMA di Looker può fare previsioni incredibilmente accurate che combinano tante sfumature a partire dai dati di input. Ci sono anche casi in cui l'algoritmo si ritrova in pattern dispari nei dati di input e li mette in evidenza nella previsione. Assicurati di fornire abbastanza dati e che i dati siano il più accurati possibile per ottenere il massimo dalle previsioni.

Impossibile generare una previsione

Esistono motivi legittimi per cui non è possibile generare una previsione. Di solito hanno a che fare con con una quantità troppo bassa di dati di input o con una previsione troppo lunga. Non esiste un limite specifico per nessuno dei due fattori e non esiste un rapporto esatto di dati di input obbligatori per una determinata lunghezza di previsione. Più i dati di input sono dispersi e imprevedibili, più sarà difficile per l'algoritmo AutoARIMA trovare una corrispondenza. Il modo più efficace per generare una previsione è aumentare la quantità di dati di input privi di errori, assicurarsi che le impostazioni della stagionalità siano corrette e ridurre la durata della previsione solo a ciò che è necessario. Quando utilizzi l'opzione Intervallo di previsione, puoi scegliere un intervallo inferiore.

La cancellazione dei dati di input può comportare:

  • Taglio delle righe iniziali o finali per periodi di tempo che non contengono dati
  • Ridurre il rumore nel set di dati scegliendo una dimensione di data più grande
  • Modifica delle anomalie di filtro che non offrono alcun vantaggio alla previsione

Il risultato della query è stato restituito senza previsioni e ho ricevuto un errore oscuro

In caso contrario, prova a rimuovere la misura o le misure dalla configurazione della previsione e poi aggiungile di nuovo.

La previsione viene visualizzata ma è ovviamente errata o inutile

La cosa migliore da fare in questo caso è aggiungere più dati di input, eliminare il più possibile e impostare potenzialmente una stagionalità personalizzata (se sei a conoscenza di cicli specifici nei dati) o disattivare del tutto l'opzione Stagionalità selezionando Nessuno.

La cancellazione dei dati di input può comportare le seguenti attività:

  • Taglio delle righe iniziali o finali per periodi di tempo che non contengono dati
  • Ridurre il rumore nel set di dati scegliendo una dimensione di data più grande
  • Modifica delle anomalie di filtro che non offrono alcun vantaggio alla previsione