Previsione nelle visualizzazioni

La previsione consente agli analisti di aggiungere rapidamente proiezioni di dati a query di esplorazione nuove o esistenti per aiutare gli utenti a prevedere e monitorare punti dati specifici. I risultati e le visualizzazioni di Esplora previsti possono essere aggiunti alle dashboard e salvati come Looks. È inoltre possibile creare e visualizzare previsioni e visualizzazioni sui contenuti di Looker incorporati.

Puoi prevedere i dati se hai l'autorizzazione per creare previsioni.

Come vengono creati e visualizzati i risultati previsti

La funzionalità Previsione utilizza i risultati dei dati in una tabella di dati di Esplora per calcolare i punti dati futuri. I calcoli di previsione includono solo i risultati visualizzati di una query Esplora; non vengono inclusi i risultati che non sono visualizzati a causa dei limiti di righe. Per ulteriori informazioni sull'algoritmo utilizzato per calcolare le previsioni, consulta la sezione Algoritmo ARIMA in questa pagina.

I risultati previsti vengono visualizzati come continuazione delle visualizzazioni Esplora esistenti e sono soggetti alle impostazioni di visualizzazione configurate. I punti dati previsti si distinguono dai punti dati non previsti nei seguenti modi:

  1. Nei grafici cartesiani supportati, i punti dati previsti si distinguono dai punti dati non previsti in una tonalità più chiara o attraverso linee tratteggiate.
  2. Nei tipi di grafico e testo supportati, i punti dati previsti vengono visualizzati in corsivo e aggiunti con un asterisco.

I dati previsti vengono anche identificati esplicitamente nella descrizione comando che viene visualizzata quando passi il mouse sopra un punto dati previsto:

Solo alcuni tipi di visualizzazioni supportano i dati previsti, come discusso nella sezione seguente.

Algoritmo ARIMA

La previsione sfrutta un algoritmo ARMA (AutoRegressive Integrated Moving Average) per creare un'equazione che corrisponda meglio ai dati inseriti in una previsione. Per trovare la corrispondenza migliore per i dati, Looker esegue ARIMA con un set di variabili iniziali, crea un elenco di varianti delle variabili iniziali ed esegue di nuovo ARIMA con queste varianti. Se una delle varianti crea un'equazione più adatta ai dati di input, Looker utilizza queste varianti come nuove variabili iniziali e crea ulteriori varianti che vengono poi valutate. Looker continua a ripetere questo processo fino a quando non vengono identificate le migliori variabili o fino a esaurimento di tutte le opzioni o del tempo di calcolo allocato.

Questo processo può essere considerato come un algoritmo genetico, in cui le persone di centinaia di generazioni creano da 1 a 10 figli ciascuno (variazioni di variabili in base all'organizzazione principale), mentre la migliore progenie sopravvive per creare potenzialmente generazioni "migliori". Il modo in cui Looker utilizza molte chiamate all'ARIMA in un algoritmo genetico è chiamato AutoARIMA.

Per ulteriori dettagli su AutoARIMA, consulta la sezione Suggerimenti per l'utilizzo di auto_arima della Guida dell'utente di pmdarima. Anche se non si tratta della libreria che Looker utilizza per eseguire AutoARIMA, pmdarima fornisce la migliore spiegazione del processo e delle diverse variabili utilizzate.

Tipi di visualizzazione supportati

I seguenti tipi di visualizzazione cartesiani supportano il rendering dei dati previsti:

I seguenti tipi di grafici a tabella e di testo supportano il rendering dei dati previsti:

Altri tipi di visualizzazione, incluse le visualizzazioni personalizzate, al momento non possono eseguire il rendering dei dati previsti.

Esplora i requisiti per le query per la previsione

Per creare una previsione, un'esplorazione deve soddisfare i seguenti requisiti:

  • Includi esattamente una dimensione, che deve essere una dimensione per il periodo di tempo, con il riempimento dimensione attivato
  • Includi almeno una misura o una misura personalizzata (una previsione può includere fino a cinque misurazioni o misurazioni personalizzate)
  • Ordina i risultati per dimensione del periodo di tempo in ordine decrescente.

Aspetti da considerare

Di seguito sono riportati i criteri aggiuntivi da considerare quando crei una nuova query Esplora per prevedere o aggiungere una previsione a una query Esplora esistente:

  • Pivot: le previsioni possono essere eseguite su esplorazioni con pivot, purché siano soddisfatti i requisiti precedenti.
  • Totali di riga e subtotali: i totali di riga e i totali parziali di riga non includono i valori previsti; sconsigliamo di utilizzare subtotali o totali di riga con la previsione, in quanto ciò può produrre numeri imprevisti.
  • Filtri che includono periodi di tempo incompleti: per le previsioni precise, le previsioni devono essere utilizzate solo in combinazione con una logica di periodo di tempo completo in Filtri di esplorazione quando le esplorazioni includono dati relativi a periodi di tempo incompleti. Ad esempio, se un utente prevede dati relativi a un mese nel futuro mentre un'esplorazione viene filtrata per visualizzare i dati degli ultimi tre mesi, l'esplorazione include i dati del mese incompleto incompleto. La previsione includerà i dati incompleti nel calcolo e mostrerà risultati più inaffidabili. Utilizza invece una logica di filtro, come negli ultimi 3 mesi completi anziché negli ultimi 3 mesi, quando un'Esplora include periodi di tempo incompleti (ad esempio, quando un'esplorazione include dati mensili incompleti per il mese in corso) per garantire una previsione più accurata.
  • Calcoli della tabella: i calcoli delle tabelle basati su una o più misure previste verranno inclusi automaticamente in una previsione.
  • Limiti di righe: scopri in che modo i limiti di righe si applicano all'intera tabella di dati, incluse le righe previste.

Per ulteriori suggerimenti e risorse per la risoluzione dei problemi, consulta la sezione Problemi comuni e cose da sapere in questa pagina.

In genere, un set di dati con più righe, insieme a una lunghezza prevista inferiore, comporterà una previsione più accurata.

Opzioni del menu di previsione

Puoi utilizzare le opzioni del menu Previsione, disponibile nella scheda Esplora Visualizzazione, per personalizzare i dati previsti. Il menu Previsione include le seguenti opzioni:

Seleziona campo

Il menu a discesa Seleziona campo mostra le misure o le misure personalizzate nella query Esplora che sono disponibili per la previsione. Puoi selezionare fino a cinque misure o misure personalizzate.

Lunghezza

L'opzione Lunghezza indica il numero di righe o il periodo di tempo per cui prevedere i valori dei dati. L'intervallo di durata della previsione viene completato automaticamente in base alla dimensione del periodo di tempo nella query di esplorazione.

In genere, un set di dati con più righe, insieme a una lunghezza della previsione più breve, consente una previsione più accurata.

Intervallo di previsione

Impostazione dell'intervallo di previsione che mostra le opzioni dell'intervallo 99%, 98%, 95%, 90% e 80%

L'opzione Intervallo di previsione consente agli analisti di esprimere una certa incertezza sulle previsioni per favorire l'accuratezza. Quando è attivata, l'opzione Intervallo di previsione ti consente di selezionare i limiti dei valori dei dati previsti. Ad esempio, un intervallo di previsione del 95% indica una probabilità del 95% che i valori di misurazione previsti rientri tra i limiti superiore e inferiore della previsione.

Maggiore è l'intervallo di previsione selezionato, maggiore è il limite superiore e inferiore.

Stagionalità

L'opzione Stagionalità consente agli analisti di tenere conto dei cicli noti o di tendenze dei dati ripetitive in una previsione e si riferisce al numero di righe di dati nel ciclo. Ad esempio, se una tabella di dati di Esplora ha una riga all'ora e i cicli di dati vengono eseguiti ogni giorno, la stagionalità è pari a 24.

Con le impostazioni di previsione predefinite, Looker fa riferimento alla dimensione data in un'esplorazione e analizza diversi possibili cicli di stagionalità per trovare la corrispondenza migliore per la previsione finale. Ad esempio, quando utilizzi i dati orari, Looker può provare cicli di stagionalità giornalieri, settimanali e di quattro settimane. Looker prende anche in considerazione la frequenza della dimensione: se una dimensione rappresenta un periodo di sei ore, Looker sa che ci saranno solo quattro righe al giorno e regolerà la stagionalità di conseguenza.

Nei casi d'uso comuni, l'opzione Automatico rileva la migliore stagionalità per un determinato set di dati. Se sei a conoscenza di cicli specifici nel set di dati, l'opzione Personalizzato ti consente di specificare il numero di righe che compongono un ciclo per singole misurazioni in una previsione.

Quando fai previsioni sui valori dei dati per più misurazioni, puoi selezionare diverse opzioni relative alla stagionalità, tra cui nessuna, per ogni singola misura. Il menu a discesa Stagionalità offre diverse opzioni:

La previsione applica l'opzione di stagionalità Automatica alle previsioni per impostazione predefinita, anche quando l'opzione Stagionalità non è abilitata.

Automatico

Con l'opzione di stagionalità Automatica, Looker seleziona l'opzione migliore per i tuoi dati in base a più periodi di stagionalità comuni, ad esempio giornaliera, oraria, mensile e così via.

Personalizzato

Se conosci il numero specifico di righe che compongono ogni stagione o ciclo nel set di dati, puoi specificare il numero nel campo Periodo. Potrebbe essere utile selezionare Personalizzato se sai che i tuoi dati ciclizzano in un numero specifico di righe.

Quando lavori con dati che hanno un ciclo in mesi, ma è espresso in modo più granulare (ad esempio se utilizzi una granularità per data o settimana in un'esplorazione), in genere un ciclo di 4 o 30 giorni è adatto a cicli mensili.

Nessuno

La stagionalità è un potente componente della previsione; tuttavia, a seconda dei dati di input, non è sempre consigliata. Se non ci sono cicli prevedibili nei dati, l'attivazione della stagionalità può occasionalmente portare a previsioni imprecise quando l'algoritmo tenterà di trovare un pattern e quindi tenterà di adattare il falso modello alla previsione. Questo può comportare una previsione poco chiara.

Quando prevedi valori di dati per più misure e vuoi attivare la stagionalità soltanto per una o alcune, puoi selezionare Nessuna per tutte le misure per cui non vuoi attivare la stagionalità.

Creazione di una previsione

Solo gli utenti con autorizzazione possono creare previsioni.

Per creare una previsione:

  1. Verifica che la funzionalità Esplora soddisfi i requisiti di previsione. Ad esempio, una query Explore con Mese di creazione utenti, Conteggio utenti e Conteggio ordini selezionata e ordinata per Mese di creazione utenti in ordine decrescente:

  2. Seleziona Previsione nella scheda Esplora Visualizzazione per aprire il menu Previsione.

  3. Seleziona il menu a discesa Seleziona campo per scegliere fino a cinque misure o misure personalizzate da prevedere.

  4. Nel campo Lunghezza, inserisci la lunghezza futura che vuoi prevedere.

  5. Seleziona l'opzione Intervallo di previsione o Stagionalità per abilitare ciascuna funzione e personalizzare le opzioni associate.

  6. Seleziona la x nella scheda del menu accanto a Previsione per salvare le impostazioni e uscire dal menu.

  7. Seleziona Esegui per eseguire nuovamente la query Explore (Esplora). Devi eseguire di nuovo Esplora dopo aver apportato eventuali modifiche alla previsione.

Nei risultati e nella visualizzazione di Esplora ora vengono visualizzati i valori previsti per il periodo di tempo specificato. L'esempio Esplora ora mostra i dati previsti per Numero di utenti e Numero di ordini per sei mesi dal 1° al 6 aprile 2020:

Poiché i calcoli previsti dipendono dall'ordine in cui i dati vengono ordinati, l'ordinamento viene disattivato dopo l'esecuzione di una query prevista.

Modificare una previsione

Solo gli utenti con autorizzazione possono modificare le previsioni.

Per modificare una previsione:

  1. Facoltativamente, modifica la query Explore (Esplora) in base alle necessità per aggiungere o rimuovere diversi campi o intervalli di tempo. Verifica che la funzionalità Esplora soddisfi i requisiti di previsione.

  2. Seleziona Previsione nella scheda Esplora Visualizzazione per aprire il menu Previsione.

  3. Seleziona il menu a discesa Seleziona campo per apportare modifiche ai campi previsti. Per rimuovere i campi previsti:

    • Seleziona le caselle accanto ai campi previsti nel menu a discesa Seleziona campo espanso per rimuovere i campi dalla previsione.
    • In alternativa, seleziona la x accanto al nome del campo nel menu Seleziona campo compresso.

  4. Modifica la lunghezza specificata per le previsioni future nel campo Lunghezza, come preferisci.

  5. Seleziona l'opzione Intervallo di previsione o Stagionalità per abilitare ciascuna funzione e personalizzare le opzioni associate.

    • Se l'opzione Intervallo di previsione o Stagionalità è già stata attivata, vengono visualizzate le personalizzazioni. Modifica le impostazioni personalizzate come preferisci oppure seleziona l'opzione per rimuovere la funzione dalla previsione.
  6. Seleziona la x nella scheda del menu accanto a Previsione per salvare le impostazioni e uscire dal menu.

  7. Seleziona Esegui per eseguire nuovamente la query Explore (Esplora). Devi eseguire di nuovo Esplora dopo aver apportato modifiche alla previsione.

Nei risultati e nella visualizzazione di Esplora ora verrà mostrata la previsione modificata. Poiché i calcoli previsti dipendono dall'ordine in cui i dati vengono ordinati, l'ordinamento viene disattivato dopo l'esecuzione di una query prevista.

Rimuovere una previsione

Solo gli utenti con autorizzazione possono rimuovere le previsioni.

Per rimuovere una previsione da un'esplorazione:

  1. Seleziona Previsione nella scheda Esplora Visualizzazione per aprire il menu Previsione.
  2. Seleziona Cancella.

La query verrà eseguita nuovamente per produrre i risultati senza alcuna previsione applicata.

Problemi comuni e cose da sapere

Quanto è preciso?

La precisione di una previsione dipende dai dati di input. L'implementazione di AutoARIMA di Looker può fare previsioni incredibilmente accurate che combinano molte sfumature dai dati di input. Ci sono anche casi in cui l'algoritmo viene coinvolto in pattern dispari nei dati di input e li enfatizza nella previsione. Assicurati di fornire dati sufficienti e che i dati siano il più accurati possibile per ottenere il massimo dalle previsioni.

Impossibile generare una previsione

Esistono motivi legittimi per cui una previsione non può essere generata. In genere, questi dati hanno a che fare con la quantità insufficiente di dati di input o con la durata della previsione richiesta. Non esiste un limite specifico per nessuno dei due fattori e non esiste un rapporto esatto dei dati di input obbligatori per un determinato periodo di previsione. Più sono dispersi e imprevedibili i dati di input, più sarà difficile per l'algoritmo AutoARIMA trovare una corrispondenza. Il modo più efficace per generare una previsione è aumentare la quantità di dati di input privi dati, assicurarsi che le impostazioni della stagionalità siano corrette e ridurre la lunghezza della previsione solo a ciò che è necessario. Quando utilizzi l'opzione Intervallo di previsione, può essere utile scegliere un intervallo inferiore.

La pulizia dei dati di input può comportare:

  • Ritaglio di righe iniziali o finali per periodi di tempo che non contengono dati
  • Riduzione del rumore nel set di dati scegliendo una dimensione data più grande
  • Modificare le anomalie nei filtri che non sono utili per la previsione

Il risultato della query è stato restituito senza previsioni e ho ricevuto un errore sconosciuto

Non dovrebbe verificarsi questa situazione. In questo caso, prova a rimuovere la misura o le misurazioni dalla configurazione di previsione e poi aggiungerle nuovamente.

La previsione viene visualizzata, ma è ovviamente errata o inutile

La cosa migliore da fare in questo caso è aggiungere più dati di input, ripulirli il più possibile e, potenzialmente, impostare una stagionalità personalizzata (se sei a conoscenza di cicli specifici nei dati) oppure disattivare completamente l'opzione Stagionalità selezionando Nessuno.

La pulizia dei dati di input può comportare le seguenti attività:

  • Ritaglio di righe iniziali o finali per periodi di tempo che non contengono dati
  • Riduzione del rumore nel set di dati scegliendo una dimensione data più grande
  • Modificare le anomalie nei filtri che non sono utili per la previsione