Previsione nelle visualizzazioni

Le previsioni consentono agli analisti di aggiungere rapidamente proiezioni dei dati alle query di esplorazione nuove o esistenti per aiutare gli utenti a prevedere e monitorare punti dati specifici. I risultati e le visualizzazioni previste dell'esplorazione possono essere aggiunti alle dashboard e salvati come Look. I risultati e le visualizzazioni previsti possono essere creati e visualizzati anche nei contenuti di Looker incorporati.

Puoi prevedere i dati se disponi dell'autorizzazione per creare previsioni.

Come vengono creati e visualizzati i risultati previsti

La funzionalità Previsione utilizza i risultati della tabella di dati di un'esplorazione per calcolare i punti dati futuri. I calcoli delle previsioni includono solo i risultati visualizzati di una query di esplorazione. I risultati non visualizzati a causa dei limiti di righe non sono inclusi. Per ulteriori informazioni sull'algoritmo utilizzato per calcolare le previsioni, consulta la sezione Algoritmo ARIMA in questa pagina.

I risultati previsti vengono mostrati come continuazione delle visualizzazioni di Esplora esistenti e sono soggetti alle impostazioni di visualizzazione configurate. I punti dati previsti si distinguono dai punti dati non previsti nei seguenti modi:

  1. Nei grafici cartesiani supportati, i punti dati previsti vengono distinti dai punti dati non previsti eseguendo il rendering in una tonalità più chiara o tramite linee tratteggiate.
  2. Nei tipi di grafici a tabella e con testo supportati, i punti dati previsti sono in corsivo e vengono aggiunti con un asterisco.

I dati di previsione vengono inoltre identificati esplicitamente nella descrizione comando visualizzata quando passi il cursore sopra un punto di dati previsti.

Come spiegato nella sezione seguente, solo alcuni tipi di visualizzazioni supportano i dati previsti.

Algoritmo ARIMA

La previsione sfrutta un algoritmo ARIMA (AutoRegressive Integrated Moving Average) per creare un'equazione che corrisponde meglio ai dati inseriti in una previsione. Per trovare la corrispondenza migliore per i dati, Looker esegue ARIMA con un insieme di variabili iniziali, crea un elenco di varianti delle variabili iniziali ed esegue di nuovo ARIMA con queste varianti. Se una qualsiasi delle varianti crea un'equazione che si adatta meglio ai dati di input, Looker utilizza queste varianti come nuove variabili iniziali e crea ulteriori varianti che vengono poi valutate. Looker continua a ripetere questa procedura fino a quando non vengono identificate le variabili migliori o fino a quando non sono state esaurite tutte le opzioni o il tempo di calcolo allocato.

Questo processo può essere considerato un algoritmo genetico, in cui gli individui nel corso di centinaia di generazioni creano da 1 a 10 discendenti ciascuno (variazioni di variabili basate sul genitore) e i discendenti migliori sopravvivono per creare potenzialmente generazioni "migliori". Il modo in cui Looker utilizza molte invocazioni di ARIMA in un approccio di algoritmo genetico si chiama AutoARIMA.

Per ulteriori dettagli su AutoARIMA, consulta la sezione Suggerimenti per l'utilizzo di auto_arima della Guida dell'utente di pmdarima. Sebbene questa non sia la libreria utilizzata da Looker per eseguire AutoARIMA, pmdarima fornisce la migliore spiegazione del processo e delle diverse variabili utilizzate.

Tipi di visualizzazione supportati

I seguenti tipi di visualizzazione cartesiana supportano il rendering dei dati previsti:

I seguenti tipi di grafici a testo e a tabella supportano il rendering dei dati previsti:

Al momento, altri tipi di visualizzazioni, tra cui le visualizzazioni personalizzate, non possono visualizzare i dati previsti.

Esplorare i requisiti delle query per la previsione

Per creare una previsione, un'esplorazione deve soddisfare i seguenti requisiti:

  • Includi esattamente una dimensione, che deve essere una dimensione del periodo di tempo, con il riempimento delle dimensioni attivato.
  • Includi almeno una misura o una misura personalizzata (una previsione può includere fino a cinque misure o misure personalizzate)
  • Ordina i risultati in base alla dimensione del periodo di tempo in ordine decrescente

Aspetti da considerare

Di seguito sono riportati ulteriori criteri da considerare quando crei una nuova query Esplora per prevedere o aggiungi una previsione a una query Esplora esistente:

  • Pivot: le previsioni possono essere eseguite sulle esplorazioni con pivot, a condizione che siano soddisfatti i requisiti precedenti.
  • Totali e subtotali di riga: i totali e i subtotali di riga non includono i valori previsti. Sconsigliamo di utilizzare i subtotali o i totali di riga con la previsione, in quanto ciò può produrre numeri imprevisti.
  • Filtri che includono periodi di tempo incompleti: per proiezioni accurate, la previsione deve essere utilizzata solo in combinazione con una logica di periodo di tempo completa nei filtri Esplora quando le esplorazioni includono dati relativi a periodi di tempo incompleti. Ad esempio, se un utente prevede dati per un mese nel futuro mentre un'esplorazione viene filtrata in modo da visualizzare i dati degli ultimi tre mesi, l'esplorazione includerà i dati del mese incompleto corrente. La previsione incorporerà i dati incompleti nel calcolo e mostrerà risultati meno affidabili. Utilizza invece una logica di filtro, come negli ultimi 3 mesi completi, anziché negli ultimi 3 mesi, quando un'esplorazione include periodi di tempo incompleti (ad esempio, quando un'esplorazione include dati mensili incompleti relativi al mese corrente) per garantire una previsione più accurata.
  • Calcoli tabulari: i calcoli tabulari basati su una o più misure previste verranno inclusi automaticamente in una previsione.
  • Limiti di riga: scopri come i limiti di riga si applicano all'intera tabella di dati, incluse le righe previste.

Per altri suggerimenti e risorse per la risoluzione dei problemi, consulta la sezione Problemi comuni e aspetti da conoscere in questa pagina.

In genere, un set di dati con più righe, insieme a una durata della previsione più breve, genera una previsione più accurata.

Opzioni del menu Previsione

Puoi utilizzare le opzioni del menu Previsione, nella scheda Visualizzazione dell'esplorazione, per personalizzare i dati previsti. Il menu Previsione include le seguenti opzioni:

Seleziona campo

Il menu a discesa Seleziona campo mostra le misure o le misure personalizzate nella query di esplorazione disponibili per la previsione. Puoi selezionare fino a cinque misure o misure personalizzate.

Lunghezza

L'opzione Lunghezza indica il numero di righe o la durata per cui prevedere i valori dei dati. L'intervallo di durata della previsione viene compilato automaticamente in base alla dimensione del periodo di tempo nella query Esplora.

In genere, un set di dati con più righe, insieme a una durata della previsione più breve, genera una previsione più accurata.

Intervallo di previsione

L'opzione Intervallo di previsione consente agli analisti di esprimere una certa incertezza nelle previsioni per favorire l'accuratezza. Se abilitata, l'opzione Intervallo di previsione consente di selezionare i limiti dei valori dei dati previsti. Ad esempio, un intervallo di previsione del 95% indica una probabilità del 95% che i valori della misura prevista rientrino tra i limiti superiore e inferiore della previsione.

Maggiore è l'intervallo di previsione selezionato, maggiori saranno i limiti superiore e inferiore.

Stagionalità

L'opzione Stagionalità consente agli analisti di tenere conto di cicli noti o tendenze dei dati ripetitive in una previsione e fa riferimento al numero di righe di dati nel ciclo. Ad esempio, se una tabella di dati Esplora ha una riga all'ora e i cicli di dati vengono eseguiti quotidianamente, la stagionalità è 24.

Con le impostazioni di previsione predefinite, Looker fa riferimento alla dimensione di data in un'esplorazione e analizza diversi possibili cicli di stagionalità per trovare la migliore corrispondenza per la previsione finale. Ad esempio, quando utilizzi i dati orari, Looker può provare cicli di stagionalità giornalieri, settimanali e di quattro settimane. Looker prende in considerazione anche la frequenza della dimensione: se una dimensione rappresenta un periodo di sei ore, Looker sa che ci saranno solo quattro righe in un giorno e adeguerà la stagionalità di conseguenza.

Per i casi d'uso comuni, l'opzione Automatica rileva la stagionalità migliore per un determinato set di dati. Se sei a conoscenza di cicli specifici nel set di dati, l'opzione Personalizzato ti consente di specificare il numero di righe che compongono un ciclo per le singole misure in una previsione.

Quando prevedi i valori dei dati per più misure, puoi selezionare diverse opzioni di stagionalità, inclusa nessuna, per ogni singola misura. Il menu a discesa Stagionalità contiene diverse opzioni:

Per impostazione predefinita, la previsione applica l'opzione di stagionalità Automatica alle previsioni, anche quando l'opzione Stagionalità non è attiva.

Automatico

Con l'opzione di stagionalità Automatica, Looker seleziona l'opzione migliore per i tuoi dati tra più periodi di stagionalità comuni, ad esempio giornalieri, orari, mensili e così via.

Personalizzato

Quando conosci il numero specifico di righe che compongono ogni stagione o ciclo nel tuo set di dati, puoi specificarlo nel campo Periodo. Potrebbe essere utile selezionare Personalizzato se sai che i dati si alternano in un numero specifico di righe.

Quando utilizzi dati che si basano su cicli mensili, ma sono espressi con una granularità maggiore (ad esempio, utilizzando una granularità data o settimana in un'esplorazione), in genere un periodo di 4 settimane o 30 giorni è adatto ai cicli mensili.

Nessuno

La stagionalità è un componente potente delle previsioni; tuttavia, a seconda dei dati di input, non è sempre consigliato. Se non sono presenti cicli prevedibili nei dati, l'attivazione della stagionalità può a volte generare previsioni imprecise quando l'algoritmo tenterà di trovare un pattern e quindi tenterà di adattarlo alla previsione. Ciò può comportare una previsione incomprensibile.

Quando prevedi i valori dei dati per più misure e vuoi attivare la Stagionalità solo per una o alcune misure, puoi selezionare Nessuna per tutte le misure per le quali non vuoi attivare la Stagionalità.

Creazione di una previsione

Solo gli utenti con autorizzazione possono creare previsioni.

Per creare una previsione:

  1. Assicurati che la tua esplorazione soddisfi i requisiti di previsione. Ad esempio, un utente vuole creare una previsione per una query Esplora con Mese di creazione degli utenti, Conteggio utenti e Conteggio ordini, ordinata in base al Mese di creazione degli utenti in ordine decrescente. I risultati mostrano i dati fino a dicembre 2019.

  2. Fai clic su Previsione nella scheda Visualizzazione di esplorazione per aprire il menu Previsione.

  3. Fai clic sul menu a discesa Seleziona campo per scegliere fino a cinque misure o misure personalizzate da prevedere. L'utente nell'esempio seleziona Conteggio utenti e Conteggio ordini.

  4. Inserisci la durata futura per cui vuoi eseguire la previsione nel campo Durata. L'utente nell'esempio inserisce 6 mesi.

  5. Facoltativamente, fai clic sull'opzione Intervallo di previsione o Stagionalità per abilitare una delle due funzioni e personalizzare le opzioni associate. L'utente nell'esempio non abilita nessuna delle due opzioni.

  6. Fai clic sulla x nella scheda del menu accanto a Previsione per salvare le impostazioni ed uscire dal menu.

  7. Fai clic su Esegui per eseguire nuovamente la query Esplora. Devi eseguire nuovamente l'esplorazione dopo aver apportato eventuali modifiche alla previsione.

I risultati e la visualizzazione di Esplorazione ora mostreranno i valori previsti per il periodo di tempo specificato. Con le opzioni specificate, l'esplorazione di esempio mostra i dati previsti per Conteggio utenti e Conteggio ordini per sei mesi dal periodo 2020-01 al 2020-06.

Poiché i calcoli previsti dipendono dall'ordine in cui vengono ordinati i dati, l'ordinamento è disattivato una volta eseguita una query prevista.

Modifica di una previsione

Solo gli utenti con autorizzazione possono modificare le previsioni.

Per modificare una previsione:

  1. Facoltativamente, modifica la query Esplora in base alle tue esigenze per aggiungere o rimuovere misure o campi del periodo di tempo diversi. Assicurati che l'esplorazione soddisfi i requisiti di previsione.
  2. Fai clic su Previsione nella scheda Visualizzazione di Esplora per aprire il menu Previsione.
  3. Fai clic sul menu a discesa Seleziona campo per apportare modifiche ai campi di previsione. Per rimuovere i campi previsti:
    • Fai clic sulle caselle accanto ai campi previsti nel menu a discesa Seleziona campo espanso per rimuovere i campi dalla previsione.
    • In alternativa, fai clic sulla x accanto al nome del campo nel menu Seleziona campo compresso.
  4. Modifica la durata futura specificata per la previsione nel campo Durata, come preferisci.
  5. Se vuoi, fai clic sull'opzione Intervallo di previsione o sull'opzione Stagionalità per attivare una delle due funzioni e personalizzare le opzioni associate.
    • Se Intervallo di previsione o Stagionalità erano già attivati, verranno visualizzate le personalizzazioni. Modifica le impostazioni personalizzate come preferisci o seleziona l'opzione per rimuovere la funzione dalla previsione.
  6. Fai clic sulla x nella scheda del menu accanto a Previsione per salvare le impostazioni e uscire dal menu.
  7. Fai clic su Esegui per eseguire di nuovo la query di esplorazione. Devi eseguire nuovamente l'esplorazione dopo aver apportato modifiche alla previsione.

I risultati e la visualizzazione di Esplora ora mostreranno la previsione modificata. Poiché i calcoli previsti dipendono dall'ordine in cui vengono ordinati i dati, l'ordinamento è disattivato una volta eseguita una query prevista.

Rimuovere una previsione

Solo gli utenti con autorizzazione possono rimuovere le previsioni.

Per rimuovere una previsione da un'esplorazione:

  1. Fai clic su Previsione nella scheda Visualizzazione di Esplora per aprire il menu Previsione.
  2. Fai clic su Cancella nella parte superiore del menu Previsione.

La query verrà eseguita di nuovo automaticamente per produrre i risultati senza applicare una previsione.

Problemi comuni e aspetti da conoscere

Quanto è precisa?

L'accuratezza di una previsione dipende dai dati di input. L'implementazione di AutoARIMA di Looker può fare previsioni incredibilmente accurate che combinano con successo molte sfumature dei dati di input. Esistono anche casi in cui l'algoritmo si imbatta in pattern insoliti nei dati di input e li metta in evidenza nella previsione. Assicurati che siano stati forniti dati sufficienti e che siano il più precisi possibile per ottenere il massimo dalle previsioni.

Impossibile generare una previsione

Esistono motivi legittimi per cui non è possibile generare una previsione. Di solito sono dovuti alla quantità troppo ridotta di dati di input o alla durata richiesta della previsione troppo lunga. Non è previsto alcun limite specifico per nessuno dei due fattori e non esiste una proporzione esatta dei dati di input richiesti per una determinata durata della previsione. Più sono sparsi e imprevedibili i dati di input, più sarà difficile per l'algoritmo AutoARIMA trovare una corrispondenza. Il modo più efficace per generare una previsione è aumentare la quantità di dati di input puliti, assicurarsi che le impostazioni della stagionalità siano corrette e ridurre la durata della previsione solo al necessario. Quando utilizzi l'opzione Intervallo di previsione, può essere utile scegliere un intervallo inferiore.

La pulizia dei dati di input può comportare:

  • Taglio delle righe iniziali o finali per periodi di tempo che non contengono dati
  • Riduzione del rumore nel set di dati scegliendo una dimensione data più grande
  • Modificare i valori anomali del filtro che non apportano benefici alla previsione

Il risultato della query è stato restituito senza previsioni e ho ricevuto un errore oscuro

Questo non dovrebbe accadere. In caso contrario, prova a rimuovere la misura o le misure dalla configurazione della previsione e poi ad aggiungerle di nuovo.

La previsione viene visualizzata, ma è chiaramente sbagliata o non utile

In questo caso, la cosa migliore da fare è aggiungere altri dati di input, pulirli il più possibile e, eventualmente, impostare una stagionalità personalizzata (se conosci cicli specifici nei dati) o disattivare del tutto l'opzione Stagionalità selezionando Nessuna.

La pulizia dei dati di input può comportare le seguenti attività:

  • Taglio delle righe iniziali o finali relative a periodi di tempo che non contengono dati
  • Riduzione del rumore nel set di dati scegliendo una dimensione data più grande
  • Modificare i valori anomali dei filtri che non sono utili per la previsione