La previsione delle serie temporali è un tipo di approccio statistico o di machine learning che tenta di modellare i dati storici di una serie temporale al fine di eseguire previsioni su punti temporali futuri.
Rispetto ad altri tipi di modelli, la previsione delle serie temporali presenta sfide uniche come stagionalità, effetti delle festività, sparsità dei dati e tendenze che cambiano. Molte tecniche di machine learning non funzionano bene a causa della natura sequenziale e della correlazione delle serie temporali. Ad esempio, la convalida incrociata k-fold può causare la fuga di dati, con la conseguente necessità di riaddestrare i modelli per generare nuove previsioni. Il giusto equilibrio tra overfitting e underfitting è difficile da ottenere senza la possibilità di randomizzare la dimensione temporale. Data la potenziale esistenza di milioni di elementi da prevedere, occorre considerare anche la scalabilità di qualsiasi soluzione di previsione. Oltre alla previsione, potrebbero esistere attività importanti per un'azienda come il rilevamento di anomalie, la quantificazione dell'incertezza e l'inferenza causale. La previsione delle serie temporali non riguarda solo il supervised learning sui dati con timestamp. Fortunatamente, Google Cloud offre un'ampia gamma di soluzioni per ogni esigenza aziendale.
Ad esempio, un grande punto vendita al dettaglio potrebbe avere milioni di articoli su cui effettuare previsioni, in modo che l'inventario sia disponibile quando la domanda è elevata e non sia troppo pieno quando la domanda è bassa.
Previsione della domanda nella vendita al dettaglio per i prodotti
Crea una soluzione end-to-end per la previsione della domanda dei prodotti al dettaglio. Utilizza i dati storici di vendita per addestrare un modello di previsione della domanda utilizzando BigQuery ML, poi visualizza i valori previsti in una dashboard di Looker Studio da condividere con i tuoi stakeholder. Scopri in che modo la previsione della domanda può ridurre gli sprechi alimentari.
Previsione dei prezzi delle merci
I modelli basati su serie temporali vengono utilizzati per prevedere i prezzi delle merci e dei prodotti fondamentali per i processi aziendali e di produzione. Inoltre, vengono utilizzati per definire i modelli dei flussi di cassa e i piani finanziari.
Previsione dei flussi di cassa
I modelli basati su serie temporali vengono generalmente combinati con modelli di regressione e classificazione per generare previsioni dei flussi di cassa estremamente accurate in base a serie temporali di dati storici di contabilità, oltre a input da dati transazionali e responsabilità contrattuali. In questo caso, puoi utilizzare ARIMA_PLUS con BigQuery ML e combinarlo con modelli supervisionati in BigQuery ML, come GLM, modelli boosted tree e AutoML.
Rilevamento di anomalie con la previsione della domanda
Durante le festività, i periodi in cui si fanno regali o le vendite di fine anno, a volte si verificano dei picchi di traffico prevedibili. Ma cosa succede in caso di picchi (o cali) imprevisti? Ad esempio, come fai a individuare una domanda insolitamente elevata (o insolitamente bassa) che non ti aspettavi? Scopri come utilizzare il rilevamento di anomalie con BigQuery ML per trovare un picco imprevisto nel noleggio di biciclette in concomitanza con il giorno in cui si sono verificati problemi con i trasporti pubblici a Londra.
Controllo della qualità e monitoraggio delle metriche nella produzione
Il monitoraggio delle metriche può riguardare vari aspetti, dai sensori IoT alla resa della produzione. Tuttavia, l'elemento comune è prevedere l'intervallo tipico di queste metriche in modo da pianificare in anticipo e rispondere il più rapidamente possibile con i sistemi di monitoraggio già disponibili.
Altri casi d'uso comuni per il rilevamento di anomalie includono problemi con l'assegnazione dei prezzi dovuti a una valutazione errata, individuazione di anomalie in tempo reale e controllo della qualità della produzione.
Efficacia degli annunci
Quanto sono stati efficaci i tuoi annunci nel generare un incremento dell'attività? L'inferenza causale può aiutarti a osservare la significatività statistica delle campagne pubblicitarie.
Impatto di eventi importanti nelle serie temporali
È utile sapere se l'impatto di eventi importanti, ad esempio la Brexit, ha una significatività statistica su una serie temporale. Scopri di più su come usare l'inferenza causale per rispondere alla domanda "In che modo il voto sulla Brexit ha influito sui tassi di cambio tra sterlina britannica e dollaro statunitense?".
L'analisi basata sull'inferenza causale può essere applicata anche a promozioni, efficacia degli incentivi e stime dell'elasticità dei prezzi.
BigQuery ML consente agli utenti di creare ed eseguire modelli di machine learning in BigQuery utilizzando query SQL standard. Supporta un tipo di modello denominato ARIMA_PLUS per l'esecuzione di attività di previsione e rilevamento di anomalie basate sulle serie temporali.
Grazie alla definizione dei modelli ARIMA_PLUS in BigQuery ML, puoi effettuare previsioni su milioni di serie temporali all'interno di una singola query SQL, senza uscire dal data warehouse.
ARIMA_PLUS è essenzialmente una pipeline di generazione di modelli basati su serie temporali che include le seguenti funzionalità:
È possibile prevedere contemporaneamente decine di milioni di serie temporali con una singola query. Varie pipeline di definizione dei modelli vengono eseguite in parallelo, qualora siano disponibili slot BigQuery sufficienti.
Segui questi tutorial per iniziare a utilizzare ARIMA_PLUS di BigQuery:
Per informazioni dettagliate, consulta la documentazione pubblica di BigQuery ML.
Vertex Forecast offre agli utenti varie opzioni per addestrare il modello di previsione basato sulle serie temporali:
Per informazioni dettagliate, consulta la documentazione pubblica di Vertex Forecast.
Puoi iniziare con il tutorial di Vertex Forecast.
Se vuoi utilizzare un codice personalizzato, ma vuoi sfruttare l'infrastruttura di addestramento/gestione su Google Cloud, puoi usare Vertex AI Workbench per eseguire qualsiasi codice in Python, R, TensorFlow o PyTorch.
TimesFM (Time Series Foundation Model) è un modello di base di serie temporali preaddestrato, sviluppato da Google Research per la previsione univariata di serie temporali.
La release 1.0 contiene un checkpoint di 200 milioni di parametri e il codice di inferenza. È un modello basato su Transformer ed è stato addestrato esclusivamente come decoder su un set di dati preaddestrato contenente oltre 100 miliardi di punti di tempo reali. Esegue previsioni di serie temporali univariate per finestre contestuali fino a 512 punti di tempo e qualsiasi durata dell'orizzonte, con un input facoltativo dell'indicatore di frequenza.
Caso d'uso: previsione di serie temporali. Il modello utilizza come contesto di input una serie temporale univariata, insieme a un parametro di frequenza facoltativo. Il modello prevede le serie temporali in un orizzonte futuro di qualsiasi durata.
La previsione univariata consente di prevedere dati futuri utilizzando solo quelli storici della serie temporale. Ad esempio, per conoscere la temperatura di domani a New York, la previsione univariata prevede l'utilizzo di una singola variabile, ovvero le temperature storiche, per prevedere quelle future. Con la previsione univariata è possibile anche scoprire pattern e tendenze stagionali.
Con la previsione multivariata è possibile prevedere dati futuri utilizzando più fattori. Ad esempio, per prevedere la temperatura di domani a New York, oltre alle temperature storiche puoi utilizzare la pressione barometrica, l'indice UV e la percentuale di copertura nuvolosa nelle aree geografiche nelle vicinanze, la velocità del vento e altre variabili.
Scopri come BigQuery ML può aiutare la tua organizzazione. Visualizza la documentazione.
Inizia a creare su Google Cloud con 300 $ di crediti gratuiti e oltre 20 prodotti Always Free.