La prévision de séries temporelles est un type d'approche statistique ou de machine learning qui tente de modéliser les données de séries temporelles historiques afin d'effectuer des prédictions sur des points temporels futurs.
Par rapport à d'autres types de modèles, la prévision de séries temporelles s'accompagne de défis uniques, tels que la saisonnalité, les effets des jours fériés, la parcimonie des données et l'évolution des tendances. De nombreuses techniques de machine learning ne fonctionnent pas bien dans ces cas, en raison de la nature séquentielle et de la corrélation temporelle entre les séries temporelles. Par exemple, la validation croisée k-fold peut entraîner une fuite de données. Les modèles doivent être réentraînés pour générer de nouvelles prévisions. L'équilibre entre sur-apprentissage et sous-apprentissage est un acte délicat sans la possibilité de randomiser la dimension temporelle. Avec potentiellement des millions d'éléments à prévoir, l'évolutivité de toute solution de prévision doit également être prise en compte. En plus des prévisions, d'autres tâches peuvent être importantes pour l'entreprise, comme la détection d'anomalies, la quantification de l'incertitude et l'inférence causale. La prévision de séries temporelles ne se limite pas à l'apprentissage supervisé sur des données avec des codes temporels. Heureusement, Google Cloud offre une large gamme de solutions pour tous les besoins des entreprises.
Un grand magasin de vente, par exemple, peut avoir des millions d'articles en prévision afin d'avoir un stock suffisant lorsque la demande est élevée et ne pas surstocker lorsque la demande est faible.
Prévision de la demande de produits de détail
Créez une solution de bout en bout pour prévoir la demande de produits de détail. Utilisez les données de vente historiques pour entraîner un modèle de prévision de la demande à l'aide de BigQuery ML, puis visualisez les valeurs prévues dans un tableau de bord Looker Studio à partager avec les personnes concernées. Découvrez comment la prévision de la demande peut réduire le gaspillage alimentaire.
Prévision de prix des produits de base
Les modèles de séries temporelles sont utilisés pour prévoir les prix des produits de base essentiels à votre activité et à vos processus de production, et pour informer vos modèles de flux de trésorerie et vos plans financiers.
Prévision de flux de trésorerie
Les modèles de séries temporelles sont généralement combinés avec des modèles de régression et de classification pour produire des prévisions de flux de trésorerie très précises basées sur des séries temporelles comptables historiques, ainsi que sur des entrées provenant de données transactionnelles et d'obligations contractuelles. Ici, vous pouvez utiliser ARIMA_PLUS avec BigQuery ML et le combiner avec des modèles supervisés dans BigQuery ML, comme GLM, les modèles d'arbres boostés et AutoML.
Détection d'anomalies avec la prévision de la demande
Pendant les vacances, les fêtes ou les promotions de fin d'année, certains pics sont parfois prévisibles et attendus. Mais qu'en est-il des pics (ou baisses) inattendus ? Par exemple, comment identifier une demande inhabituellement élevée (ou inhabituellement faible) à laquelle vous ne vous attendiez pas ? Découvrez comment vous pouvez utiliser la détection d'anomalies avec BigQuery ML pour trouver un pic anormal dans les locations de vélos qui coïncide avec le jour où les transports publics ont été perturbés dans la ville de Londres.
Contrôle de la qualité de fabrication et surveillance des métriques
Des capteurs IoT aux résultats de production, la surveillance des métriques peut prendre de nombreuses formes. Le point commun est toutefois de prévoir la plage type de ces métriques afin de pouvoir anticiper et réagir le plus rapidement possible avec des systèmes de surveillance en place.
D'autres cas d'utilisation courants pour la détection des anomalies incluent les anomalies de prix dues à une mauvaise tarification, la détection des anomalies en temps réel et le contrôle de la qualité de fabrication.
Efficacité des annonces
Dans quelle mesure vos annonces ont-elles contribué à l'essor d'une entreprise ? L'inférence causale peut vous aider à examiner la pertinence statistique des campagnes publicitaires.
Impact des grands événements sur les séries temporelles
Il est possible que vous souhaitiez savoir si l'impact d'événements majeurs, comme le Brexit, sur une série chronologique était statistiquement pertinent. Découvrez comment procéder à une inférence causale pour répondre à la question "Quel a été l'impact du vote du Brexit sur les taux de change entre la livre sterling et le dollar américain ?"
Les promotions, l'efficacité des incitations et les estimations de l'élasticité des prix constituent d'autres domaines d'analyse par inférence causale.
BigQuery ML permet aux utilisateurs de créer et d'exécuter des modèles de machine learning dans BigQuery à l'aide de requêtes SQL standard. Il accepte un type de modèle appelé ARIMA_PLUS permettant d'effectuer des tâches de prévision de séries temporelles et de détection d'anomalies.
Grâce à la modélisation ARIMA_PLUS dans BigQuery ML, vous pouvez faire des prévisions sur des millions de séries temporelles en une seule requête SQL, sans quitter votre entrepôt de données.
ARIMA_PLUS est essentiellement un pipeline de modélisation de séries temporelles, qui inclut les fonctionnalités suivantes :
Des dizaines de millions de séries temporelles peuvent être prévues en même temps avec une seule requête. Différents pipelines de modélisation s'exécutent en parallèle, si suffisamment d'emplacements BigQuery sont disponibles.
Vous pouvez commencer à utiliser BigQuery ARIMA_PLUS à l'aide des tutoriels suivants :
Pour en savoir plus, consultez la documentation publique de BigQuery ML.
Vertex Forecast offre aux utilisateurs plusieurs options pour entraîner le modèle de prévision de séries temporelles :
Pour en savoir plus, consultez la documentation publique de Vertex Forecast.
Pour commencer, suivez le tutoriel sur les prévisions Vertex.
Si vous souhaitez utiliser votre propre code personnalisé, mais que vous souhaitez exploiter l'infrastructure d'entraînement/de diffusion sur Google Cloud, vous pouvez utiliser Vertex AI Notebooks pour exécuter tout code en Python, R, TensorFlow ou PyTorch.
TimesFM (Time Series Foundation Model) est un modèle de fondation de séries temporelles pré-entraîné et développé par Google Research pour la prévision de séries temporelles univariées.
La version 1.0 contient un point de contrôle de 200 millions de paramètres ainsi que son code d'inférence. Il s'agit d'un modèle basé sur Transformer, entraîné à l'aide d'un décodeur uniquement sur un ensemble de données pré-entraîné contenant plus de 100 milliards de points temporels réels. Le modèle effectue des prévisions de séries temporelles univariées pour des durées de contexte allant jusqu'à 512 points temporels et n'importe quelle longueur d'horizon, avec une entrée facultative d'indicateur de fréquence.
Cas d'utilisation : prévision de séries temporelles. Le modèle utilise comme contexte d'entrée une série temporelle univariée, ainsi qu'un paramètre de fréquence facultatif. Le modèle prévoit la série temporelle sur un horizon futur de n'importe quelle longueur.
Avec la prévision univariée, vous prévoyez les données futures uniquement à l'aide des données de séries temporelles historiques. Par exemple, pour prévoir la température demain à New York, la prévision univariée consiste à n'utiliser qu'une seule variable, les températures historiques, pour prévoir les températures futures. Avec la prévision univariée, vous pouvez également découvrir des modèles et des tendances saisonniers.
Avec la prévision multivariée, vous prévoyez les données futures en utilisant plusieurs facteurs. Par exemple, pour prévoir la température de demain à New York, en plus des températures historiques, vous pouvez également utiliser la pression barométrique, l'indice UV, le pourcentage de couverture nuageuse dans les zones géographiques voisines, la vitesse du vent et d'autres variables.
Découvrez comment BigQuery ML peut aider votre organisation. Consulter la documentation.
Profitez de 300 $ de crédits gratuits et de plus de 20 produits Always Free pour commencer à créer des applications sur Google Cloud.