时序预测是一种统计或机器学习方法,它会尝试对历史时序数据建模,以预测未来的时间点。
与其他类型的模型相比,时序预测具有独特的挑战,例如季节性、节假日效应、数据稀疏和趋势变化。由于时序的顺序本质和时间相关性,许多机器学习技术的效果并不理想。例如,k-fold 交叉验证可能会导致数据泄露;模型需要重新训练以生成新的预测。无法对时间维度进行随机化处理,使得在过拟合和欠拟合之间达到平衡变得很复杂。由于可能有数百万个项需要预测,因此还必须考虑任何预测解决方案的可伸缩性。除了预测,任务也可能对业务很重要,例如异常值检测、不确定性量化和因果推理。时序预测不仅仅是对带时间戳的数据的监督式学习。幸运的是,Google Cloud 提供了各种解决方案,可以满足每一种业务需求。
例如,大型零售商店可能要预测数百万件商品,以便在需求旺盛时保证库存,而在需求低迷时避免库存积压。
商品的零售需求预测
构建端到端的解决方案以预测零售商品的需求。借助 BigQuery ML 使用历史销售数据来训练需求预测模型,然后在 Looker Studio 信息中心内直观呈现预测值,以与利益相关方共享。探索需求预测如何减少食物浪费。
商品价格预测
时序模型用于预测对业务和生产流程至关重要的商品的价格,并为现金流模型和财务计划提供信息。
现金流预测
时序模型通常与回归和分类模型结合使用,根据历史账单时序以及来自交易数据和合同义务的输入生成高度准确的现金流预测。在这里,您可以将 ARIMA_PLUS 与 BigQuery ML 搭配使用,并将其与 BigQuery ML 中的监督式模型(如 GLM、提升树模型和 AutoML)相结合。
使用需求预测进行异常值检测
在节假日、送礼季或年终促销时,有时会出现预料之中的高峰。但是,当出现意料之外的高峰(或低谷)时,该怎么办呢?例如,如何发现意料之外的异常高(或异常低)的需求?了解如何将异常值检测与 BigQuery ML 搭配使用来发现自行车租赁的异常高峰,这个高峰正好发生在伦敦公共交通中断的日期。
制造质量控制和指标监控
从 IoT 传感器到生产输出,指标的监控可以有多种形式。然而,常见的元素是预测这些指标的典型范围,以便您可以提前进行规划并在部署了监控系统的情况下尽快做出响应。
异常值检测的其他常见用例包括因价格错误导致的价格异常、实时异常值检测和制造质量控制。
广告效果
您的广告在提升业务量方面的效果如何?因果推理可以帮助您了解广告系列的统计显著性。
重大事件对时序的影响
您可能想知道重大事件(例如英国脱欧)对某个时序的影响是否具有统计显著性。详细了解如何进行因果推理以回答“英国脱欧投票如何影响英镑与美元之间的汇率?”这个问题。
因果推理分析的其他应用领域包括促销、激励效果和价格弹性估算。
借助 BigQuery ML,用户可以使用标准 SQL 查询在 BigQuery 中创建和执行机器学习模型。它支持名为 ARIMA_PLUS 的模型类型,用于执行时序预测和异常值检测任务。
借助 BigQuery ML 中的 ARIMA_PLUS 建模,您无需离开数据仓库,就可以在一个 SQL 查询中对数百万个时序进行预测。
ARIMA_PLUS 实质上是一个时序建模流水线,其中包含以下功能:
使用单个查询可以一次预测数千万个时序。如果有足够的 BigQuery 槽可用,不同的建模流水线可并行运行。
您可以按照以下教程开始使用 BigQuery ARIMA_PLUS:
如需了解详情,请参阅 BigQuery ML 公共文档。
Vertex Forecast 为用户提供多个训练时序预测模型的选项:
如需了解详情,请参阅 Vertex Forecast 公共文档。
您可以开始使用 Vertex Forecasting 教程。
如果您希望使用自己的自定义代码,但又想利用 Google Cloud 上的训练/服务基础架构,则可以使用 Vertex AI Notebooks 运行任何 Python、R、TensorFlow 或 PyTorch 代码。
TimesFM(时序基础模型)是由 Google Research 开发的预训练时序基础模型,用于单变量时序预测。
1.0 版本包含一个 2 亿参数的检查点及其推理代码。它是一个基于转换器的模型,仅以解码器的方式在包含 1,000 多亿个真实时间点的预训练数据集上进行训练。它对不超过 512 个时间点和任何范围长度的上下文长度执行单变量时序预测,具有可选的频率指标输入。
使用场景:时序预测 - 模型将单变量时序以及可选的频率参数作为输入上下文。该模型可针对任意长度的未来时间范围预测时序。
进行单变量预测时,仅使用历史时序数据来预测未来数据。例如,如需预测纽约市明天的气温,单变量预测意味着仅使用历史气温这一个变量来预测未来气温。进行单变量预测时,您还可以发现季节性模式和趋势。
进行多变量预测时,使用多个因素来预测未来的数据。例如,如需预测纽约市明天的气温,除了使用历史气温之外,您还可以使用气压、紫外线指数、附近地理区域的云量百分比、风速和其他变量。
了解 BigQuery ML 如何为贵组织提供帮助。 查看文档