预测概览

预测是指分析历史数据,以便对未来趋势做出明智的预测。例如,您可以分析多个店面位置的历史销售数据,以预测这些位置的未来销售情况。在 BigQuery ML 中,您可以对时序数据执行预测。

您可以通过以下方式进行预测:

  • 通过将 AI.FORECAST 函数与内置的 TimesFM 模型结合使用。如果您需要预测单个变量的未来值,并且不需要对模型进行微调,请使用此方法。此方法不要求您创建和管理模型。
  • 通过将 ML.FORECAST 函数ARIMA_PLUS 模型结合使用。如果您需要运行基于 ARIMA 的建模流水线并将时序分解为多个组成部分以解释结果,请使用此方法。此方法要求您创建和管理模型。
  • 通过将 ML.FORECAST 函数与 ARIMA_PLUS_XREG 模型结合使用。如果您需要预测多个变量的未来值,请使用此方法。此方法要求您创建和管理模型。

ARIMA_PLUSARIMA_PLUS_XREG 时序模型实际上不是单个模型,而是包含多个模型和算法的时序建模流水线。如需了解详情,请参阅时序建模流水线

除了预测之外,您还可以使用 ARIMA_PLUSARIMA_PLUS_XREG 模型进行异常值检测。如需了解详情,请参阅以下文档:

比较 TimesFM 和 ARIMA 模型

请使用下表确定在您的应用场景中,是使用带有内置 TimesFM 模型的 AI.FORECAST,还是使用带有 ARIMA_PLUSARIMA_PLUS_XREG 模型的 ML.FORECAST

功能 带有 TimesFM 模型的 AI.FORECAST 带有 ARIMA_PLUSARIMA_PLUS_XREG 模型的 ML.FORECAST
模型类型 基于 Transformer 的基础模型。 一种统计模型,使用 ARIMA 算法处理趋势组件,并使用各种其他算法处理非趋势组件。如需了解详情,请参阅时序建模流水线
需要训练 不需要,TimesFM 模型已经过预训练。 需要,针对每个时序训练一个 ARIMA_PLUSARIMA_PLUS_XREG 模型。
SQL 易用性 非常高。需要单次函数调用。 高。需要 CREATE MODEL 语句和函数调用。
使用的数据历史记录 使用 512 个时间点。 使用训练数据中的所有时间点,但可以自定义为使用较少的时间点。
准确率 非常高。性能优于许多其他模型。如需了解详情,请参阅用于时序预测的仅使用解码器的基础模型 非常高,与 TimesFM 模型相当。
自定义 低。 高。CREATE MODEL 语句提供了一些参数,可用于对许多模型设置进行调优,例如以下这些:
  • 季节性
  • 节假日效应
  • 步进变化
  • 趋势
  • 移除高峰和低谷
  • 预测上限和下限
支持协变量 不支持。 支持(使用 ARIMA_PLUS_XREG 模型时)。
可解释性 低。 高。您可以使用 ML.EXPLAIN_FORECAST 函数检查模型组件。
最佳应用场景
  • 快速预测
  • 需要极少的设置
  • 模型需要微调
  • 需要具备模型输出可解释性
  • 模型输入需要更多上下文

通过使用 BigQuery ML 的语句和函数的默认设置,即使您没有太多机器学习知识,也可以创建和使用预测模型。不过,如果您具备机器学习开发(尤其是预测模型)的基本知识,则有助于您优化数据和模型,从而获得更好的结果。我们建议您使用以下资源来熟悉机器学习技术和流程: