예측 개요

예측은 과거 데이터를 분석하여 미래 추세에 대해 정보에 입각한 예측을 수행하는 기법입니다. 예를 들어 여러 매장 위치의 과거 판매 데이터를 분석하여 해당 위치의 향후 판매를 예측할 수 있습니다. BigQuery ML에서는 시계열 데이터에 대한 예측을 수행합니다.

다음과 같은 방법으로 예측을 실행할 수 있습니다.

  • 기본 제공 TimesFM 모델과 함께 AI.FORECAST 함수를 사용합니다. 단일 변수의 향후 값을 예측해야 하고 모델을 미세 조정할 필요가 없는 경우 이 방법을 사용하세요. 이 방법에서는 모델을 만들고 관리할 필요가 없습니다.
  • ARIMA_PLUS 모델과 함께 ML.FORECAST 함수를 사용합니다. ARIMA 기반 모델링 파이프라인을 실행하고 결과를 설명하기 위해 시계열을 여러 구성요소로 분해해야 하는 경우 이 방법을 사용하세요. 이 방법을 사용하려면 모델을 만들고 관리해야 합니다.
  • ARIMA_PLUS_XREG 모델과 함께 ML.FORECAST 함수를 사용합니다. 여러 변수의 미래 값을 예측해야 하는 경우 이 방법을 사용하세요. 이 방법을 사용하려면 모델을 만들고 관리해야 합니다.

ARIMA_PLUSARIMA_PLUS_XREG 시계열 모델은 실제로는 단일 모델이 아니라 여러 모델과 알고리즘이 포함된 시계열 모델링 파이프라인입니다. 자세한 내용은 시계열 모델링 파이프라인을 참조하세요.

TimesFM 모델과 ARIMA 모델 비교

다음 표를 사용하여 사용 사례에 기본 제공 TimesFM 모델과 함께 AI.FORECAST를 사용할지 아니면 ARIMA_PLUS 또는 ARIMA_PLUS_XREG 모델과 함께 ML.FORECAST를 사용할지 결정하세요.

기능 TimesFM 모델을 사용하여 AI.FORECAST ARIMA_PLUS 또는 ARIMA_PLUS_XREG 모델을 사용하여 ML.FORECAST
모델 유형 트랜스포머 기반 파운데이션 모델 트렌드 구성요소에는 ARIMA 알고리즘을 사용하고 트렌드가 아닌 구성요소에는 다양한 기타 알고리즘을 사용하는 통계 모델입니다. 자세한 내용은 시계열 모델링 파이프라인을 참조하세요.
학습이 필요함 아니요, TimesFM 모델은 사전 학습됩니다. 예, 각 시계열에 대해 하나의 ARIMA_PLUS 또는 ARIMA_PLUS_XREG 모델이 학습됩니다.
SQL 사용 편의성 매우 높음. 단일 함수 호출이 필요합니다. 높음. CREATE MODEL 문과 함수 호출이 필요합니다.
사용된 데이터 기록 512개의 시간 포인트를 사용합니다. 학습 데이터의 모든 시점을 사용하지만 더 적은 시점을 사용하도록 맞춤설정할 수 있습니다.
정확성 매우 높음. 다른 여러 모델보다 성능이 우수합니다. 자세한 내용은 시계열 예측을 위한 디코더 전용 파운데이션 모델을 참조하세요. 매우 높음(TimesFM 모델과 동등한 수준)
맞춤설정 낮음 높음. CREATE MODEL은 다음과 같은 여러 모델 설정을 조정할 수 있는 인수를 제공합니다.
  • 계절성
  • 연말연시 효과
  • 단계 변경사항
  • 트렌드
  • 급증 및 급감 제거
  • 상한 및 하한 예측
공변량 지원 아니요. 예, ARIMA_PLUS_XREG 모델을 사용하는 경우
설명 기능 낮음 높음. ML.EXPLAIN_FORECAST 함수를 사용하여 모델 구성요소를 검사할 수 있습니다.
최적의 사용 사례
  • 빠른 예측
  • 최소한의 설정 필요
  • 모델에 미세 조정이 필요함
  • 모델 출력에 설명이 필요함
  • 모델 입력에 컨텍스트가 더 필요함

BigQuery ML 문의 기본 설정과 함수를 사용하면 ML 지식이 많지 않더라도 예측 모델을 만들고 사용할 수 있습니다. 하지만 ML 개발, 특히 예측 모델에 관한 기본 지식을 갖추면 데이터와 모델을 모두 최적화하여 더 나은 결과를 얻을 수 있습니다. 다음 리소스를 사용하여 ML 기법과 프로세스에 익숙해지는 것이 좋습니다.