BigQuery ML 모델 가중치 개요

이 문서에서는 BigQuery ML이 머신러닝(ML) 모델의 모델 가중치 검색 가능성을 지원하는 방법을 설명합니다.

ML 모델은 학습 데이터에서 ML 알고리즘을 실행한 후 저장되는 아티팩트입니다. 이 모델은 예측을 수행하는 데 필요한 규칙, 숫자, 기타 알고리즘 관련 데이터 구조를 나타냅니다. 몇 가지 예를 들면 다음과 같습니다.

  • 선형 회귀 모델은 특정 값을 갖는 계수의 벡터로 구성됩니다.
  • 결정 트리 모델은 특정 값을 가진 if-then 문의 트리 한 개 이상으로 구성됩니다.
  • 심층신경망은 특정 값을 갖는 가중치 또는 행렬로 구성된 그래프 구조로 구성됩니다.

BigQuery ML에서 모델 가중치라는 용어는 모델이 구성된 구성요소를 설명하는 데 사용됩니다.

각 모델 유형에 지원되는 SQL 문과 함수에 대한 자세한 내용은 각 모델의 엔드 투 엔드 사용자 경험을 참조하세요.

BigQuery ML의 모델 가중치 제품

BigQuery ML은 다양한 모델의 모델 가중치를 검색하는 데 사용할 수 있는 여러 함수를 제공합니다.

모델 카테고리 모델 유형 모델 가중치 함수 함수 기능
지도 모델 선형 및 로지스틱 회귀 ML.WEIGHTS 특성 계수 및 가로채기를 검색합니다.
비지도 모델 K-평균 ML.CENTROIDS 모든 중심에 대한 특성 계수를 검색합니다.
행렬 분해 ML.WEIGHTS 모든 잠재 계수의 가중치를 검색합니다. 사용자 행렬과 항목 행렬의 두 가지 분리된 행렬을 나타냅니다.
PCA ML.PRINCIPAL_COMPONENTS 고유 벡터라고도 하는 모든 주 구성원 구성요소에 대한 특정 계수를 검색합니다.
ML.PRINCIPAL_COMPONENT_INFO 고유 값과 같은 각 주 구성원 구성요소의 통계를 검색합니다.
시계열 모델 ARIMA_PLUS ML.ARIMA_COEFFICIENTS 입력 시계열의 추세 구성요소를 모델링하는 데 사용되는 ARIMA 모델의 계수를 검색합니다. 시계열에 있는 계절성 패턴과 같은 다른 구성요소에 대한 자세한 내용은 ML.ARIMA_EVALUATE를 사용하세요.

BigQuery ML은 다음 유형의 모델에 대한 모델 가중치 함수를 지원하지 않습니다.

AutoML Tables 모델을 제외한 이 모든 모델 유형의 가중치를 확인하려면 BigQuery ML에서 Cloud Storage로 모델을 내보냅니다. 그런 다음 XGBoost 라이브러리를 사용하여 부스팅된 트리 및 무작위 포리스트 모델의 트리 구조를 시각화하거나 TensorFlow 라이브러리를 사용하여 DNN 및 와이드 앤 딥 모델의 그래프 구조를 시각화할 수 있습니다. AutoML Tables 모델의 모델 가중치 정보를 얻는 방법은 없습니다.

모델 내보내기에 대한 자세한 내용은 EXPORT MODEL온라인 예측을 위한 BigQuery ML 모델 내보내기를 참조하세요.