BigQuery ML 모델 가중치 개요
이 문서에서는 BigQuery ML이 머신러닝(ML) 모델의 모델 가중치 검색 가능성을 지원하는 방법을 설명합니다.
ML 모델은 학습 데이터에 대해 ML 알고리즘을 실행한 후 저장되는 아티팩트입니다. 모델은 예측을 수행하는 데 필요한 규칙, 숫자, 기타 알고리즘별 데이터 구조를 나타냅니다. 몇 가지 예를 들면 다음과 같습니다.
- 선형 회귀 모델은 특정 값을 갖는 계수의 벡터로 구성됩니다.
- 결정 트리 모델은 특정 값이 포함된 if-then 문의 트리 한 개 이상으로 구성됩니다.
- 심층신경망 모델은 특정 값을 갖는 벡터 또는 가중치 행렬의 그래프 구조로 구성됩니다.
BigQuery ML에서 모델 가중치라는 용어는 모델이 구성된 구성요소를 기술하기 위해 사용됩니다.
각 모델 유형에 지원되는 SQL 문과 함수에 대한 자세한 내용은 각 모델의 엔드 투 엔드 사용자 경험을 참조하세요.
BigQuery ML의 모델 가중치 제품
BigQuery ML은 여러 모델의 모델 가중치를 검색하는 데 사용할 수 있는 여러 함수를 제공합니다.
모델 카테고리 | 모델 유형 | 모델 가중치 함수 | 함수 기능 |
---|---|---|---|
지도 모델 | 선형 및 로지스틱 회귀 | ML.WEIGHTS |
특성 계수 및 가로채기를 검색합니다. |
비지도 모델 | K-평균 | ML.CENTROIDS |
모든 중심에 대한 특성 계수를 검색합니다. |
행렬 분해 | ML.WEIGHTS |
모든 잠재 계수의 가중치를 검색합니다. 사용자 행렬과 항목 행렬의 두 가지 분리된 행렬을 나타냅니다. | |
PCA | ML.PRINCIPAL_COMPONENTS |
고유 벡터라고도 하는 모든 주 구성원 구성요소에 대한 특정 계수를 검색합니다. | |
ML.PRINCIPAL_COMPONENT_INFO |
고유 값과 같은 각 주 구성원 구성요소의 통계를 검색합니다. | ||
시계열 모델 | ARIMA_PLUS | ML.ARIMA_COEFFICIENTS |
입력 시계열의 추세 구성요소를 모델링하는 데 사용되는 ARIMA 모델의 계수를 검색합니다. 시계열에 있는 계절성 패턴과 같은 다른 구성요소에 대한 자세한 내용을 보려면 ML.ARIMA_EVALUATE 를 사용합니다. |
BigQuery ML은 다음 유형의 모델에 대해 모델 가중치 함수를 지원하지 않습니다.
AutoML Tables 모델을 제외한 이러한 모든 모델 유형의 가중치를 보려면 BigQuery ML에서 Cloud Storage로 모델을 내보냅니다. 그런 다음 XGBoost 라이브러리를 사용하여 부스티드 트리 및 랜덤 포레스트 모델의 트리 구조를 시각화하거나 TensorFlow 라이브러리를 사용하여 DNN 및 와이드 앤 딥 모델의 그래프 구조를 시각화할 수 있습니다. AutoML Tables 모델의 모델 가중치 정보를 가져오는 방법은 없습니다.
모델 내보내기에 대한 자세한 내용은 EXPORT MODEL
문 및 온라인 예측을 위해 BigQuery ML 모델 내보내기를 참조하세요.