수동 특성 사전 처리
CREATE MODEL
문의 TRANSFORM
절을 수동 사전 처리 함수와 함께 사용하여 커스텀 데이터 사전 처리를 정의할 수 있습니다. TRANSFORM
절 외부에서 이러한 수동 사전 처리 함수를 사용할 수도 있습니다.
데이터 전처리를 모델 학습에서 분리하려면 TRANSFORM
절을 사용하여 데이터 변환만 수행하는 변환 전용 모델을 만들면 됩니다.
ML.TRANSFORM
함수를 사용하여 특성 사전 처리의 투명성을 높일 수 있습니다. 이 함수를 사용하면 모델의 TRANSFORM
절에서 사전 처리된 데이터를 반환할 수 있으므로 모델 학습으로 연결되는 실제 학습 데이터는 물론 모델 서빙에 들어가는 실제 예측 데이터를 확인할 수 있습니다.
BigQuery ML의 특성 전처리 지원에 대한 자세한 내용은 특성 전처리 개요를 참조하세요.
각 모델 유형에 지원되는 SQL 문과 함수에 대한 자세한 내용은 각 모델의 엔드 투 엔드 사용자 경험을 참조하세요.
사전 처리 함수의 유형
수동 사전 처리 함수에는 여러 가지 유형이 있습니다.
- 스칼라 함수는 단일 행에 작동합니다(예:
ML.BUCKETIZE
). - 테이블 값 함수는 모든 행에 작동하며 테이블을 출력합니다. 예:
ML.FEATURES_AT_TIME
분석 함수는 모든 행에 작동하며 모든 행에서 수집된 통계를 기반으로 각 행의 결과를 출력합니다. 예:
ML.QUANTILE_BUCKETIZE
ML 분석 함수에는 항상 빈
OVER()
절을 사용해야 합니다.학습 중에
TRANSFORM
절 내에서 ML 분석 함수를 사용하면 동일한 통계가 예측의 입력에 자동으로 적용됩니다.
다음 섹션에서는 사용 가능한 사전 처리 함수를 설명합니다.
일반적인 기능
문자열 또는 숫자 표현식에 다음 함수를 사용하여 데이터를 정리합니다.
숫자 함수
숫자 표현식에서 다음 함수를 사용하여 데이터를 정규화합니다.
ML.BUCKETIZE
ML.MAX_ABS_SCALER
ML.MIN_MAX_SCALER
ML.NORMALIZER
ML.POLYNOMIAL_EXPAND
ML.QUANTILE_BUCKETIZE
ML.ROBUST_SCALER
ML.STANDARD_SCALER
범주형 함수
데이터 분류에 다음 함수를 사용합니다.
텍스트 함수
텍스트 문자열 표현식에서 다음 함수를 사용합니다.
이미지 함수
이미지 데이터에서 다음 함수를 사용합니다.
알려진 제한사항
- BigQuery ML은 모델 내보내기에서 자동 사전 처리와 수동 사전 처리를 모두 지원합니다. BigQuery ML
TRANSFORM
절로 학습된 모델 내보내기에 지원되는 데이터 유형 및 함수를 참조하세요.