수동 특성 사전 처리

CREATE MODEL 문의 TRANSFORM을 수동 사전 처리 함수와 함께 사용하여 커스텀 데이터 사전 처리를 정의할 수 있습니다. TRANSFORM 절 외부에서 이러한 수동 사전 처리 함수를 사용할 수도 있습니다.

데이터 사전 처리를 모델 학습에서 분리하려면 TRANSFORM 절을 사용하여 데이터 변환만 수행하는 변환 전용 모델을 만들면 됩니다.

ML.TRANSFORM 함수를 사용하여 특성 사전 처리의 투명성을 높일 수 있습니다. 이 함수를 사용하면 모델의 TRANSFORM 절에서 사전 처리된 데이터를 반환할 수 있으므로 모델 학습으로 연결되는 실제 학습 데이터는 물론 모델 서빙에 들어가는 실제 예측 데이터를 확인할 수 있습니다.

BigQuery ML의 특성 사전 처리 지원에 대한 자세한 내용은 특성 사전 처리 개요를 참조하세요.

각 모델 유형에 지원되는 SQL 문과 함수에 대한 자세한 내용은 각 모델의 엔드 투 엔드 사용자 경험을 참조하세요.

사전 처리 함수 유형

수동 사전 처리 함수에는 여러 가지 유형이 있습니다.

  • 스칼라 함수는 단일 행에 작동합니다(예: ML.BUCKETIZE).
  • 테이블 값 함수는 모든 행에서 작동하며 테이블을 출력합니다. 예: ML.FEATURES_AT_TIME
  • 분석 함수는 모든 행에 작동하며 모든 행에서 수집된 통계를 기반으로 각 행의 결과를 출력합니다. 예: ML.QUANTILE_BUCKETIZE

    항상 ML 분석 함수와 함께 빈 OVER() 절을 사용해야 합니다.

    학습 중에 TRANSFORM 절 내에서 ML 분석 함수를 사용하면 동일한 통계가 예측의 입력에 자동으로 적용됩니다.

다음 섹션에서는 사용 가능한 사전 처리 함수를 설명합니다.

일반적인 기능

문자열 또는 숫자 표현식에 다음 함수를 사용하여 데이터를 정리합니다.

숫자 함수

숫자 표현식에서 다음 함수를 사용하여 데이터를 정규화합니다.

범주형 함수

데이터 분류에 다음 함수를 사용합니다.

텍스트 함수

텍스트 문자열 표현식에서 다음 함수를 사용합니다.

이미지 함수

이미지 데이터에 다음 함수를 사용합니다.

알려진 제한사항