기본 제공 알고리즘 소개

이 페이지에서는 기본 제공 알고리즘을 사용한 학습을 간략하게 설명합니다. AI Platform Training에서 기본 제공 알고리즘을 사용하면 학습 애플리케이션 코드를 작성하지 않고 데이터에서 학습 작업을 실행할 수 있습니다. 학습 데이터를 제출하고 알고리즘을 선택한 후 AI Platform Training이 사전 처리 및 학습을 자동으로 처리하도록 할 수 있습니다. 그러면 AI Platform Training에서 모델을 쉽게 배포하고 예측을 수행할 수 있습니다.

기본 제공 알고리즘을 사용한 학습 수행 방법

AI Platform Training은 클라우드의 컴퓨팅 리소스에서 학습 작업을 실행합니다. 전체 프로세스는 다음과 같습니다.

  1. 사용 가능한 기본 제공 알고리즘을 비교하여 특정 데이터세트 및 사용 사례에 적합한지 확인합니다.
  2. 기본 제공 알고리즘을 사용할 학습의 입력 데이터 형식을 지정합니다. 데이터는 헤더 행이 삭제된 CSV 파일 형식으로 제출되어야 하며, 타겟 열이 첫 번째 열로 설정되어 있어야 합니다. 사용 중인 기본 제공 알고리즘 관련 형식 지정 추가 요구사항을 따릅니다(해당하는 경우).
  3. AI Platform Training이 학습 출력을 저장할 수 있는 Cloud Storage 버킷을 생성합니다(아직 없는 경우).
  4. 학습 작업을 맞춤설정하는 옵션을 선택합니다. 먼저 전체 학습 작업을 구성하는 항목을 선택한 후 구체적으로 알고리즘을 구성하는 항목을 추가로 선택합니다. 원하는 경우 작업의 초매개변수 미세 조정을 구성하는 항목을 추가로 선택할 수 있습니다.
    • 전체 학습 작업의 경우 작업 이름, 사용할 기본 제공 알고리즘, 사용할 머신, 작업을 실행할 리전, AI Platform Training이 학습 결과를 저장할 Cloud Storage 버킷을 선택합니다.
    • 알고리즘별 선택 항목의 경우 AI Platform Training이 데이터세트를 자동으로 사전 처리하도록 사용 설정할 수 있습니다. 또한 학습률, 학습 단계, 배치 크기와 같은 인수를 지정할 수 있습니다.
    • 초매개변수 미세 조정의 경우 모델의 예측 정확도 극대화 또는 학습 손실 최소화 같은 목표 측정항목을 선택할 수 있습니다. 또한 특정 초매개변수를 미세 조정하고 해당 값의 범위를 설정할 수 있습니다.
  5. 학습 작업을 제출하고 로그를 확인하여 진행률 및 상태를 모니터링합니다.
  6. 학습 작업이 성공적으로 완료되면 AI Platform Training에 학습된 모델을 배포하여 예측 서버를 설정하고 새 데이터에 대한 예측을 수행할 수 있습니다.

제한사항

기본 제공 알고리즘을 사용한 학습에서는 다음과 같은 제한사항에 주의하세요.

  • 분산형 학습은 지원되지 않습니다. AI Platform Training에서 분산 학습 작업을 실행하려면 학습 애플리케이션을 만들어야 합니다.
  • Google Cloud Console을 통해 제출된 학습 작업은 기존 머신 유형만 사용합니다. gcloud 또는 Python용 Google API 클라이언트 라이브러리를 통해 제출된 학습 작업은 Compute Engine 머신 유형을 사용할 수 있습니다. 학습에 적합한 머신 유형에 대해 자세히 알아보세요.
  • GPU는 일부 알고리즘에서 지원됩니다. 자세한 내용은 모든 기본 제공 알고리즘 세부 비교를 참조하세요.
  • 다중 GPU 머신에 기본 제공 알고리즘 학습을 적용할 경우 속도가 빠르지 않으므로 GPU를 사용한다면 단일 GPU가 있는 머신을 선택하세요.
  • TPU는 테이블 형식의 기본 제공 알고리즘 학습에 지원되지 않습니다. 학습 애플리케이션을 만들어야 합니다. 자세한 내용은 TPU를 사용한 학습 작업 실행 방법을 참조하세요.

특정 기본 제공 알고리즘의 세부 제한사항은 알고리즘별 가이드를 참조하세요.

초매개변수 조정

초매개변수 조정은 기본 제공 알고리즘을 사용한 학습에서 지원됩니다. 먼저 목표 측정항목과 이를 최소화 또는 극대화할지를 지정합니다. 모델 분류 정확도를 극대화하거나 학습 손실을 최소화할 수 있습니다. 그런 다음 조정하려는 초매개변수를 각 초매개변수의 타겟 값과 함께 표시합니다.

초매개변수를 미세 조정한 학습 작업을 제출하면 AI Platform Training은 평가를 여러 번 실행하고 평가가 끝날 때마다 초매개변수를 추적 및 조정합니다. 초매개변수 미세 조정 작업이 완료되면 AI Platform Training은 가장 효과적인 초매개변수 구성 값과 각 시도 결과의 요약을 보고합니다.

AI Platform Training에서 초매개변수 미세 조정에 대해 자세히 알아보세요.

알고리즘 개요

기본 제공 알고리즘은 일반적으로 분류 및 회귀로 확인된 다양한 사용 사례를 모델에 학습시키는 데 유용합니다. AI Platform Training에서는 다음과 같은 기본 제공 알고리즘을 학습에 사용할 수 있습니다.

  • 선형 학습자
  • 와이드 앤 딥
  • TabNet
  • XGBoost
  • 이미지 분류
  • 객체 감지

선형 학습자

선형 학습자 기본 제공 알고리즘은 로지스틱 회귀, 이진 분류, 멀티클래스 분류에 사용됩니다. AI Platform Training에서는 TensorFlow 에스티메이터 기반 구현을 사용합니다.

선형 학습자 모델은 각 입력 특성에 가중치 하나를 할당하고 가중치를 합산하여 숫자 타겟 값을 예측합니다. 로지스틱 회귀의 경우 이 값은 0과 1 사이의 값으로 변환됩니다. 이 간단한 모델 유형은 특성 가중치를 비교하여 예측에 중대한 영향을 주는 입력 특성을 확인할 수 있기 때문에 쉽게 해석할 수 있습니다.

대규모 선형 모델의 작동 방법을 자세히 알아보세요.

와이드 앤 딥

와이드 앤 딥 기본 제공 알고리즘은 추천자 시스템, 검색, 순위 지정 문제와 같은 대규모 분류와 회귀 문제에 사용됩니다. AI Platform Training에서는 TensorFlow 에스티메이터 기반 구현을 사용합니다.

이 유형의 모델은 다양한(와이드) 범위의 규칙을 학습하고 '기억'하는 선형 모델과 이러한 규칙을 '일반화'하고 확인되지 않은 신규 데이터의 비슷한 특성에 올바르게 적용하는 심층(딥) 신경망을 결합합니다.

와이드 앤 딥 러닝에 대해 자세히 알아보세요.

TabNet

TabNet 기본 제공 알고리즘은 테이블 형식 데이터의 분류 및 회귀 문제에 사용됩니다. AI Platform Training에서는 TensorFlow 기반 구현을 사용합니다.

또한 TabNet 기본 제공 알고리즘은 모델의 동작을 해석하고 예측을 설명하는 데 도움이 되는 특성 기여 분석을 제공합니다.

TabNet을 새 기본 제공 알고리즘으로 사용에 대해 자세히 알아보세요.

XGBoost

XGBoost(eXtreme Gradient Boosting)는 경사 부스팅 알고리즘을 구현하는 프레임워크입니다. XGBoost는 분류, 회귀, 순위 지정 작업에 효율적인 학습 감독을 지원합니다. XGBoost 학습은 여러 분류 및 회귀 모델의 결과가 결합된 결정 트리 앙상블을 기반으로 합니다.

XGBoost 작동 방식에 대해 자세히 알아보세요.

이미지 분류

이미지 감지 기본 제공 알고리즘은 TensorFlow 이미지 분류 모델을 사용합니다. EfficientNet 또는 ResNet의 TensorFlow 구현을 기반으로 이미지 분류 모델을 학습시킬 수 있습니다.

객체 감지

객체 감지 기본 제공 알고리즘은 TensorFlow 객체 감지 API를 사용하여 단일 이미지 내에서 여러 객체를 식별할 수 있는 모델을 빌드합니다.

기본 제공 알고리즘 비교

다음은 기본 제공 알고리즘을 간단히 비교한 표입니다.

알고리즘 이름 사용된 ML 모델 문제 유형 사용 사례 예시 학습에 지원되는 가속기
선형 학습자 TensorFlow 에스티메이터
LinearClassifier LinearRegressor.
분류, 회귀 판매 예측 GPU
와이드 앤 딥 TensorFlow 에스티메이터
DNNLinearCombinedClassifier, DNNLinearCombinedEstimator, and DNNLinearCombinedRegressor.
분류, 회귀, 순위 지정 추천 시스템, 검색 GPU
TabNet TensorFlow 에스티메이터 분류, 회귀 광고 클릭률(CTR) 예측, 사기 감지 GPU
XGBoost XGBoost 분류, 회귀 광고 클릭률(CTR) 예측 없음(CPU만)
이미지 분류 TensorFlow 이미지 분류 모델 분류 이미지 분류 GPU, TPU
객체 감지 TensorFlow 객체 감지 API 객체 감지 복잡한 이미지 장면 내 객체 감지 GPU, TPU

알고리즘 컨테이너

AI Platform Training에 학습 작업을 제출할 때 Container Registry에서 호스팅되는 Docker 컨테이너에 URI를 지정하여 알고리즘을 선택합니다. 기본 제공 알고리즘은 다음 컨테이너를 통해 제공됩니다.

알고리즘 Container Registry URI
선형 학습자 gcr.io/cloud-ml-algos/linear_learner_cpu:latest
gcr.io/cloud-ml-algos/linear_learner_gpu:latest
와이드 앤 딥 gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest
gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest
TabNet gcr.io/cloud-ml-algos/tab_net:latest
XGBoost gcr.io/cloud-ml-algos/boosted_trees:latest
이미지 분류 gcr.io/cloud-ml-algos/image_classification:latest
객체 감지 gcr.io/cloud-ml-algos/image_object_detection:latest

다음 단계