기본 제공 알고리즘 소개

이 페이지에서는 기본 제공 알고리즘을 사용한 학습을 간략하게 설명합니다. AI Platform에서 기본 제공 알고리즘을 사용하면 학습 애플리케이션 코드를 작성하지 않고 데이터에서 학습 작업을 실행할 수 있습니다. 학습 데이터를 제출하고 알고리즘을 선택한 후 AI Platform이 사전 처리 및 학습을 자동으로 처리하도록 할 수 있습니다. 그러면 AI Platform에서 모델을 쉽게 배포하고 예측을 수행할 수 있습니다.

기본 제공 알고리즘을 사용한 학습 수행 방법

AI Platform은 클라우드의 컴퓨팅 리소스에서 학습 작업을 실행합니다. 전체 프로세스는 다음과 같습니다.

  1. 사용 가능한 기본 제공 알고리즘을 비교하여 특정 데이터세트 및 사용 사례에 적합한지 확인합니다.
  2. 기본 제공 알고리즘을 사용한 학습의 입력 데이터 형식을 지정합니다. 데이터는 헤더 행이 삭제된 CSV 파일 형식으로 제출되어야 하며, 타겟 열이 첫 번째 열로 설정되어 있어야 합니다. 사용 중인 기본 제공 알고리즘 관련 형식 지정 추가 요구사항을 따릅니다(해당하는 경우).
  3. AI Platform이 학습 출력을 저장할 수 있는 Cloud Storage 버킷이 아직 없으면 새로 만듭니다.
  4. 학습 작업을 맞춤설정하는 옵션을 선택합니다. 먼저 전체 학습 작업을 구성하는 항목을 선택한 후 구체적으로 알고리즘을 구성하는 항목을 추가로 선택합니다. 원하는 경우 작업의 초매개변수 미세 조정을 구성하는 항목을 추가로 선택할 수 있습니다.
    • 전체 학습 작업의 경우 작업 이름, 사용할 기본 제공 알고리즘, 사용할 머신, 작업을 실행할 리전, AI Platform이 학습 출력을 저장할 Cloud Storage 버킷을 선택합니다.
    • 알고리즘별 선택 항목의 경우 AI Platform이 데이터세트를 자동으로 사전 처리하도록 사용 설정할 수 있습니다. 또한 학습률, 학습 단계, 배치 크기와 같은 인수를 지정할 수 있습니다.
    • 초매개변수 미세 조정의 경우 모델의 예측 정확도 극대화 또는 학습 손실 최소화 같은 목표 측정항목을 선택할 수 있습니다. 또한 특정 초매개변수를 미세 조정하고 해당 값의 범위를 설정할 수 있습니다.
  5. 학습 작업을 제출하고 로그를 확인하여 진행률 및 상태를 모니터링합니다.
  6. 학습 작업이 성공적으로 완료되면 AI Platform에 학습된 모델을 배포하여 예측 서버를 설정하고 새 데이터에 대한 예측을 수행할 수 있습니다.

제한사항

기본 제공 알고리즘을 사용한 학습에서는 다음과 같은 제한사항에 주의하세요.

  • 분산형 학습은 지원되지 않습니다. AI Platform에서 분산형 학습 작업을 실행하려면 학습 애플리케이션을 만들어야 합니다.
  • Google Cloud Platform Console을 통해 제출된 학습 작업은 AI Platform 머신 유형만 사용합니다. gcloud 또는 Python용 Google API 클라이언트 라이브러리를 통해 제출된 학습 작업에는 Compute Engine 머신 유형을 사용할 수 있습니다. 학습에 적합한 머신 유형에 대해 자세히 알아보세요.
  • GPU는 일부 알고리즘에서 지원됩니다. 자세한 내용은 모든 기본 제공 알고리즘 세부 비교를 참조하세요.
  • 다중 GPU 머신에 기본 제공 알고리즘 학습을 적용할 경우 속도가 빠르지 않으므로 GPU를 사용한다면 단일 GPU가 있는 머신을 선택하세요.
  • TPU는 기본 제공 알고리즘 학습에 지원되지 않습니다. 학습 애플리케이션을 만들어야 합니다. 자세한 내용은 TPU를 사용한 학습 작업 실행 방법을 참조하세요.

특정 기본 제공 알고리즘의 세부 제한사항은 알고리즘별 가이드를 참조하세요.

초매개변수 미세 조정

초매개변수 미세 조정은 기본 제공 알고리즘을 사용한 학습에서 지원됩니다. 먼저 목표 측정항목과 이를 최소화 또는 극대화할지를 지정합니다. 모델 분류 정확도를 극대화하거나 학습 손실을 최소화할 수 있습니다. 그런 다음 조정하려는 초매개변수를 각 초매개변수의 타겟 값과 함께 표시합니다.

초매개변수를 미세 조정한 학습 작업을 제출하면 AI Platform은 평가를 여러 번 실행하고 평가가 끝날 때마다 초매개변수를 추적 및 조정합니다. 초매개변수 미세 조정 작업이 완료되면 AI Platform은 가장 효과적인 초매개변수 구성 값과 각 평가 요약본을 보고합니다.

AI Platform의 초매개변수 조정에 대해 자세히 알아보세요.

알고리즘 개요

기본 제공 알고리즘은 일반적으로 분류 및 회귀로 확인된 다양한 사용 사례를 모델에 학습시키는 데 유용합니다. AI Platform에서는 다음과 같은 기본 제공 알고리즘을 학습에 사용할 수 있습니다.

  • 선형 학습자
  • 와이드 앤 딥
  • XGBoost

선형 학습자

선형 학습자 기본 제공 알고리즘은 로지스틱 회귀, 이진 분류, 다중 클래스 분류에 사용됩니다. AI Platform에서는 TensorFlow 에스티메이터 기반 구현을 사용합니다.

선형 학습자 모델은 각 입력 특성에 가중치 하나를 할당하고 가중치를 합산하여 숫자 타겟 값을 예측합니다. 로지스틱 회귀의 경우 이 값은 0과 1 사이의 값으로 변환됩니다. 이 간단한 모델 유형은 특성 가중치를 비교하여 예측에 중대한 영향을 주는 입력 특성을 확인할 수 있기 때문에 쉽게 해석할 수 있습니다.

대규모 선형 모델의 작동 방법을 자세히 알아보세요.

와이드 앤 딥

와이드 앤 딥 기본 제공 알고리즘은 추천 시스템, 검색, 순위 지정 문제와 같은 대규모 분류와 회귀 문제에 사용됩니다. AI Platform에서는 TensorFlow 에스티메이터 기반 구현을 사용합니다.

이 유형의 모델은 다양한(와이드) 규칙을 학습하고 '기억'하는 선형 모델과 이러한 규칙을 '일반화'하고 확인되지 않은 새 데이터의 비슷한 특성에 올바르게 적용하는 심층신경망을 결합합니다.

와이드 앤 딥 러닝에 대해 자세히 알아보세요.

XGBoost

XGBoost(eXtreme Gradient Boosting)는 경사 부스팅 알고리즘을 구현하는 프레임워크입니다. XGBoost는 분류, 회귀, 순위 지정 작업에 효율적인 학습 감독을 지원합니다. XGBoost 학습은 여러 분류 및 회귀 모델의 결과가 결합된 결정 트리 앙상블을 기반으로 합니다.

XGBoost 작동 방식에 대해 자세히 알아보세요.

기본 제공 알고리즘 비교

다음은 기본 제공 알고리즘을 간단히 비교한 표입니다.

알고리즘 이름 사용된 ML 모델 문제 유형 사용 사례 예 지원되는 가속기
선형 학습자 TensorFlow 에스티메이터
LinearClassifier LinearRegressor.
분류, 회귀 판매 예측 GPU
와이드 앤 딥 TensorFlow 에스티메이터
DNNLinearCombinedClassifier, DNNLinearCombinedEstimator, DNNLinearCombinedRegressor
분류, 회귀, 순위 지정 추천 시스템, 검색 GPU
XGBoost XGBoost 분류, 회귀 광고 클릭률(CTR) 예측 없음(CPU만)

알고리즘 컨테이너

AI Platform에 학습 작업을 제출할 때 Container Registry에서 호스팅되는 Docker 컨테이너에 URI를 지정하여 알고리즘을 선택합니다. 기본 제공 알고리즘은 다음 컨테이너를 통해 제공됩니다.

알고리즘 Container Registry URI
선형 학습자 gcr.io/cloud-ml-algos/linear_learner_cpu:latest
gcr.io/cloud-ml-algos/linear_learner_gpu:latest
와이드 앤 딥 gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest
gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest
XGBoost gcr.io/cloud-ml-algos/boosted_trees:latest

다음 단계

이 페이지가 도움이 되었나요? 평가를 부탁드립니다.