Kaggle 및 AI Platform Prediction에서 scikit-learn 사용

Kaggle에서 학습된 scikit-learn 모델을 AI Platform에 배포하여 예측을 대규모로 제공할 수 있습니다.

이 AI Adventures 에피소드에서는 Kaggle을 비롯한 임의의 위치에서 학습된 모델을 사용하여 AI Platform에서 온라인 예측을 제공하는 방법에 대한 기본 워크플로에 대해 설명합니다.

개요

  1. Kaggle에서 scikit-learn 모델을 학습시킵니다. scikit-learn에 대한 이 안내에서 예를 확인할 수 있습니다. Kaggle에서 노트북 커널을 만드는 방법을 참조하세요.
  2. sklearn.externals.joblib 라이브러리를 사용하여 모델을 저장합니다. 파일 이름은 model.joblib로 지정합니다. 커밋 후 실행 버튼을 선택하여 모든 커널 코드 셀을 순서대로 실행합니다. 그러면 모델 학습 코드가 저장되고 실행됩니다.

  3. 커널 출력에서 model.joblib을 다운로드합니다.

  4. model.joblib 파일을 Cloud Storage로 업로드합니다.

  5. Google Cloud 콘솔을 사용해서 모델의 학습 방법과 Cloud Storage 내 저장 위치에 대한 정보를 제공하여 AI Platform Prediction의 모델과 버전 리소스를 만듭니다.

  6. 예측 요청을 전송합니다.

Kaggle에서 모델 파일 찾기

커널의 출력 탭에서 모델 파일을 다운로드할 수 있습니다.

커널의 기본 링크 https://www.kaggle.com/[YOUR-USER-NAME]/[YOUR-KERNEL-NAME]/에서 다음 단계를 따르세요.

  1. 페이지 상단의 출력 탭을 선택합니다.
  2. model.joblib 파일이 데이터 소스 목록에 나타납니다. 이 파일을 다운로드하려면 전체 다운로드 버튼을 선택합니다. 또는 모델 이름 위로 마우스를 가져간 다음 모델 이름 옆에 표시되는 다운로드 아이콘을 선택합니다.

다음 단계