Kaggle と Cloud ML Engine での scikit-learn の使用

Kaggle でトレーニングされる scikit-learn モデルを Cloud ML Engine にデプロイすると、大規模な予測を提供できます。

この AI Adventures のエピソードでは、任意の場所(Kaggle を含む)でトレーニングされたモデルを利用し、Cloud ML Engine でオンライン予測を提供する方法に関する基本的なワークフローについて説明します。

概要

  1. scikit-learn モデルを Kaggle でトレーニングします。例については、こちらの scikit-learn の概要をご覧ください。また、Kaggle で Notebook カーネルを作成する方法をご覧ください。
  2. sklearn.externals.joblib ライブラリを使用してモデルを保存します。その際には、必ずファイル名を model.joblib にします。すべてのカーネルコード セルを順番に実行するには、[Commit & Run] ボタンを選択します。これにより、モデルのトレーニング コードが保存され、実行されます。
  3. カーネル出力から model.joblib をダウンロードします。
  4. model.joblib ファイルを Cloud Storage にアップロードします。
  5. GCP Console を使用してモデルとバージョンのリソースを Cloud ML Engine に作成し、モデルをトレーニング方法と Cloud Storage 内でのモデルの保存場所に関する情報を入力します。
  6. 予測リクエストを送信します。

Kaggle でモデルファイルを検索する

カーネルの [Output] タブからモデルファイルをダウンロードできます。

カーネルへのメインリンク(https://www.kaggle.com/[ユーザー名]/[カーネル名]/)で次の操作を行います。

  1. ページ上部にある [Output] タブを選択します。
  2. model.joblib ファイルが [Data Sources] のリストに表示されます。ファイルをダウンロードするには、[Download All] ボタンを選択します。または、モデル名にカーソルを合わせて、モデル名の横に表示されるダウンロード アイコンを選択します。

次のステップ

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

scikit-learn と XGBoost の Cloud ML Engine