Kaggle と AI Platform Prediction での scikit-learn の使用

Kaggle でトレーニングされた scikit-learn モデルを AI Platform Prediction にデプロイすると、大規模な予測を提供できます。

ここでは、任意の場所(Kaggle を含む)でトレーニングされたモデルを利用し、AI Platform Prediction でオンライン予測を提供する方法の基本的なワークフローについて説明します。

概要

  1. scikit-learn モデルを Kaggle でトレーニングします。例については、こちらの scikit-learn の概要をご覧ください。また、Kaggle でノートブック カーネルを作成する方法もご覧ください。
  2. sklearn.externals.joblib ライブラリを使用してモデルを保存します。その際には、必ずファイル名を model.joblib にします。すべてのカーネルコード セルを順番に実行するには、[Commit & Run] ボタンを選択します。これにより、モデルのトレーニング コードが保存され、実行されます。

  3. カーネル出力から model.joblib をダウンロードします。

  4. Cloud Storage に model.joblib ファイルをアップロードします。

  5. Google Cloud コンソールで AI Platform Prediction のモデルとバージョンのリソースを作成し、モデルのトレーニング方法と Cloud Storage での保存場所を指定します。

  6. 予測リクエストを送信します。

Kaggle でモデルファイルを検索する

カーネルの [Output] タブからモデルファイルをダウンロードできます。

カーネルへのメインリンク(https://www.kaggle.com/[ユーザー名]/[カーネル名]/)で次の操作を行います。

  1. ページ上部にある [Output] タブを選択します。
  2. model.joblib ファイルが [Data Sources] のリストに表示されます。ファイルをダウンロードするには、[Download All] ボタンを選択します。または、モデル名にカーソルを合わせて、モデル名の横に表示されるダウンロード アイコンを選択します。

次のステップ