Kaggle でトレーニングされた scikit-learn モデルを AI Platform Prediction にデプロイすると、大規模な予測を提供できます。
ここでは、任意の場所(Kaggle を含む)でトレーニングされたモデルを利用し、AI Platform Prediction でオンライン予測を提供する方法の基本的なワークフローについて説明します。
概要
- scikit-learn モデルを Kaggle でトレーニングします。例については、こちらの scikit-learn の概要をご覧ください。また、Kaggle でノートブック カーネルを作成する方法もご覧ください。
sklearn.externals.joblib
ライブラリを使用してモデルを保存します。その際には、必ずファイル名をmodel.joblib
にします。すべてのカーネルコード セルを順番に実行するには、[Commit & Run] ボタンを選択します。これにより、モデルのトレーニング コードが保存され、実行されます。カーネル出力から
model.joblib
をダウンロードします。Cloud Storage に
model.joblib
ファイルをアップロードします。Google Cloud コンソールで AI Platform Prediction のモデルとバージョンのリソースを作成し、モデルのトレーニング方法と Cloud Storage での保存場所を指定します。
予測リクエストを送信します。
Kaggle でモデルファイルを検索する
カーネルの [Output] タブからモデルファイルをダウンロードできます。
カーネルへのメインリンク(https://www.kaggle.com/[ユーザー名]/[カーネル名]/)で次の操作を行います。
- ページ上部にある [Output] タブを選択します。
model.joblib
ファイルが [Data Sources] のリストに表示されます。ファイルをダウンロードするには、[Download All] ボタンを選択します。または、モデル名にカーソルを合わせて、モデル名の横に表示されるダウンロード アイコンを選択します。
次のステップ
- Kaggle カーネルを紹介する動画を視聴し、Kaggle を使用する利点について学習する。
- AI Platform Prediction にモデルをデプロイする方法を学習する。
- Kaggle カーネルに関するドキュメントを参照する。