在 Kaggle 和 AI Platform Prediction 上使用 scikit-learn

您可以将使用 Kaggle 训练的 scikit-learn 模型部署到 AI Platform Prediction,以便大规模提供预测服务。

AI 精彩旅程系列的这一篇介绍了基本的工作流,如何将在任意地方(包括 Kaggle)训练的模型用于从 AI Platform Prediction 中提供在线预测服务。

概览

  1. 在 Kaggle 上训练 scikit-learn 模型。您可以在这篇关于 scikit-learn 的介绍中查看示例。 了解如何在 Kaggle 上创建笔记本内核
  2. 使用 sklearn.externals.joblib保存模型,并确保将文件命名为 model.joblib。点击提交和运行按钮,按顺序执行所有内核代码单元。此操作会保存并运行您的模型训练代码。

  3. 从内核输出中下载 model.joblib

  4. model.joblib 文件上传到 Cloud Storage。

  5. 使用 Google Cloud 控制台在 AI Platform Prediction 上创建模型和版本资源,并提供有关您如何训练模型以及您在 Cloud Storage 的何处存储模型的信息。

  6. 发送预测请求。

在 Kaggle 中找到模型文件

您可以从内核的输出标签页下载模型文件。

访问内核的主链接 https://www.kaggle.com/[YOUR-USER-NAME]/[YOUR-KERNEL-NAME]/,执行以下操作:

  1. 选择页面顶部的输出标签页。
  2. model.joblib 文件会显示在数据源列表中。如需下载该文件,请点击下载全部按钮。或者,将鼠标悬停在模型名称上,然后点击模型名称旁边的下载图标。

后续步骤