Utiliser scikit-learn sur Kaggle et AI Platform Prediction

Vous pouvez déployer des modèles scikit-learn entraînés dans Kaggle vers AI Platform pour diffuser des prédictions à grande échelle.

Cet épisode d'AI Adventures détaille le workflow de base permettant d'utiliser un modèle entraîné n'importe où, y compris sur Kaggle, et comment diffuser des prédictions en ligne sur AI Platform.

Présentation

  1. Entraînez votre modèle scikit-learn sur Kaggle. Un exemple d'entraînement est disponible dans cette présentation de scikit-learn. Découvrez comment créer un noyau de notebook sur Kaggle.
  2. Enregistrez votre modèle à l'aide de la bibliothèque sklearn.externals.joblib, en veillant à nommer le fichier model.joblib. Sélectionnez le bouton Commit & Run (Commit et exécuter) pour exécuter toutes les cellules de code du noyau dans l'ordre. Cette opération enregistre et exécute le code d'entraînement du modèle.

  3. Téléchargez model.joblib depuis les résultats de votre noyau.

  4. Importez votre fichier model.joblib dans Cloud Storage.

  5. Créez des ressources de modèle et de version sur AI Platform Prediction à l'aide de la console Google Cloud, en indiquant comment vous avez entraîné votre modèle et où vous l'avez stocké dans Cloud Storage.

  6. Envoyez une requête de prédiction.

Trouver les fichiers du modèle dans Kaggle

Vous pouvez télécharger les fichiers de votre modèle depuis l'onglet Output (Résultat) du noyau.

Depuis le lien principal du noyau, https://www.kaggle.com/[VOTRE-NOM-UTILISATEUR]/[NOM-DE-VOTRE-NOYAU]/ :

  1. Sélectionnez l'onglet Output (Résultat) en haut de la page.
  2. Le fichier model.joblib s'affiche dans la liste Data Sources (Sources de données). Pour télécharger ce fichier, sélectionnez le bouton Download All (Tout télécharger). Vous pouvez également passer la souris sur le nom du modèle, puis sélectionner l'icône de téléchargement qui s'affiche à proximité.

Étape suivante