Créer un pipeline de machine learning

Avant de pouvoir exécuter votre processus de machine learning (ML) sur AI Platform Pipelines, vous devez d'abord définir votre processus en tant que pipeline. Vous pouvez orchestrer votre processus de ML en tant que pipeline à l'aide de TensorFlow Extended (TFX) ou du SDK Kubeflow Pipelines.

Ce document fournit des conseils pour choisir la meilleure option pour créer votre pipeline, ainsi que des ressources pour démarrer.

Créer des pipelines à l'aide du SDK TFX

TFX est un projet Open Source que vous pouvez utiliser pour définir votre processus de ML en tant que pipeline. Actuellement, les composants TFX peuvent uniquement entraîner des modèles basés sur TensorFlow. TFX fournit des composants permettant d'intégrer et de transformer des données, d'entraîner et d'évaluer un modèle, de déployer un modèle entraîné d'inférence, etc. Avec le SDK TFX, vous pouvez créer un pipeline pour votre processus de ML à partir de composants TFX.

Pour commencer à créer des pipelines avec des modèles de pipeline TFX, procédez comme suit :

Créer des pipelines à l'aide du SDK Kubeflow Pipelines

Le SDK Kubeflow Pipelines est un SDK Open Source que vous pouvez utiliser pour créer des pipelines de ML personnalisés complexes basés sur des conteneurs. Vous pouvez réutiliser des composants prédéfinis ou créer des composants de pipeline personnalisés à l'aide du SDK Kubeflow Pipelines. En règle générale, vous créez des composants et des pipelines en :

  1. développant le code pour chaque étape de votre workflow en utilisant votre langage et vos outils préférés ;
  2. créant une image de conteneur Docker pour le code de chaque étape ;
  3. utilisant Python pour définir votre pipeline à l'aide du SDK Kubeflow Pipelines.

Pour commencer à créer des pipelines avec le SDK Kubeflow Pipelines :

Étape suivante