Cette ancienne version d'AI Platform Pipelines est obsolète et ne sera plus disponible sur Google Cloud après le 31 juillet 2024. Toutes les anciennes fonctionnalités d'AI Platform Pipelines ainsi que les nouvelles sont disponibles sur la plate-forme Vertex AI. Migrez vos ressources vers Vertex AI Pipelines pour obtenir un moteur d'orchestration géré pour Kubeflow Pipelines (KFP) et de nombreuses fonctionnalités supplémentaires.

Les clusters KFP déployés sur Google Kubernetes Engine (GKE) continueront d'exister après le 31 juillet 2024. Vous pouvez y accéder via l'interface GKE. Vous pouvez déployer de nouveaux clusters KFP sur GKE via Cloud Marketplace.

Cette page a été traduite par l'API Cloud Translation.

Créer un pipeline de machine learning

Avant de pouvoir exécuter votre processus de machine learning (ML) sur AI Platform Pipelines, vous devez d'abord définir votre processus en tant que pipeline. Vous pouvez orchestrer votre processus de ML en tant que pipeline à l'aide de TensorFlow Extended (TFX) ou du SDK Kubeflow Pipelines.

Ce document fournit des conseils pour choisir la meilleure option pour créer votre pipeline, ainsi que des ressources pour démarrer.

Si vous orchestrez un processus qui entraîne un modèle TensorFlow, utilisez TFX pour créer votre pipeline.
Si vous orchestrez un processus qui entraîne un modèle à l'aide de frameworks tels que PyTorch, XGBoost et scikit-learn, utilisez le SDK Kubeflow Pipelines pour créer votre pipeline.

Créer des pipelines à l'aide du SDK TFX

TFX est un projet Open Source que vous pouvez utiliser pour définir votre processus de ML en tant que pipeline. Actuellement, les composants TFX peuvent uniquement entraîner des modèles basés sur TensorFlow. TFX fournit des composants permettant d'intégrer et de transformer des données, d'entraîner et d'évaluer un modèle, de déployer un modèle entraîné d'inférence, etc. Avec le SDK TFX, vous pouvez créer un pipeline pour votre processus de ML à partir de composants TFX.

Pour commencer à créer des pipelines avec des modèles de pipeline TFX, procédez comme suit :

Suivez le tutoriel sur les pipelines TFX surGoogle Cloud.
Pour en savoir plus sur les concepts et les composants TFX, consultez le Guide de l'utilisateur de TFX.

Créer des pipelines à l'aide du SDK Kubeflow Pipelines

Le SDK Kubeflow Pipelines est un SDK Open Source que vous pouvez utiliser pour créer des pipelines de ML personnalisés complexes basés sur des conteneurs. Vous pouvez réutiliser des composants prédéfinis ou créer des composants de pipeline personnalisés à l'aide du SDK Kubeflow Pipelines. En règle générale, vous créez des composants et des pipelines en :

développant le code pour chaque étape de votre workflow en utilisant votre langage et vos outils préférés ;
créant une image de conteneur Docker pour le code de chaque étape ;
utilisant Python pour définir votre pipeline à l'aide du SDK Kubeflow Pipelines.

Pour commencer à créer des pipelines avec le SDK Kubeflow Pipelines :

Consultez la Présentation du SDK Kubeflow Pipelines.
Pour en savoir plus sur les pipelines Kubeflow, parcourez les exemples Kubeflow Pipelines.
Réutilisez des composants prédéfinis en explorant les composants Kubeflow Pipelines sur GitHub.

Étape suivante

Apprenez à exécuter vos pipelines de ML.

Créer un pipeline de machine learning Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Créer des pipelines à l'aide du SDK TFX

Créer des pipelines à l'aide du SDK Kubeflow Pipelines

Étape suivante

Créer un pipeline de machine learning