AI Platform Training fait partie d'un ensemble de technologies constituant une solution de machine learning. C'est pourquoi il nécessite un environnement de développement dont les prérequis et dépendances sont soigneusement configurés. Cette page décrit les éléments qui composent votre environnement de développement et les problèmes associés.
Compatibilité de la version Python
AI Platform Training fonctionne avec Python 2.7 ou Python 3.5. Vous pouvez définir la version Python à utiliser pour vos tâches d'entraînement via un fichier de configuration ou à l'aide des commandes gcloud.
La prédiction en ligne et par lot fonctionne avec des modèles entraînés, qu'ils l'aient été avec la version 2 ou 3 de Python.
Si vous avez besoin de porter votre code entre Python 2 et Python 3, vous pouvez utiliser des bibliothèques de compatibilité comme la bibliothèque six pour vous aider. La bibliothèque six est incluse par défaut dans les images d'environnement d'exécution d'AI Platform Training.
Accès root
Si vous configurez votre environnement de développement de base, vous devrez peut-être utiliser sudo
pour exécuter votre installation pip
sur macOS ou Linux. Toutefois, si vous utilisez un environnement virtuel, vous n'aurez pas besoin d'un accès root, car l'installation s'effectue en dehors des répertoires système protégés par l'OS.
Environnement d'exécution
La configuration des machines virtuelles qui exécutent le projet Google Cloud dans le cloud est définie par la version d'exécution que vous utilisez.
Environnements virtuels Python
Il peut être difficile de configurer Python, surtout si vous développez d'autres applications Python utilisant des technologies différentes sur le même ordinateur. Vous pouvez simplifier la gestion de vos packages et de vos versions en passant par un environnement virtuel pour réaliser votre développement Python.
Un environnement virtuel Python gère un interpréteur Python et des packages consacrés à votre projet qui sont isolés de l'environnement par défaut de votre ordinateur. Vous pouvez configurer des environnements virtuels distincts pour chaque projet Python sur lequel vous travaillez, chacun disposant de sa propre version de Python et des modules dont vous avez besoin.
Il existe plusieurs options pour les environnements virtuels Python. Nous vous recommandons d'utiliser Anaconda (ou sa version plus légère, Miniconda). Ces solutions incluent leur propre gestionnaire d'environnement virtuel appelé Conda. Anaconda est une suite populaire de packages et d'outils couramment utilisés par les data scientists.
Frameworks de machine learning
AI Platform Training et AI Platform Prediction sont compatibles avec les frameworks suivants :
- TensorFlow pour l'entraînement, la prédiction en ligne et la prédiction par lot. Consultez le guide dédié à l'entraînement et la prédiction avec TensorFlow Estimator sur AI Platform.
- scikit-learn et XGBoost pour l'entraînement et la prédiction en ligne. Consultez des tutoriels sur l'utilisation de scikit-learn et XGBoost avec AI Platform Training.
Compte Google Cloud Platform
Pour pouvoir utiliser les fonctionnalités cloud d'AI Platform Training, vous devez posséder un compte Google Cloud avec la facturation activée, ainsi qu'un projet avec l'API AI Platform Training and Prediction activée. Si vous débutez avec Google Cloud, lisez la présentation des projets pour plus d'informations.
Régions Cloud Compute
Les ressources de traitement sont allouées par région et par zone, en fonction des centres de données dans lesquels les ressources se situent physiquement. Vous devez généralement exécuter vos tâches ponctuelles comme l'apprentissage des modèles dans la région la plus proche de votre emplacement (ou de celui des utilisateurs si l'exécution leur est destinée). Toutefois, veuillez noter les points suivants :
Vérifiez bien les régions disponibles pour les services AI Platform Training, y compris l'entraînement de modèles sur des GPU et d'autres équipements, ainsi que la prédiction en ligne ou par lot.
Vous devez exécuter votre tâche AI Platform Training dans la même région que le bucket Cloud Storage que vous utilisez pour lire et écrire les données associées à cette tâche.
Vous devez utiliser la classe de stockage standard pour tous les buckets Cloud Storage que vous utilisez pour lire et écrire des données de votre tâche AI Platform Training.
Étapes suivantes
- Suivez le guide de démarrage pour TensorFlow Estimator sur AI Platform Training.
- Suivez le guide de démarrage rapide pour scikit-learn et XGBoost sur AI Platform Training.