AI Platform Training gehört zu einer Reihe von Technologien, die zusammen eine Lösung für maschinelles Lernen ergeben, und erfordert eine Entwicklungsumgebung mit sorgfältig konfigurierten Bedingungen und Abhängigkeiten. Auf dieser Seite werden die einzelnen Komponenten Ihrer Entwicklungsumgebung und die Probleme beschrieben, die mit ihnen einhergehen.
Python-Versionsunterstützung
Mit AI Platform Training können Python 2.7 oder Python 3 ausgeführt werden. Sie können die Python-Version für Ihren Trainingsjob in einer Konfigurationsdatei oder mit gcloud-Befehlen festlegen.
Online- und Batchvorhersage verwenden trainierte Modelle, unabhängig davon, ob sie mit Python 2 oder Python 3 trainiert wurden.
Wenn Sie Ihren Code zwischen Python 2 und Python 3 portieren müssen, können Sie zur Unterstützung Kompatibilitätsbibliotheken wie six verwenden. Six ist standardmäßig in den Laufzeit-Images von AI Platform Training enthalten.
Root-Zugriff
Wenn Sie Ihre Basisentwicklungsumgebung konfigurieren, benötigen Sie unter Umständen sudo
, um Ihre pip
-Installation auf macOS oder Linux auszuführen. Wenn Sie jedoch eine virtuelle Umgebung verwenden, benötigen Sie keinen Root-Zugriff, da die Installation außerhalb von betriebssystemgeschützten Systemverzeichnissen stattfindet.
Laufzeitumgebung
Die Konfiguration der virtuellen Maschinen, auf denen das Google Cloud-Projekt in der Cloud ausgeführt wird, wird durch die verwendete Laufzeitversion bestimmt.
Virtuelle Python-Umgebungen
Die Python-Konfiguration kann kompliziert sein. Das gilt vor allem, wenn Sie andere Python-Anwendungen mit verschiedenen Technologien auf dem gleichen Rechner entwickeln. Sie können die Paket- und Versionsverwaltung vereinfachen, wenn Sie die Python-Entwicklungsarbeit in einer virtuellen Umgebung ausführen.
Eine virtuelle Python-Umgebung verwaltet einen Python-Interpreter und Pakete, die von der Standardumgebung Ihres Rechners isoliert und nur Ihrem Projekt zugeordnet sind. Sie können virtuelle Umgebungen verwenden, um verschiedene Umgebungen für jedes Ihrer aktuellen Python-Projekte zu konfigurieren, jeweils mit eigener Python-Version und den Modulen, die Sie benötigen.
Es stehen mehrere virtuelle Python-Umgebungen zur Verfügung. Wir empfehlen Anaconda oder die kleinere Version Miniconda. Diese haben einen eigenen Manager für virtuelle Umgebungen mit dem Namen Conda. Anaconda ist eine beliebte Suite von Paketen und Tools, die häufig von Data Scientists verwendet wird.
Frameworks für maschinelles Lernen
AI Platform Training und AI Platform Prediction unterstützen die folgenden Frameworks:
- TensorFlow für Training, Onlinevorhersagen und Batchvorhersage. Weitere Informationen finden Sie in der Anleitung zu Training und Vorhersage mit TensorFlow Estimator auf AI Platform.
- scikit-learn und XGBoost für Training und Onlinevorhersagen. Anleitungen finden Sie unter scikit-learn und XGBoost mit AI Platform Training verwenden.
Google Cloud Platform-Konto
Sie müssen ein Google Cloud-Konto mit aktivierter Abrechnung und ein Projekt haben, in dem die AI Platform Training and Prediction API für die Verwendung aller Cloud-Funktionen von AI Platform Training aktiviert sind. Wenn Sie Google Cloud noch nicht genutzt haben, finden Sie in der Projektübersicht weitere Informationen.
Cloud Compute-Regionen
Verarbeitungsressourcen werden nach Region und Zeitzone zugewiesen, die den Rechenzentren entsprechen, in denen sich die Ressourcen befinden. Sie sollten einmalige Jobs wie Modelltraining möglichst in der Region ausführen, die Ihrem physischen Standort (oder dem physischen Standort Ihrer Nutzer) am nächsten ist. Dabei ist Folgendes wichtig:
Berücksichtigen Sie die verfügbaren Regionen für AI Platform Training-Dienste, einschließlich Modelltraining für GPUs und andere Hardware sowie Online-/Batchvorhersagen.
Sie sollten Ihre AI Platform Training-Jobs immer in derselben Region ausführen, in der sich der Cloud Storage-Bucket befindet, mit dem Sie Daten für den Job lesen und schreiben.
Sie sollten die Klasse Standard Storage für alle Cloud Storage-Buckets verwenden, die Sie zum Lesen und Schreiben von Daten für Ihren AI Platform Training-Job verwenden.
Nächste Schritte
- Startleitfaden für TensorFlow Estimator in AI Platform Training
- Kurzanleitung für scikit-learn und XGBoost in AI Platform Training