Diese Seite bietet eine Übersicht über das Training mit integrierten Algorithmen. Mit den integrierten Algorithmen in AI Platform Training haben Sie die Möglichkeit, Trainingsjobs für Ihre Daten auszuführen, ohne Code für eine Trainingsanwendung schreiben zu müssen. Sie senden Ihre Trainingsdaten für einen Trainingsjob und wählen einen Algorithmus aus – die Vorverarbeitung sowie das Training übernimmt dann AI Platform Training für Sie. Danach ist es sehr einfach, das Modell bereitzustellen und Vorhersagen mit AI Platform Training zu treffen.
So funktioniert das Training mit integrierten Algorithmen
Mit AI Platform Training wird der Trainingsjob auf Rechenressourcen in der Cloud ausgeführt. Hier der Gesamtprozess:
- Vergleichen Sie die verfügbaren integrierten Algorithmen, um festzustellen, ob sie sich für Ihr spezielles Dataset und Ihren Anwendungsfall eignen.
- Wenn ja, wählen Sie den integrierten Algorithmus aus, der Ihre Anforderungen am besten erfüllt.
- Wenn keine integrierten Algorithmen geeignet sind, haben Sie die Möglichkeit, eine Trainingsanwendung zur Ausführung in AI Platform Training zu erstellen.
- Formatieren Sie Ihre Eingabedaten für das Training mit dem integrierten Algorithmus. Sie müssen Ihre Daten als CSV-Datei ohne Kopfzeile senden und die Zielspalte als erste Spalte festlegen. Nehmen Sie gegebenenfalls zusätzliche Formatierungen vor, die speziell für den verwendeten integrierten Algorithmus erforderlich sind.
- Erstellen Sie einen Cloud Storage-Bucket, in dem AI Platform Training Ihre Trainingsausgabe speichern soll, sofern noch keiner dafür vorhanden ist.
- Wählen Sie Optionen zum Anpassen Ihres Trainingsjobs aus. Konfigurieren Sie zuerst den Trainingsjob insgesamt und wählen Sie dann weitere Optionen speziell für den Algorithmus aus. Zum Konfigurieren der Hyperparameter-Abstimmung können Sie optional zusätzliche Optionen festlegen.
- Wählen Sie für den Trainingsjob insgesamt Folgendes aus: einen Jobnamen, den zu verwendenden integrierten Algorithmus, die zu verwendende(n) Maschine(n), die Region, in der der Job ausgeführt werden soll, sowie den Speicherort des Cloud Storage-Buckets, in dem AI Platform Training die Trainingsausgaben speichern soll.
- Als algorithmusspezifische Option können Sie für Ihr Dataset die automatische Vorverarbeitung durch AI Platform Training aktivieren. Außerdem haben Sie die Möglichkeit, Argumente wie die Lernrate, Trainingsschritte und Batchgröße anzugeben.
- Zur Hyperparameter-Abstimmung können Sie einen Zielmesswert auswählen, um beispielsweise die Vorhersagegenauigkeit Ihres Modells zu maximieren oder den Trainingsverlust zu minimieren. Außerdem besteht die Möglichkeit, bestimmte Hyperparameter anzupassen und Bereiche für ihre Werte festzulegen.
- Senden Sie den Trainingsjob und rufen Sie Logs auf, um dessen Fortschritt und Status zu überwachen.
- Wenn Ihr Trainingsjob erfolgreich abgeschlossen wurde, können Sie Ihr trainiertes Modell in AI Platform Training bereitstellen, um einen Vorhersageserver einzurichten und Vorhersagen für neue Daten abzurufen.
Beschränkungen
Berücksichtigen Sie beim Training mit integrierten Algorithmen folgende Beschränkungen:
- Verteiltes Training wird nicht unterstützt. Für die Ausführung eines verteilten Trainingsjobs in AI Platform Training müssen Sie eine Trainingsanwendung erstellen.
- Für Trainingsjobs, die über die Google Cloud Console gesendet werden, können nur Legacy-Maschinentypen verwendet werden. Wenn Sie Trainingsjobs über
gcloud
oder die Google APIs-Clientbibliothek für Python senden, können Sie auch Compute Engine-Maschinentypen nutzen. Weitere Informationen zu Maschinentypen für das Training finden Sie hier. - GPUs werden für einige Algorithmen unterstützt. Weitere Informationen finden Sie im detaillierten Vergleich aller integrierten Algorithmen.
- Maschinen mit mehreren GPUs erzielen beim Training mit integrierten Algorithmen keine höhere Geschwindigkeit. Wählen Sie bei Verwendung von GPUs Maschinen mit einer einzigen GPU aus.
- TPUs werden für das tabellarische Training mit integrierten Algorithmen nicht unterstützt. Sie müssen in diesem Fall eine Trainingsanwendung erstellen. Hier erfahren Sie, wie Sie einen Trainingsjob mit TPUs ausführen.
Weitere Beschränkungen für bestimmte integrierte Algorithmen sind in der jeweiligen Anleitung zum betreffenden Algorithmus aufgeführt.
Hyperparameter-Abstimmung
Die Hyperparameter-Abstimmung wird für das Training mit integrierten Algorithmen unterstützt. Legen Sie zuerst einen Zielmesswert fest und geben Sie an, ob er minimiert oder maximiert werden soll. Sie können die Modellgenauigkeit für die Klassifizierung maximieren oder den Trainingsverlust minimieren. Listen Sie dann die anzupassenden Hyperparameter und einen Zielwert für jeden Hyperparameter auf.
Wenn Sie einen Trainingsjob mit Hyperparameter-Abstimmung senden, führt AI Platform Training mehrere Tests aus, zeichnet die Hyperparameter auf und passt sie nach jedem Test an. Wenn der Job der Hyperparameter-Abstimmung abgeschlossen ist, gibt AI Platform Training die Werte für die effektivste Konfiguration der Hyperparameter sowie eine Zusammenfassung für jeden Test zurück.
Hier finden Sie weitere Informationen zur Hyperparameter-Abstimmung auf AI Platform Training.
Algorithmen im Überblick
Mithilfe integrierter Algorithmen können Sie Modelle für eine Vielzahl von Anwendungsfällen trainieren, die gewöhnlich durch Klassifizierung und Regression gelöst werden. Die folgenden integrierten Algorithmen stehen für das Training in AI Platform Training zur Verfügung:
- Linear Learner
- Wide and Deep
- TabNet
- XGBoost
- Bildklassifizierung
- Objekterkennung
Linear Learner
Der integrierte Linear-Learner-Algorithmus wird für die logistische Regression, die binäre Klassifizierung und die mehrklassige Klassifizierung eingesetzt. Die von AI Platform Training verwendete Implementierung basiert auf einem TensorFlow Estimator.
Ein Linear-Learner-Modell weist jedem Eingabemerkmal eine Gewichtung zu und summiert die Gewichtungen, um einen numerischen Zielwert vorherzusagen. Für die logistische Regression wird dieser Wert in einen Wert zwischen 0 und 1 umgewandelt. Dieser einfache Modelltyp ist leicht zu interpretieren, da Sie anhand eines Vergleichs der Merkmalsgewichtungen bestimmen können, welche Eingabemerkmale erhebliche Auswirkungen auf Ihre Vorhersagen haben.
Weitere Informationen zur Funktionsweise von umfangreichen linearen Modellen finden Sie hier.
Wide and Deep
Der integrierte Wide-and-Deep-Algorithmus wird für umfangreiche Klassifizierungs- und Regressionsprobleme wie Empfehlungssysteme und Suchvorgänge sowie für Rankingprobleme eingesetzt. Die von AI Platform Training verwendete Implementierung basiert auf einem TensorFlow Estimator.
Dieser Modelltyp kombiniert ein lineares Modell, das sich ein breites (wide) Spektrum von Regeln "merkt", mit einem neuronalen Deep-Learning-Netzwerk, das die Regeln "generalisiert" und korrekt auf ähnliche Merkmale in neuen, unbekannten Daten anwendet.
Weitere Informationen zum Wide-and-Deep-Learning finden Sie hier.
TabNet
Der integrierte TabNet-Algorithmus wird zur Klassifizierung und Regression von Tabellendaten verwendet. Die von AI Platform Training verwendete Implementierung basiert auf TensorFlow.
Der integrierte Algorithmus von TabNet bietet auch Featureattributionen, mit denen Sie das Verhalten des Modells interpretieren und seine Vorhersagen erklären können.
Weitere Informationen zu TabNet als neuer integrierter Algorithmus
XGBoost
XGBoost (eXtreme Gradient Boosting) ist ein Framework, das einen Gradient-Boosting-Algorithmus implementiert. XGBoost ermöglicht effizientes überwachtes Lernen für Klassifizierungs-, Regressions- und Rankingaufgaben. Das XGBoost-Training basiert auf Entscheidungsbaumgruppen, die die Ergebnisse mehrerer Klassifizierungs- und Regressionsmodelle kombinieren.
Weitere Informationen zur Funktionsweise von XGBoost finden Sie hier.
Klassifizierung von Bildern
Der integrierte Algorithmus für die Bilderkennung verwendet die TensorFlow-Bildklassifizierungsmodelle. Sie können ein Bildklassifizierungsmodell trainieren, das auf einer TensorFlow-Implementierung von EfficientNet oder ResNet basiert.
Objekterkennung
Der integrierte Algorithmus zur Objekterkennung erstellt mit der TensorFlow Object Detection API ein Modell, das mehrere Objekte in einem einzelnen Bild identifizieren kann.
Integrierte Algorithmen vergleichen
Die folgende Tabelle enthält einen kurzen Vergleich der integrierten Algorithmen:
Algorithmusname | Verwendetes ML-Modell | Art des Problems | Mögliche Anwendungsfälle | Unterstützte Beschleuniger für Training |
---|---|---|---|---|
Linear Learner | TensorFlow Schätzer LinearClassifier und LinearRegressor. |
Klassifizierung, Regression | Umsatzprognosen | GPU |
Wide and Deep | TensorFlow Schätzer DNNLinearCombinedClassifier, DNNLinearKombinierter Schätzer und DNNLinearKombiniertRegressor. |
Klassifizierung, Regression, Ranking | Empfehlungssysteme, Suche | GPU |
TabNet | TensorFlow Estimator | Klassifizierung, Regression | Vorhersage von Werbe-Klickraten (Click-through-Rate, CTR), Betrugserkennung | GPU |
XGBoost | XGBoost | Klassifizierung, Regression | Vorhersage von Werbe-Klickraten (Click-through Rates, CTR) | GPU (nur von der verteilten Version des Algorithmus unterstützt) |
Bildklassifizierung | TensorFlow-Bildklassifizierungsmodelle | Klassifizierung | Klassifizierung von Bildern | GPU, TPU |
Objekterkennung | TensorFlow Object Detection API | Objekterkennung | Objekte in komplexen Bildszenen erkennen | GPU, TPU |
Algorithmuscontainer
Wenn Sie Ihren Trainingsjob an AI Platform Training senden, geben Sie zur Auswahl des Algorithmus den URI zum jeweiligen Docker-Container an, der in Container Registry gehostet wird. Integrierte Algorithmen sind in folgenden Containern verfügbar:
Algorithmus | Container Registry-URI |
---|---|
Linear Learner |
gcr.io/cloud-ml-algos/linear_learner_cpu:latest gcr.io/cloud-ml-algos/linear_learner_gpu:latest
|
Wide and Deep |
gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest
|
TabNet |
gcr.io/cloud-ml-algos/tab_net:latest |
XGBoost |
gcr.io/cloud-ml-algos/boosted_trees:latest gcr.io/cloud-ml-algos/xgboost_dist:latest
|
Bildklassifizierung |
gcr.io/cloud-ml-algos/image_classification:latest
|
Objekterkennung |
gcr.io/cloud-ml-algos/image_object_detection:latest
|
Nächste Schritte
- Mehr darüber erfahren, wie AI Platform Training die Daten für das Training mit integrierten Algorithmen vorverarbeitet
- Einstiegsanleitung für das Training mit integrierten Algorithmen