Einführung in integrierte Algorithmen

Diese Seite bietet eine Übersicht über das Training mit integrierten Algorithmen. Mit den integrierten Algorithmen in AI Platform Training haben Sie die Möglichkeit, Trainingsjobs für Ihre Daten auszuführen, ohne Code für eine Trainingsanwendung schreiben zu müssen. Sie senden Ihre Trainingsdaten für einen Trainingsjob und wählen einen Algorithmus aus – die Vorverarbeitung sowie das Training übernimmt dann AI Platform Training für Sie. Danach ist es sehr einfach, das Modell bereitzustellen und Vorhersagen mit AI Platform Training zu treffen.

So funktioniert das Training mit integrierten Algorithmen

Mit AI Platform Training wird der Trainingsjob auf Rechenressourcen in der Cloud ausgeführt. Hier der Gesamtprozess:

  1. Vergleichen Sie die verfügbaren integrierten Algorithmen, um festzustellen, ob sie sich für Ihr spezielles Dataset und Ihren Anwendungsfall eignen.
  2. Formatieren Sie Ihre Eingabedaten für das Training mit dem integrierten Algorithmus. Sie müssen Ihre Daten als CSV-Datei ohne Kopfzeile senden und die Zielspalte als erste Spalte festlegen. Nehmen Sie gegebenenfalls zusätzliche Formatierungen vor, die speziell für den verwendeten integrierten Algorithmus erforderlich sind.
  3. Erstellen Sie einen Cloud Storage-Bucket, in dem AI Platform Training Ihre Trainingsausgabe speichern soll, sofern noch keiner dafür vorhanden ist.
  4. Wählen Sie Optionen zum Anpassen Ihres Trainingsjobs aus. Konfigurieren Sie zuerst den Trainingsjob insgesamt und wählen Sie dann weitere Optionen speziell für den Algorithmus aus. Zum Konfigurieren der Hyperparameter-Abstimmung können Sie optional zusätzliche Optionen festlegen.
    • Wählen Sie für den Trainingsjob insgesamt Folgendes aus: einen Jobnamen, den zu verwendenden integrierten Algorithmus, die zu verwendende(n) Maschine(n), die Region, in der der Job ausgeführt werden soll, sowie den Speicherort des Cloud Storage-Buckets, in dem AI Platform Training die Trainingsausgaben speichern soll.
    • Als algorithmusspezifische Option können Sie für Ihr Dataset die automatische Vorverarbeitung durch AI Platform Training aktivieren. Außerdem haben Sie die Möglichkeit, Argumente wie die Lernrate, Trainingsschritte und Batchgröße anzugeben.
    • Zur Hyperparameter-Abstimmung können Sie einen Zielmesswert auswählen, um beispielsweise die Vorhersagegenauigkeit Ihres Modells zu maximieren oder den Trainingsverlust zu minimieren. Außerdem besteht die Möglichkeit, bestimmte Hyperparameter anzupassen und Bereiche für ihre Werte festzulegen.
  5. Senden Sie den Trainingsjob und rufen Sie Logs auf, um dessen Fortschritt und Status zu überwachen.
  6. Wenn Ihr Trainingsjob erfolgreich abgeschlossen wurde, können Sie Ihr trainiertes Modell in AI Platform Training bereitstellen, um einen Vorhersageserver einzurichten und Vorhersagen für neue Daten abzurufen.

Beschränkungen

Berücksichtigen Sie beim Training mit integrierten Algorithmen folgende Beschränkungen:

Weitere Beschränkungen für bestimmte integrierte Algorithmen sind in der jeweiligen Anleitung zum betreffenden Algorithmus aufgeführt.

Hyperparameter-Abstimmung

Die Hyperparameter-Abstimmung wird für das Training mit integrierten Algorithmen unterstützt. Legen Sie zuerst einen Zielmesswert fest und geben Sie an, ob er minimiert oder maximiert werden soll. Sie können die Modellgenauigkeit für die Klassifizierung maximieren oder den Trainingsverlust minimieren. Listen Sie dann die anzupassenden Hyperparameter und einen Zielwert für jeden Hyperparameter auf.

Wenn Sie einen Trainingsjob mit Hyperparameter-Abstimmung senden, führt AI Platform Training mehrere Tests aus, zeichnet die Hyperparameter auf und passt sie nach jedem Test an. Wenn der Job der Hyperparameter-Abstimmung abgeschlossen ist, gibt AI Platform Training die Werte für die effektivste Konfiguration der Hyperparameter sowie eine Zusammenfassung für jeden Test zurück.

Hier finden Sie weitere Informationen zur Hyperparameter-Abstimmung auf AI Platform Training.

Algorithmen im Überblick

Mithilfe integrierter Algorithmen können Sie Modelle für eine Vielzahl von Anwendungsfällen trainieren, die gewöhnlich durch Klassifizierung und Regression gelöst werden. Die folgenden integrierten Algorithmen stehen für das Training in AI Platform Training zur Verfügung:

  • Linear Learner
  • Wide and Deep
  • TabNet
  • XGBoost
  • Bildklassifizierung
  • Objekterkennung

Linear Learner

Der integrierte Linear-Learner-Algorithmus wird für die logistische Regression, die binäre Klassifizierung und die mehrklassige Klassifizierung eingesetzt. Die von AI Platform Training verwendete Implementierung basiert auf einem TensorFlow Estimator.

Ein Linear-Learner-Modell weist jedem Eingabemerkmal eine Gewichtung zu und summiert die Gewichtungen, um einen numerischen Zielwert vorherzusagen. Für die logistische Regression wird dieser Wert in einen Wert zwischen 0 und 1 umgewandelt. Dieser einfache Modelltyp ist leicht zu interpretieren, da Sie anhand eines Vergleichs der Merkmalsgewichtungen bestimmen können, welche Eingabemerkmale erhebliche Auswirkungen auf Ihre Vorhersagen haben.

Weitere Informationen zur Funktionsweise von umfangreichen linearen Modellen finden Sie hier.

Wide and Deep

Der integrierte Wide-and-Deep-Algorithmus wird für umfangreiche Klassifizierungs- und Regressionsprobleme wie Empfehlungssysteme und Suchvorgänge sowie für Rankingprobleme eingesetzt. Die von AI Platform Training verwendete Implementierung basiert auf einem TensorFlow Estimator.

Dieser Modelltyp kombiniert ein lineares Modell, das sich ein breites (wide) Spektrum von Regeln "merkt", mit einem neuronalen Deep-Learning-Netzwerk, das die Regeln "generalisiert" und korrekt auf ähnliche Merkmale in neuen, unbekannten Daten anwendet.

Weitere Informationen zum Wide-and-Deep-Learning finden Sie hier.

TabNet

Der integrierte TabNet-Algorithmus wird zur Klassifizierung und Regression von Tabellendaten verwendet. Die von AI Platform Training verwendete Implementierung basiert auf TensorFlow.

Der integrierte Algorithmus von TabNet bietet auch Featureattributionen, mit denen Sie das Verhalten des Modells interpretieren und seine Vorhersagen erklären können.

Weitere Informationen zu TabNet als neuer integrierter Algorithmus

XGBoost

XGBoost (eXtreme Gradient Boosting) ist ein Framework, das einen Gradient-Boosting-Algorithmus implementiert. XGBoost ermöglicht effizientes überwachtes Lernen für Klassifizierungs-, Regressions- und Rankingaufgaben. Das XGBoost-Training basiert auf Entscheidungsbaumgruppen, die die Ergebnisse mehrerer Klassifizierungs- und Regressionsmodelle kombinieren.

Weitere Informationen zur Funktionsweise von XGBoost finden Sie hier.

Klassifizierung von Bildern

Der integrierte Algorithmus für die Bilderkennung verwendet die TensorFlow-Bildklassifizierungsmodelle. Sie können ein Bildklassifizierungsmodell trainieren, das auf einer TensorFlow-Implementierung von EfficientNet oder ResNet basiert.

Objekterkennung

Der integrierte Algorithmus zur Objekterkennung erstellt mit der TensorFlow Object Detection API ein Modell, das mehrere Objekte in einem einzelnen Bild identifizieren kann.

Integrierte Algorithmen vergleichen

Die folgende Tabelle enthält einen kurzen Vergleich der integrierten Algorithmen:

Algorithmusname Verwendetes ML-Modell Art des Problems Mögliche Anwendungsfälle Unterstützte Beschleuniger für Training
Linear Learner TensorFlow Schätzer
LinearClassifier und LinearRegressor.
Klassifizierung, Regression Umsatzprognosen GPU
Wide and Deep TensorFlow Schätzer
DNNLinearCombinedClassifier, DNNLinearKombinierter Schätzer und DNNLinearKombiniertRegressor.
Klassifizierung, Regression, Ranking Empfehlungssysteme, Suche GPU
TabNet TensorFlow Estimator Klassifizierung, Regression Vorhersage von Werbe-Klickraten (Click-through-Rate, CTR), Betrugserkennung GPU
XGBoost XGBoost Klassifizierung, Regression Vorhersage von Werbe-Klickraten (Click-through Rates, CTR) GPU (nur von der verteilten Version des Algorithmus unterstützt)
Bildklassifizierung TensorFlow-Bildklassifizierungsmodelle Klassifizierung Klassifizierung von Bildern GPU, TPU
Objekterkennung TensorFlow Object Detection API Objekterkennung Objekte in komplexen Bildszenen erkennen GPU, TPU

Algorithmuscontainer

Wenn Sie Ihren Trainingsjob an AI Platform Training senden, geben Sie zur Auswahl des Algorithmus den URI zum jeweiligen Docker-Container an, der in Container Registry gehostet wird. Integrierte Algorithmen sind in folgenden Containern verfügbar:

Algorithmus Container Registry-URI
Linear Learner gcr.io/cloud-ml-algos/linear_learner_cpu:latest
gcr.io/cloud-ml-algos/linear_learner_gpu:latest
Wide and Deep gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest
gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest
TabNet gcr.io/cloud-ml-algos/tab_net:latest
XGBoost gcr.io/cloud-ml-algos/boosted_trees:latest
gcr.io/cloud-ml-algos/xgboost_dist:latest
Bildklassifizierung gcr.io/cloud-ml-algos/image_classification:latest
Objekterkennung gcr.io/cloud-ml-algos/image_object_detection:latest

Nächste Schritte