Einführung in integrierte Algorithmen

Diese Seite bietet eine Übersicht über das Training mit integrierten Algorithmen. Mit den integrierten Algorithmen in AI Platform haben Sie die Möglichkeit, Trainingsjobs für Ihre Daten auszuführen, ohne Code für eine Trainingsanwendung schreiben zu müssen. Sie können für einen Trainingsjob Ihre Trainingsdaten senden, einen Algorithmus auswählen und dann die Vorverarbeitung sowie das Training mit AI Platform ausführen. Danach ist es ganz einfach, das Modell bereitzustellen und Vorhersagen mit AI Platform zu treffen.

Funktionsweise des Trainings mit integrierten Algorithmen

Mit AI Platform wird der Trainingsjob mit Rechenressourcen in der Cloud ausgeführt. Im Folgenden ist der komplette Vorgang dafür aufgeführt:

  1. Vergleichen Sie die verfügbaren integrierten Algorithmen, um festzustellen, ob sie sich für Ihr spezielles Dataset und Ihren Anwendungsfall eignen.
  2. Formatieren Sie Ihre Eingabedaten für das Training mit dem integrierten Algorithmus. Sie müssen Ihre Daten als CSV-Datei ohne Kopfzeile senden und die Zielspalte als erste Spalte festlegen. Nehmen Sie gegebenenfalls zusätzliche Formatierungen vor, die speziell für den verwendeten integrierten Algorithmus erforderlich sind.
  3. Erstellen Sie einen Cloud Storage-Bucket, in dem AI Platform Ihre Trainingsergebnisse speichern soll, sofern noch keiner dafür vorhanden ist.
  4. Wählen Sie Optionen zum Anpassen Ihres Trainingsjobs aus. Konfigurieren Sie zuerst den Trainingsjob insgesamt und wählen Sie dann weitere Optionen speziell für den Algorithmus aus. Optional können Sie zur Konfiguration der Hyperparameter-Abstimmung für Ihren Job zusätzliche Optionen festlegen.
    • Wählen Sie für den Trainingsjob insgesamt Folgendes aus: einen Jobnamen, den zu verwendenden integrierten Algorithmus, die zu verwendende(n) Maschine(n), die Region, in der der Job ausgeführt werden soll, sowie den Speicherort des Cloud Storage-Buckets, in dem AI Platform die Trainingsausgaben speichern soll.
    • Als algorithmusspezifische Option können Sie für Ihr Dataset die automatische Vorverarbeitung durch AI Platform aktivieren. Außerdem haben Sie die Möglichkeit, Argumente etwa für Lernrate, Trainingsschritte und Batchgröße anzugeben.
    • Zur Hyperparameter-Abstimmung können Sie einen Zielmesswert auswählen, um beispielsweise die Vorhersagegenauigkeit Ihres Modells zu maximieren oder den Trainingsverlust zu minimieren. Außerdem besteht die Möglichkeit, bestimmte Hyperparameter anzupassen und Bereiche für ihre Werte festzulegen.
  5. Senden Sie den Trainingsjob und rufen Sie Logs auf, um dessen Fortschritt und Status zu überwachen.
  6. Wenn Ihr Trainingsjob erfolgreich abgeschlossen wurde, können Sie Ihr trainiertes Modell in AI Platform bereitstellen, um einen Vorhersageserver einzurichten und Vorhersagen für neue Daten abzurufen.

Beschränkungen

Berücksichtigen Sie beim Training mit integrierten Algorithmen folgende Beschränkungen:

  • Ein verteiltes Training wird nicht unterstützt. Zur Ausführung eines verteilten Trainingsjobs in AI Platform müssen Sie eine Trainingsanwendung erstellen.
  • Für Trainingsjobs, die über die Google Cloud Platform Console gesendet werden, lassen sich nur AI Platform-Maschinentypen verwenden. Wenn Sie Trainingsjobs über gcloud oder die Google APIs-Clientbibliothek für Python senden, können Sie dafür Compute Engine-Maschinentypen nutzen. Weitere Informationen zu Maschinentypen für das Training finden Sie hier.
  • GPUs werden für einige Algorithmen unterstützt. Weitere Informationen finden Sie im detaillierten Vergleich aller integrierten Algorithmen.
  • Maschinen mit mehreren GPUs erzielen beim Training mit integrierten Algorithmen keine höhere Geschwindigkeit. Wählen Sie bei Verwendung von GPUs Maschinen mit einer einzigen GPU aus.
  • TPUs werden für das Training mit integrierten Algorithmen nicht unterstützt. Sie müssen in diesem Fall eine Trainingsanwendung erstellen. Hier erfahren Sie, wie Sie einen Trainingsjob mit TPUs ausführen.

Weitere Beschränkungen für bestimmte integrierte Algorithmen sind in der jeweiligen Anleitung zum betreffenden Algorithmus aufgeführt.

Hyperparameter-Abstimmung

Die Hyperparameter-Abstimmung wird für das Training mit integrierten Algorithmen unterstützt. Legen Sie zuerst einen Zielmesswert fest und geben Sie an, ob er minimiert oder maximiert werden soll. Sie können die Modellgenauigkeit für die Klassifizierung maximieren oder den Trainingsverlust minimieren. Listen Sie dann die anzupassenden Hyperparameter und einen Zielwert für jeden Hyperparameter auf.

Wenn Sie einen Trainingsjob mit Hyperparameter-Abstimmung senden, führt AI Platform mehrere Tests aus, zeichnet die Hyperparameter auf und passt sie nach jedem Test an. Wenn der Job der Hyperparameter-Abstimmung abgeschlossen ist, gibt AI Platform die Werte für die effektivste Konfiguration der Hyperparameter sowie eine Zusammenfassung für jeden Test zurück.

Weitere Informationen zur Hyperparameter-Abstimmung auf AI Platform.

Algorithmen im Überblick

Mithilfe integrierter Algorithmen können Sie Modelle für eine Vielzahl von Anwendungsfällen trainieren, die gewöhnlich durch Klassifizierung und Regression gelöst werden. Die folgenden integrierten Algorithmen stehen für das Training in AI Platform zur Verfügung:

  • Linear Learner
  • Wide and Deep
  • XGBoost

Linear Learner

Der integrierte Linear-Learner-Algorithmus wird für die logistische Regression, die binäre Klassifizierung und die mehrklassige Klassifizierung eingesetzt. Die von AI Platform verwendete Implementierung basiert auf einem TensorFlow Estimator.

Ein Linear-Learner-Modell weist jedem Eingabemerkmal eine Gewichtung zu und summiert die Gewichtungen für die Vorhersage eines numerischen Zielwerts. Für die logistische Regression wird dieser Wert in einen Wert zwischen 0 und 1 umgewandelt. Dieser einfache Modelltyp ist leicht zu interpretieren, da Sie anhand eines Vergleichs der Merkmalsgewichtungen bestimmen können, welche Eingabemerkmale erhebliche Auswirkungen auf Ihre Vorhersagen haben.

Weitere Informationen zur Funktionsweise von umfangreichen linearen Modellen finden Sie hier.

Wide and Deep

Der integrierte Wide-and-Deep-Algorithmus wird für umfangreiche Klassifizierungs- und Regressionsaufgaben etwa für Empfehlungssysteme und Suchvorgänge sowie für Rankingaufgaben eingesetzt. Die von AI Platform verwendete Implementierung basiert auf einem TensorFlow Estimator.

Dieser Modelltyp kombiniert ein lineares Modell, das sich ein breites (wide) Spektrum von Regeln "merkt", mit einem neuronalen Deep-Learning-Netzwerk, das die Regeln "generalisiert" und korrekt auf ähnliche Merkmale in neuen, unbekannten Daten anwendet.

Weitere Informationen zum Wide-and-Deep-Learning finden Sie hier.

XGBoost

XGBoost (eXtreme Gradient Boosting) ist ein Framework, das einen Gradient-Boosting-Algorithmus implementiert. XGBoost ermöglicht effizientes überwachtes Lernen für Klassifizierungs-, Regressions- und Rankingaufgaben. Das XGBoost-Training basiert auf Entscheidungsbaumgruppen, die die Ergebnisse mehrerer Klassifizierungs- und Regressionsmodelle kombinieren.

Weitere Informationen zur Funktionsweise von XGBoost finden Sie hier.

Integrierte Algorithmen vergleichen

Die folgende Tabelle enthält einen kurzen Vergleich der integrierten Algorithmen:

Algorithmusname Verwendetes ML-Modell Art des Problems Mögliche Anwendungsfälle Unterstützte Beschleuniger
Linear Learner TensorFlow Estimator
LinearClassifier und LinearRegressor
Klassifizierung, Regression Umsatzprognosen GPU
Wide and Deep TensorFlow Estimator
DNNLinearCombinedClassifier, DNNLinearCombinedEstimator und DNNLinearCombinedRegressor
Klassifizierung, Regression, Ranking Empfehlungssysteme, Suche GPU
XGBoost XGBoost Klassifizierung, Regression Vorhersage von Werbe-Klickraten (Click-through Rates, CTR) Keine (nur CPU)

Algorithmuscontainer

Wenn Sie Ihren Trainingsjob an AI Platform senden, geben Sie zur Auswahl des Algorithmus den URI zum jeweiligen Docker-Container an, der in der Container Registry gehostet wird. Integrierte Algorithmen sind in folgenden Containern verfügbar:

Algorithmus Container Registry-URI
Linear Learner gcr.io/cloud-ml-algos/linear_learner_cpu:latest
gcr.io/cloud-ml-algos/linear_learner_gpu:latest
Wide and Deep gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest
gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest
XGBoost gcr.io/cloud-ml-algos/boosted_trees:latest

Weitere Informationen

Hat Ihnen diese Seite weitergeholfen? Teilen Sie uns Ihr Feedback mit: