Trainingsmethode auswählen

In diesem Thema werden die wichtigsten Unterschiede zwischen dem Trainieren eines Modells in Vertex AI mit AutoML oder dem benutzerdefinierten Training und dem Trainieren eines Modells mit BigQuery ML erläutert.

Mit AutoML erstellen und trainieren Sie Modelle mit minimalem technischen Aufwand. Sie können mit AutoML schnell Prototypen von Modellen erstellen und neue Datasets untersuchen, bevor Sie in die Entwicklung investieren. Sie können damit beispielsweise ermitteln, welche Features für ein bestimmtes Dataset am besten geeignet sind.

Mit benutzerdefiniertem Training können Sie eine Trainingsanwendung erstellen, die für Ihr Ziel optimiert wurde. Sie haben volle Kontrolle über die Funktionalität der Trainingsanwendung. Sie können beliebige Ziele festlegen, beliebige Algorithmen verwenden, eigene Verlustfunktionen oder -messwerte entwickeln oder andere Anpassungen vornehmen.

Mit BigQuery ML können Sie Modelle unter Einsatz Ihrer BigQuery-Daten direkt in BigQuery trainieren. Mit SQL-Befehlen können Sie schnell ein Modell erstellen und damit Batchvorhersagen erhalten.

In der folgenden Tabelle finden Sie einen Vergleich zu den unterschiedlichen Funktionen und den erforderlichen Kenntnissen für jeden Dienst.

AutoML Benutzerdefiniertes Training BigQuery ML
Erforderliches Data-Science-Fachwissen Nein Ja, um die Trainingsanwendung zu entwickeln und auch, um einen Teil der Datenvorbereitung wie Feature Engineering durchzuführen. Nein.
Programmierkenntnisse erforderlich Nein, AutoML ist codelos. Ja, um die Trainingsanwendung zu entwickeln. SQL-Programmierkentnisse sind zum Erstellen, Evaluieren und Verwenden des Modells in BigQuery ML erforderlich.
Zeit bis zum trainierten Modell Weniger. Es ist weniger Datenvorbereitung erforderlich und es ist keine Entwicklung erforderlich. Höher. Mehr Datenvorbereitung ist erforderlich und die Entwicklung von Trainingsanwendungen ist erforderlich. Weniger. Die Geschwindigkeit der Modellentwicklung wird erhöht, da Sie die für Batchvorhersagen oder das Modelltraining erforderliche Infrastruktur nicht erstellen müssen, da BigQuery ML das BigQuery-Rechensystem nutzt. Dies erhöht die Geschwindigkeit von Training, Bewertung und Vorhersage.
Grenzwerte für Ziele für maschinelles Lernen Ja, Sie müssen eines der vordefinierten AutoML-Ziele festlegen. Nein Ja.
Kann die Modellleistung manuell mit Hyperparameter-Abstimmung optimieren Nein. AutoML führt Schritte einer automatischen Hyperparameter-Abstimmung aus, aber Sie können die verwendeten Werte nicht ändern. Ja. Sie können das Modell während jedes Trainingslaufs optimieren, um zu experimentieren und Vergleiche anzustellen. Ja. BigQuery ML unterstützt die Hyperparameter-Abstimmung beim Trainieren von ML-Modellen über `CREATE MODEL`-Anweisungen.
Kann Aspekte der Trainingsumgebung steuern Begrenzt. Bei Image- und tabellarischen Datasets können Sie die Anzahl der Knotenstunden für das Training angeben und ob die vorzeitige Beendigung des Trainings erlaubt werden soll. Ja. Sie können Aspekte der Umgebung angeben, z. B. den Compute Engine-Maschinentyp, die Laufwerksgröße, das Framework für maschinelles Lernen und die Anzahl der Knoten. Nein.
Limits bei der Datengröße

Ja. AutoML verwendet verwaltete Datasets. Das Daten-Größenlimit hängt vom Typ des Datasets ab. Weitere Informationen finden Sie unter folgenden Themen:

Nicht für nicht verwaltete Datasets. Verwaltete Datasets haben dieselben Limits wie verwaltete Dataset-Objekte, die von Vertex AI erstellt und gehostet werden, und zum Trainieren von AutoML-Modellen verwendet. Ja. In BigQuery ML werden geeignete Kontingente pro Projekt festgelegt. Weitere Informationen finden Sie unter Kontingente und Limits.

Nächste Schritte