Tabellarische Daten – Übersicht

Vertex AI ermöglicht es Ihnen, maschinelles Lernen mit tabellarischen Daten über einfache Prozesse und Schnittstellen durchzuführen. Sie können die folgenden Modelltypen für Ihre tabellarischen Datenprobleme erstellen:

  • Binärklassifizierungsmodelle sagen ein binäres Ergebnis vorher (eine von zwei Klassen). Verwenden Sie diesen Modelltyp für Ja- oder Nein-Fragen. Beispiel: Sie können ein binäres Klassifizierungsmodell erstellen, um vorherzusagen, ob ein Kunde ein Abo erwerben würde. Im Allgemeinen erfordert ein binäres Klassifizierungsproblem weniger Daten als andere Modelltypen.
  • Klassifizierungsmodelle mit mehreren Klassen sagen eine Klasse aus drei oder mehr gesonderten Klassen vorher. Verwenden Sie diesen Modelltyp für die Kategorisierung. Beispiel: Als Einzelhändler möchten Sie ein Klassifizierungsmodell mit mehreren Klassen erstellen, um Kunden in verschiedene Personen zu unterteilen.
  • Regressionsmodelle sagen einen kontinuierlichen Wert voraus. Beispiel: Als Einzelhändler möchten Sie ein Regressionsmodell erstellen, um vorherzusagen, wie viel ein Kunde im nächsten Monat ausgeben wird.
  • Prognosemodelle sagen eine Folge von Werten vorher. Beispiel: Als Einzelhändler möchten Sie die tägliche Nachfrage Ihrer Produkte für die nächsten drei Monate prognostizieren, damit Sie Inventarbestände im Voraus rechtzeitig planen können.

Eine Einführung in das maschinelle Lernen mit tabellarischen Daten finden Sie unter Einführung in tabellarische Daten. Weitere Informationen zu Vertex AI-Lösungen finden Sie unter Vertex AI-Lösungen für Klassifizierung und Regression und Vertex AI-Lösungen für Prognosen.

Hinweis zur Fairness

Google setzt auf den Fortschritt bei verantwortungsbewussten KI-Praktiken. Unsere ML-Produkte einschließlich AutoML basieren deshalb auf Kernprinzipien wie Fairness und menschzentriertem maschinellem Lernen. Weitere Informationen zu Best Practices für die Minderung von Verzerrungen beim Erstellen eines eigenen ML-Systems finden Sie in der Anleitung zu inklusivem ML – AutoML.

Vertex AI-Lösungen für Klassifizierung und Regression

Vertex AI bietet die folgenden Lösungen für Klassifizierung und Regression:

Tabellarischer Workflow für End-to-End-AutoML

Tabellarischer Workflow für End-to-End-AutoML ist eine vollständige AutoML-Pipeline für Klassifizierungs- und Regressionsaufgaben. Sie ähnelt der AutoML API, Sie können jedoch auswählen, was Sie steuern möchten und was automatisiert werden soll. Statt Steuerelemente für die gesamte Pipeline haben Sie Steuerelemente für jeden Schritt in der Pipeline. Folgende Steuerelemente der Pipeline sind verfügbar:

  • Datenaufteilung
  • Feature Engineering
  • Architektursuche
  • Modelltraining
  • Modellsortierung
  • Modelldestillation

Vorteile

  • Unterstützt große Datasets mit mehreren TB und bis zu 1.000 Spalten.
  • Ermöglicht die Verbesserung der Stabilität und niedrigere Trainingszeit, indem der Suchbereich der Architekturtypen begrenzt wird oder die Architektursuche übersprungen wird.
  • Ermöglicht die Verbesserung der Trainingsgeschwindigkeit durch manuelle Auswahl der Hardware für das Training und die Architektursuche.
  • Ermöglicht die Reduzierung der Modellgröße und die Verbesserung der Latenz mit der Destillation oder durch Ändern der Ensemblegröße.
  • Jede AutoML-Komponente kann in einer leistungsstarken Benutzeroberfläche für Pipelinediagramme überprüft werden, auf der Sie die transformierten Datentabellen, bewerteten Modellarchitekturen und viele weitere Details sehen können.
  • AutoML-Komponenten bieten erweiterte Flexibilität und Transparenz. So können Sie beispielsweise Parameter anpassen, Hardware auswählen, den Prozessstatus und Logs aufrufen und vieles mehr.

Weitere Informationen zu tabellarischen Workflows finden Sie unter Tabellarische Workflows in Vertex AI. Weitere Informationen zum tabellarischen Workflow für End-to-End-AutoML finden Sie unter Tabellarischer Workflow für End-to-End-AutoML.

Tabellarischer Workflow für TabNet

Tabellarischer Workflow für TabNet ist eine Pipeline, mit der Sie Klassifizierungs- oder Regressionsmodelle trainieren können. TabNet verwendet sequenzielle Aufmerksamkeit, um die Features auszuwählen, die bei jedem Entscheidungsschritt berücksichtigt werden sollen. Dadurch werden Interpretierbarkeit und effizientes Lernen ermöglicht, da die Lernkapazität für die wichtigsten Features verwendet wird.

Vorteile

  • Wählt automatisch den entsprechenden Hyperparameter-Suchbereich anhand der Dataset-Größe, dem Vorhersagetyp und dem Trainingsbudget aus.
  • In Vertex AI eingebunden. Das trainierte Modell ist ein Vertex AI-Modell. Sie können sofort Batchvorhersagen ausführen oder das Modell für Onlinevorhersagen bereitstellen.
  • Bietet inhärente Modellinterpretierbarkeit. Sie erhalten einen Einblick in die Features, die TabNet für seine Entscheidung verwendet hat.
  • Unterstützt GPU-Training.

Weitere Informationen zu tabellarischen Workflows finden Sie unter Tabellarische Workflows in Vertex AI. Weitere Informationen zum tabellarischen Workflow für TabNet finden Sie unter Tabellarischer Workflow für TabNet.

Tabellarischer Workflow für Wide & Deep

Tabellarischer Workflow für Wide & Deep ist eine Pipeline, mit der Sie Klassifizierungs- oder Regressionsmodelle trainieren können. Wide & Deep trainiert gemeinsam breite lineare Modelle und neuronale Deep-Learning-Netzwerke. Sie vereint die Vorteile von Speicherung und Generalisierung. Bei einigen Online-Experimenten zeigten die Ergebnisse, dass Wide & Deep die Anwendungsgewinnung im Google Store im Vergleich zu reinen und tiefgehenden Modellen erheblich erhöht hat.

Vorteile

  • In Vertex AI eingebunden. Das trainierte Modell ist ein Vertex AI-Modell. Sie können sofort Batchvorhersagen ausführen oder das Modell für Onlinevorhersagen bereitstellen.

Weitere Informationen zu tabellarischen Workflows finden Sie unter Tabellarische Workflows in Vertex AI. Weitere Informationen zum tabellarischen Workflow für Wide & Deep finden Sie unter Tabellarischer Workflow für Wide & Deep.

Klassifizierung und Regression mit AutoML

Vertex AI bietet integrierte, vollständig verwaltete Pipelines für End-to-End-Klassifizierungs- oder Regressionsaufgaben. Vertex AI sucht nach dem optimalen Satz von Hyperparametern, trainiert mehrere Modelle mit mehreren Sets von Hyperparametern und erstellt dann ein einzelnes endgültiges Modell aus einem Ensemble der besten Modelle. Vertex AI berücksichtigt neuronale Netzwerke und Boosted Trees für die Modelltypen.

Vorteile

  • Nutzerfreundliche Anwendung: Modelltyp, Modellparameter und Hardware werden für Sie ausgewählt.

Weitere Informationen finden Sie unter Übersicht über Klassifizierung und Regression.

Vertex AI-Lösungen für Prognosen

Vertex AI bietet die folgenden Lösungen für Prognosen:

Tabellarischer Workflow für Prognosen

Der tabellarische Workflow für Prognosen ist die vollständige Pipeline für Prognoseaufgaben. Sie ähnelt der AutoML API, Sie können jedoch auswählen, was Sie steuern möchten und was automatisiert werden soll. Statt Steuerelemente für die gesamte Pipeline haben Sie Steuerelemente für jeden Schritt in der Pipeline. Folgende Steuerelemente der Pipeline sind verfügbar:

  • Datenaufteilung
  • Feature Engineering
  • Architektursuche
  • Modelltraining
  • Modellsortierung

Vorteile

  • Unterstützt große Datasets mit bis zu 1 TB und bis zu 200 Spalten.
  • Ermöglicht die Verbesserung der Stabilität und niedrigere Trainingszeit, indem der Suchbereich der Architekturtypen begrenzt wird oder die Architektursuche übersprungen wird.
  • Ermöglicht die Verbesserung der Trainingsgeschwindigkeit durch manuelle Auswahl der Hardware für das Training und die Architektursuche.
  • Bei einigen Modelltrainingsmethoden können Sie die Modellgröße verringern und die Latenz verbessern, indem Sie die Ensemblegröße ändern.
  • Jede Komponente kann in einer leistungsstarken Benutzeroberfläche für Pipelinediagramme überprüft werden, auf der Sie die transformierten Datentabellen, bewerteten Modellarchitekturen und viele weitere Details sehen können.
  • Alle Komponenten bieten erweiterte Flexibilität und Transparenz. So können Sie beispielsweise Parameter anpassen, Hardware auswählen, den Prozessstatus und Logs aufrufen und vieles mehr.

Weitere Informationen zu tabellarischen Workflows finden Sie unter Tabellarische Workflows in Vertex AI. Weitere Informationen zum tabellarischen Workflow für Prognosen finden Sie unter Tabellarischer Workflow für Prognosen.

Prognosen mit AutoML

Vertex AI bietet eine integrierte, vollständig verwaltete Pipeline für End-to-End-Prognoseaufgaben. Vertex AI sucht nach dem optimalen Satz von Hyperparametern, trainiert mehrere Modelle mit mehreren Sets von Hyperparametern und erstellt dann ein einzelnes endgültiges Modell aus einem Ensemble der besten Modelle. Sie können zwischen Zeitreihen-Dense-Encoder (TiDE), Temporal Fusion Transformer (TFT), AutoML (L2L) oder Seq2Seq+ für Ihre Modelltrainingsmethode wählen. Vertex AI berücksichtigt nur neuronale Netzwerke für den Modelltyp.

Vorteile

  • Nutzerfreundliche Anwendung: Modellparameter und Hardware werden für Sie ausgewählt.

Weitere Informationen finden Sie unter Übersicht über Prognosen.

Prognosen mit BigQuery ML ARIMA_PLUS

BigQuery ML ARIMA_PLUS ist ein univariates Prognosemodell. Als statistisches Modell ist es schneller zu trainieren als ein Modell, das auf neuronalen Netzwerken basiert. Wir empfehlen, ein BigQuery ML ARIMA_PLUS-Modell zu trainieren, wenn Sie viele schnelle Iterationen der Modellschulung durchführen müssen oder wenn Sie eine kostengünstige Referenz benötigen, an der Sie andere Modelle messen können.

Wie Prophet versucht BigQuery ML ARIMA_PLUS, jede Zeitreihe in Trends, Jahreszeiten und Feiertage zu unterteilen, um aus der Aggregation der Vorhersagen dieser Modelle eine Prognose zu erstellen. Einer der vielen Unterschiede besteht darin, dass BQML ARIMA+ die Trendkomponente mit ARIMA modelliert, während Prophet versucht, eine Kurve in einem abschnittsweise logistischen oder linearen Modell anzupassen.

Google Cloud bietet eine Pipeline zum Trainieren eines BigQuery ML-ARIMA_PLUS-Modells und eine Pipeline zum Abrufen von Batchvorhersagen aus einem BigQuery ML-ARIMA_PLUS-Modell. Beide Pipelines sind Instanzen von Vertex AI Pipelines aus den Google Cloud-Pipeline-Komponenten (GCPC).

Vorteile

  • Nutzerfreundliche Anwendung: Modellparameter und Hardware werden für Sie ausgewählt.
  • Schnell: Das Modelltraining bietet eine kostengünstige Referenz zum Vergleich anderer Modelle.

Weitere Informationen finden Sie unter Prognosen mit ARIMA+ erstellen.

Prognosen mit Prophet

Prophet ist ein von Meta verwaltetes Prognosemodell. Weitere Informationen zu Algorithmen finden Sie im Prophet-Artikel. In der Dokumentation finden Sie weitere Informationen zur Bibliothek.

Wie BigQuery ML ARIMA_PLUS versucht Prophet, jede Zeitreihe in Trends, Jahreszeiten und Feiertage zu unterteilen, um aus der Aggregation der Vorhersagen dieser Modelle eine Prognose zu erstellen. Ein wichtiger Unterschied ist, dass BQML ARIMA+ die Trendkomponente mit ARIMA modelliert, während Prophet versucht, eine Kurve in einem abschnittsweise logistischen oder linearen Modell anzupassen.

Google Cloud bietet eine Pipeline zum Trainieren eines Prophet-Modells und eine Pipeline zum Abrufen von Batchvorhersagen aus einem BigQuery Prophet-Modell. Beide Pipelines sind Instanzen von Vertex AI Pipelines aus den Google Cloud-Pipeline-Komponenten (GCPC).

Die Einbindung von Prophet in Vertex AI bedeutet, dass Sie Folgendes tun können:

  • Sie können die Datenaufteilung und Windowing-Strategien von Vertex AI nutzen.
  • Sie können Daten aus BigQuery-Tabellen oder CSV-Dateien lesen, die in Cloud Storage gespeichert sind. Vertex AI erwartet, dass jede Zeile das Format hat, das auch für Vertex AI Forecasting verwendet wird.

Obwohl Prophet ein multivariates Modell ist, unterstützt Vertex AI nur eine univariate Version.

Vorteile

  • Flexibel: Sie können die Trainingsgeschwindigkeit verbessern, indem Sie die für das Training verwendete Hardware auswählen.

Weitere Informationen finden Sie unter Prognosen mit Prophet erstellen.

Nächste Schritte