Was ist überwachtes Lernen?

Überwachtes Lernen ist eine Kategorie des maschinellen Lernens, bei der mit Labels versehene Datasets verwendet werden, um Algorithmen zu trainieren, um Ergebnisse vorherzusagen und Muster zu erkennen. Anders als beim unüberwachten Lernen erhalten die Algorithmen für überwachtes Lernen ein Label-Training, um die Beziehungen zwischen Ein- und Ausgaben zu lernen. 

Überwachte Machine-Learning-Algorithmen erleichtern es Organisationen, komplexe Modelle zu erstellen, die genaue Vorhersagen treffen können. Daher sind sie in verschiedenen Branchen und Bereichen weit verbreitet, z. B. in den Bereichen Gesundheitswesen, Marketing und Finanzdienstleistungen.

Hier besprechen wir die Grundlagen des überwachten KI-Lernens, die Funktionsweise der Algorithmen für das überwachte Lernen und einige der häufigsten Anwendungsfälle.

Neukunden erhalten ein Guthaben von bis zu 300 $, um Vertex AI und andere Google Cloud-Produkte auszuprobieren. 

Wie funktioniert überwachtes Lernen?

Die beim überwachten Lernen verwendeten Daten sind mit Labels gekennzeichnet, d. h., sie enthalten Beispiele sowohl für Eingaben (Features) als auch für korrekte Ausgaben (Labels). Die Algorithmen analysieren ein großes Dataset dieser Trainingspaare, um abzuleiten, wie ein gewünschter Ausgabewert aussehen würde, wenn für neue Daten eine Vorhersage getroffen werden soll.

Nehmen wir zum Beispiel an, Sie möchten einem Modell beibringen, Bilder von Bäumen zu erkennen. Sie stellen ein Dataset mit Labels bereit, das viele verschiedene Beispiele für Baumarten und die Namen der einzelnen Arten enthält. Sie lassen den Algorithmus versuchen, anhand der mit Labels beschrifteten Ausgaben zu definieren, welche Eigenschaften zu jedem Baum gehören. Sie können das Modell dann testen, indem Sie ihm ein Baumbild zeigen und es fragen, um welche Art es sich handelt. Wenn das Modell eine falsche Antwort liefert, können Sie es weiter trainieren und seine Parameter mit weiteren Beispielen anpassen, um die Genauigkeit zu verbessern und Fehler zu minimieren.

Sobald das Modell trainiert und getestet wurde, können Sie anhand des zuvor gelernten Wissens Vorhersagen zu unbekannten Daten treffen.

Wie funktioniert überwachtes Lernen?

Die beim überwachten Lernen verwendeten Daten sind mit Labels gekennzeichnet, d. h., sie enthalten Beispiele sowohl für Eingaben (Features) als auch für korrekte Ausgaben (Labels). Die Algorithmen analysieren ein großes Dataset dieser Trainingspaare, um abzuleiten, wie ein gewünschter Ausgabewert aussehen würde, wenn für neue Daten eine Vorhersage getroffen werden soll.

Nehmen wir zum Beispiel an, Sie möchten einem Modell beibringen, Bilder von Bäumen zu erkennen. Sie stellen ein Dataset mit Labels bereit, das viele verschiedene Beispiele für Baumarten und die Namen der einzelnen Arten enthält. Sie lassen den Algorithmus versuchen, anhand der mit Labels beschrifteten Ausgaben zu definieren, welche Eigenschaften zu jedem Baum gehören. Sie können das Modell dann testen, indem Sie ihm ein Baumbild zeigen und es fragen, um welche Art es sich handelt. Wenn das Modell eine falsche Antwort liefert, können Sie es weiter trainieren und seine Parameter mit weiteren Beispielen anpassen, um die Genauigkeit zu verbessern und Fehler zu minimieren.

Sobald das Modell trainiert und getestet wurde, können Sie anhand des zuvor gelernten Wissens Vorhersagen zu unbekannten Daten treffen.

Arten von überwachtem Lernen

Das überwachte Lernen beim maschinellen Lernen wird in der Regel in zwei Kategorien unterteilt: Klassifizierung und Regression. 

Klassifizierung

Mit Klassifizierungsalgorithmen werden Daten gruppiert, indem anhand der Eingabedaten ein kategoriales Label oder eine Ausgabevariable vorhergesagt wird. Die Klassifizierung wird verwendet, wenn die Ausgabevariablen kategorial sind, d. h. es zwei oder mehr Klassen gibt.

Eines der häufigsten Beispiele für Klassifizierungsalgorithmen ist der Spamfilter in Ihrem E-Mail-Posteingang. Hier wird ein Modell für überwachtes Lernen trainiert, um vorherzusagen, ob eine E-Mail Spam ist oder nicht. Dazu wird ein Dataset verwendet, das Beispiele mit Labels für Spam und legitime E-Mails enthält. Der Algorithmus extrahiert Informationen zu jeder E-Mail, einschließlich Absender, Betreffzeile, Nachrichtentext und mehr. Anhand dieser Funktionen und der entsprechenden Ausgabelabels lernt der Algorithmus dann Muster und weist eine Bewertung zu, die angibt, ob eine E-Mail echt oder Spam ist.

Regression

Regressionsalgorithmen werden verwendet, um einen reellen oder kontinuierlichen Wert vorherzusagen, wobei der Algorithmus eine Beziehung zwischen zwei oder mehr Variablen erkennt.

Ein gängiges Beispiel für eine Regressionsaufgabe könnte die Vorhersage eines Gehalts basierend auf der Berufserfahrung sein. Einem Algorithmus für überwachtes Lernen würden beispielsweise Eingaben zur Berufserfahrung (z. B. Dauer, Branche oder Fachgebiet, Standort) und der entsprechende zugewiesene Gehaltsbetrag hinzugefügt werden. Nachdem das Modell trainiert wurde, kann es verwendet werden, um das Durchschnittsgehalt basierend auf der Berufserfahrung vorherzusagen.

Überwachtes Lernen vs. unüberwachtes Lernen

Überwachte Lernmodelle können für eine Reihe verschiedener geschäftlicher Anwendungsfälle eingesetzt werden, die eine Vielzahl von Problemen angehen. Gängige Beispiele für überwachtes Lernen:

  • Risikobewertung : Überwachte Modelle für maschinelles Lernen können Banken und anderen Finanzdienstleistungsunternehmen dabei helfen zu bestimmen, ob es für Kunden wahrscheinlich ist, dass sie Kredite in Anspruch nehmen, und so die Risiken in ihren Portfolios minimieren.
  • Bildklassifizierung : Überwachte Algorithmen für maschinelles Lernen werden oft trainiert, um Objekte in Bildern und Videos zu klassifizieren. Beispielsweise kann ein Algorithmus verwendet werden, um eine Person auf einem Bild zu erkennen und sie auf einer Social-Media-Plattform automatisch zu taggen.
  • Betrugerkennung : Überwachtes Lernen bildet die Grundlage vieler Betrugserkennungssysteme, sodass Unternehmen betrügerische Aktivitäten erkennen können. Diese Modelle werden mit Datasets trainiert, die sowohl betrügerische als auch nicht betrügerische Aktivitäten enthalten, damit sie in Echtzeit auf verdächtige Aktivitäten hinweisen können.

Empfehlungssysteme : Überwachte Lernalgorithmen werden von Onlineplattformen und Streamingdiensten verwendet, um Empfehlungen zu geben, die auf dem bisherigen Kundenverhalten oder Einkaufsverlauf basieren. Die Modelle extrahieren wichtige Informationen zum Verhalten von Nutzern und schlagen ähnliche Produkte und Inhalte vor.

Überwachtes Lernen vs. unüberwachtes Lernen

Wenn es um den Unterschied zwischen überwachtem und unüberwachtem Lernen geht, besteht der Hauptunterschied in der Art der Eingabedaten, die zum Trainieren des Modells verwendet werden. Beim überwachten Lernen werden mit Labels versehene Trainings-Datasets verwendet, um einem Modell ein bestimmtes, vordefiniertes Ziel beizubringen.  

Beim unüberwachten Lernen hingegen werden Daten ohne Label verwendet und es agiert autonom, um die Struktur der Daten zu erlernen, ohne dass explizite Anweisungen gegeben werden.

Meistern Sie Ihre geschäftlichen Herausforderungen mit Google Cloud

Neukunden erhalten ein Guthaben im Wert von 300 $ für Google Cloud.
Sprechen Sie mit einem Google Cloud-Vertriebsexperten, um Ihre besonderen Herausforderungen im Detail zu besprechen.

Gleich loslegen

Profitieren Sie von einem Guthaben über 300 $, um Google Cloud und mehr als 20 „Immer kostenlos“-Produkte kennenzulernen.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Console
Google Cloud