AI Platform Data Labeling Service

Mit dem AI Platform Data Labeling Service können Sie menschliche Labelersteller für die Zuweisung von Labels zu einer Sammlung von Daten anfordern, mit denen ein benutzerdefiniertes ML-Modell trainiert werden soll.

Für das Trainieren eines ML-Modells stellen Sie repräsentative Stichproben des Inhaltstyps bereit, der klassifiziert oder analysiert werden soll. Dabei müssen Sie beispielhafte Zuordnungen hinzufügen, die dem Modell vorgeben, wie es mit einer Stichprobe verfahren soll. Wenn Sie beispielsweise ein Modell trainieren möchten, das Bilder von Blumen klassifiziert, stellen Sie eine Beispielsammlung von Bildern bereit, die mit dem Blumentyp (Sonnenblume, Gänseblümchen, Rose, Tulpe) gekennzeichnet sind. Für das Trainieren eines Modells, das die Namen von Krankheiten in medizinischen Dokumenten ermittelt, geben Sie Beispieldokumente mit markierten Krankheiten an. Das Modell lernt dann durch Extrapolation aus den Stichproben.

Mit dem Data Labeling Service können Sie die repräsentativen Stichproben an menschliche Labelersteller weitergeben, die sie mit den "richtigen Antworten" versehen und das Dataset dann in einem Format zurückgeben, das zum Trainieren eines maschinellen Lernmodells geeignet ist. Der Typ der von Ihnen bereitgestellten Beispieldaten und der Typ der Annotationen, die menschliche Labelersteller hinzufügen sollen, sind vom Typ des Modells für maschinelles Lernen abhängig, das trainiert werden soll.

Für eine Anfrage zur Labelerstellung für Daten müssen Sie drei Ressourcen für menschliche Labelersteller anlegen:

  • Ein Dataset mit den repräsentativen Stichproben, die von Labelerstellern mit Labels versehen werden sollen
  • Ein Annnotationsspezifikationssatz, der für die Labelersteller die Labels angibt, die sie auf die Elemente im Dataset anwenden sollen
  • Eine Anleitung für die Labelersteller, wie die Labels auf Ihre Daten angewendet werden sollen

Wenn Sie diese Ressourcen erstellt haben, geben Sie sie im Rahmen einer Anfrage zur Labelerstellung weiter. Die menschlichen Labelersteller annotieren dann die Elemente im Dataset gemäß Ihrer Anleitung und geben ein annotiertes Dataset zurück. Dieses Dataset können Sie anschließend exportieren und als Trainingsdaten für ein benutzerdefiniertes Modell zum maschinellen Lernen verwenden.

Hat Ihnen diese Seite weitergeholfen? Teilen Sie uns Ihr Feedback mit:

Feedback geben zu...

Data Labeling Service