AI Platform Data Labeling Service ist ein Dienst, der den Verpflichtungen von Google im Zusatz zur Cloud-Datenverarbeitung unterliegt.
Mit AI Platform Data Labeling Service können Sie von menschlichen Labelerstellern hochpräzise Labels für Datensammlungen erstellen lassen, die Sie in Modellen für maschinelles Lernen verwenden können.
Das Hinzufügen von Labels zu Trainingsdaten ist der erste Schritt im Entwicklungszyklus des maschinellen Lernens. Zum Trainieren eines Modells für maschinelles Lernen stellen Sie repräsentative Datenstichproben bereit, die Sie klassifizieren oder analysieren möchten, sowie den Algorithmus für maschinelles Lernen, der jede Stichprobe verarbeitet. Wenn Sie beispielsweise ein Modell trainieren möchten, das Blumen in Bildern erkennen kann, müssen Sie im Bild-Dataset Objekte wie Sonnenblumen, Rosen und Tulpen mit Labels versehen. Für das Training eines Modells, das die Namen von Krankheiten in medizinischen Dokumenten identifizieren kann, müssen Sie im Dokument-Dataset die entsprechenden Wörter hervorheben.
Zum Starten des Daten-Labelings im AI Platform Data Labeling Service erstellen Sie drei Ressourcen für die menschlichen Labelersteller:
- Ein Dataset mit den repräsentativen Stichproben, die mit Labels versehen werden sollen
- Einen Labelsatz, der alle möglichen Labels im Dataset auflistet
- Eine Anleitung, die menschliche Labelersteller durch die Labeling-Aufgaben führt
Wenn Sie diese Ressourcen erstellt haben, reichen Sie sie mit einer Labeling-Anfrage ein. Die menschlichen Labelersteller beginnen mit der Annotierung der Elemente im Dataset gemäß Ihrer Anleitung. Wenn das Labeling durch menschliche Labelersteller abgeschlossen ist, können Sie die mit Labels versehenen Datasets exportieren und bei der Entwicklung des maschinellen Lernens verwenden.
Weitere Informationen zu den Preisen für Data Labeling Service