Häufig gestellte Fragen

Wer fügt meinen Daten Label hinzu?
Wir haben zwei Primäranbieter, die offiziell Unterauftragsverarbeiter gemäß unserem Zusatz zur Verarbeitung von Cloud-Daten (Global Logic Technologies Ltd) und Teleperformance Global Services sind. Sie unterliegen allen anwendbaren standardmäßigen Sicherheits- und Compliance-Verpflichtungen von Unterauftragsverarbeitern, die in den CDPA festgelegt sind.

Können Sie mir Informationen zur Sicherheit und zum Schutz meiner Daten geben?
Alle Daten, die in AI Platform Data Labeling Service verwendet und in Google Cloud gespeichert werden, sind standardmäßig verschlüsselt. Menschliche Labelersteller können Ihre Daten nur während der Labelerstellung sehen. Wir verwenden Ihre Daten ausschließlich für die angeforderte Datenlabelerstellung und zu keinem anderen Zweck, es sei denn, Sie stimmen dieser Nutzung ausdrücklich zu. Wenn Sie die vom Dienst zur Datenlabelerstellung mit Labels versehenen Datasets löschen, wird innerhalb von 24 Stunden damit begonnen, alle Kopien Ihrer Daten aus unserem System zu löschen. Wir implementieren Sicherheitsmaßnahmen, um Datenverlust, unberechtigten Zugriff und Spam zu verhindern.

Kann ich Gesundheitsdaten mit Labels versehen?
Ja, der AI Platform Data Labeling Service ist HIPAA-konform und kann zum Kennzeichnen von Gesundheitsdaten verwendet werden.

Welche Methoden zur Qualitätskontrolle kann ich verwenden, um die Qualität der Labels zu gewährleisten?

Sie können mehrere menschliche Labelersteller anfordern, die alle Ihre Daten mit Anmerkungen versehen. Wenn es Meinungsverschiedenheiten in Bezug auf die Labels gibt, holen wir von den anderen Labelerstellern eine Meinung ein, bis ein Konsens besteht oder die von Ihnen festgelegte maximale Anzahl von Labelerstellern erreicht ist.

Angenommen, Sie fordern drei Labelersteller an:

  1. Bei der Klassifizierung von Bildern bewerten alle drei Labelersteller jedes einzelne Bild, um dann die endgültige Antwort nach dem Mehrheitsprinzip auszuwählen.
  2. Bei Aufgaben mit Bildbegrenzungsrahmen zeichnet der erste Labelersteller die Rahmen und der zweite Labelersteller prüft diese. Wenn der zweite Labelersteller nicht einverstanden ist und Änderungen vornimmt, wird der dritte Labelersteller hinzugezogen, um eine Mehrheitsmeinung zu erhalten.
Für die Erstellung der Labels ist eine Anleitung sehr wichtig, da sie unseren Labelerstellern mitteilt, wie sie Ihre Datasets mit Labels versehen sollen. Wir empfehlen Ihnen daher, sich die Tipps zur Erstellung guter Anleitungen anzusehen. Wenn die Anleitung unklar ist, informieren wir Sie gegebenenfalls.
Darüber hinaus sollten Sie den Umfang Ihrer Jobs zur Erstellung von Datenlabels schrittweise steigern. Vergeben Sie Ihren ersten Job zur Labelerstellung mit einer kleinen Datenmenge und warten Sie ab, ob die Ergebnisse Ihren Erwartungen entsprechen. Überarbeiten Sie Ihre Anleitung entsprechend dem Feedback und den Ergebnissen, die Sie erhalten haben. Wiederholen Sie dies, bis Sie zufrieden sind, bevor Sie Jobs mit größeren Datenmengen senden. So erzielen Sie qualitativ hochwertige Ergebnisse und nutzen Ihr Budget optimal.

Was ist der Unterschied zwischen einer "Aufgabe" und einem "Vorgang"?
Eine Aufgabe ist eine Aktion, die Sie mit Data Labeling Service ausführen, z. B. das Importieren und Exportieren von Daten oder das Senden von Anfragen zur Labelerstellung. Ein Vorgang ist ein Google-Job mit langer Ausführungszeit, der die Aufgabe erledigt, die Sie über einen API-Aufruf angefordert haben.

Woher weiß ich, wann ein Vorgang (Import, Export oder Labelerstellung) abgeschlossen ist?
Wenn Sie über die Data Labeling Service API einen Import, einen Export oder eine Labelerstellung anfordern, enthält die Antwort den Namen des Vorgangs, der die Aufgabe ausführt. Sie können mit dem Vorgangsnamen den Status der Anfrage ermitteln.
Während der Ausführung des Vorgangs wird der Fortschritt im Feld progressPercent angegeben. Wenn das Feld nicht angezeigt wird, liegt der Fortschritt bei 0 %. Wenn der Vorgang abgeschlossen ist, enthält die Antwort den Wert "done": true.
Sie erhalten außerdem eine E-Mail, wenn ein Vorgang beendet ist.

Wie erhalte ich die ID des mit Anmerkungen versehenen Datasets, nachdem ich eine Labelerstellung angefordert habe?
ListAnnotatedDatasets gibt die Namen Ihrer mit Anmerkungen versehenen Datasets zurück. Das Format des Namens ist projects/sample_project_id/datasets/test_dataset_id/annotatedDatasets/sample_id. Die ID ist der Wert, der nach annotatedDataSets/ angezeigt wird.

Was bedeutet es, wenn ein "HttpError 404" mit einer Meldung angezeigt wird wie: "Die angeforderten Zugriffe auf Ressourcen sind nicht verfügbar. Diese Anfrage wird aufgrund eines Ressourcenkonflikts abgelehnt."?
In diesem Fall wird die Ressource von einem anderen laufenden Vorgang beansprucht. Dieser Fehler kann beispielsweise auftreten, wenn Sie eine Labelerstellung anfordern, bevor der Importvorgang abgeschlossen ist.

Warum kann ich meine Dataset-/Anleitungs-/Labelerstellungsaufgabe nicht löschen?
Wahrscheinlich liegt ein Ressourcenkonflikt vor und die Ressource wird von einem laufenden Vorgang beansprucht.

Muss ich alle Labels einzeln manuell eingeben, um einen Labelsatz zu erstellen?
Ja, wenn Sie die AI Platform Data Labeling Service-UI verwenden. Wenn Sie die API verwenden, können Sie programmatisch beliebig viele Argumente weiterleiten.

Warum wird meine Anfrage zur Labelerstellung für ein Bild mit Begrenzungsrahmen schon nach wenigen Minuten beendet und die Ausgabe enthält keine Annotationen?
Wahrscheinlich wird das Bildformat nicht unterstützt.

Warum liegt der Fortschritt immer noch bei 0 %, obwohl meine Labelerstellungsaufgabe bereits vor einiger Zeit gesendet wurde?
Zwei mögliche Gründe (weitere Informationen erhalten Sie von cloudml-data-customer@google.com):
  • Ihre Aufgabe wurde aufgrund einer großen Anzahl von Anfragen noch nicht für die Ausführung ausgewählt. Die Aufgabe befindet sich in der Warteschlange und wird so bald wie möglich gestartet.
  • Sie haben mehrere Labelersteller pro Element angefordert und es haben noch nicht alle Labelersteller den Datenelementen Labels hinzugefügt. Wenn Sie beispielsweise drei Labelersteller anfordern, wird ein Datenelement erst dann als erledigt markiert, wenn alle drei Labelersteller ihre Labels festgelegt haben. In diesem Fall bleibt der Fortschritt bei 0 %, auch wenn ein oder zwei Labelersteller bereits alle Datenelemente mit Labels versehen haben.