Questions fréquentes (FAQ)

Qui ajoute des étiquettes à mes données ?
Deux de nos principaux fournisseurs sont des sous-traitants indirects officiellement intégrés conformément à notre avenant relatif au traitement des données dans le cloud (CDPA): GlobalLogic Technologies Ltd et Teleperformance Global Services. Ils sont soumis à toutes les obligations standards de sécurité et de conformité des Sous-traitants indirects définies dans l'ATDC.

Pouvez-vous m'expliquer comment vous assurez la sécurité et la protection de mes données ?
Toutes les données utilisées dans le service d'étiquetage de données AI Platform et stockées dans Google Cloud sont chiffrées par défaut. Les étiqueteurs humains ne peuvent afficher vos données que pendant l'ajout d'étiquettes. Nous ne divulguons pas vos données et ne les utilisons pas à des fins autres que celles exigées pour étiqueter vos données sans votre autorisation. Si vous supprimez les ensembles de données étiquetés par le service d'étiquetage de données, la suppression de toutes les copies des données de notre système commencera dans un délai de 24 heures. Nous mettons en œuvre des mesures de sécurité visant à empêcher la perte de données, les accès non autorisés à vos données ou les spams.

Puis-je étiqueter les données médicales ?
Oui. Le service d'étiquetage de données AI Platform est conforme à la loi HIPAA et peut être utilisé pour étiqueter les données de santé.

Quelles méthodes de contrôle qualité puis-je appliquer pour garantir la qualité de l'étiquetage ?

Vous pouvez demander à plusieurs étiqueteurs humains d'annoter chaque élément de données. En cas de désaccord sur l'étiquetage, nous demandons l'avis d'autres étiqueteurs jusqu'à ce qu'un consensus soit trouvé ou que nous ayons atteint le nombre maximal d'étiqueteurs défini.

Par exemple, si vous demandez trois étiqueteurs :

  1. Pour les tâches de classification d'images, les trois étiqueteurs doivent classer chaque image et décider à la majorité de la réponse finale.
  2. Pour les tâches associées aux cadres de délimitation des images, le premier étiqueteur dessine les cadres de délimitation et le deuxième les vérifie. Si celui-ci n'est pas d'accord et effectue des modifications, nous faisons appel au troisième étiqueteur pour obtenir une opinion majoritaire.
Les instructions influencent énormément le résultat de l'étiquetage, car elles permettent à nos étiqueteurs de comprendre comment étiqueter votre ensemble de données. Par conséquent, nous vous invitons à consulter ces conseils pour créer des instructions de qualité. Nous pouvons vous donner davantage d'informations si les instructions manquent de clarté.
Nous vous encourageons également à augmenter graduellement les tâches d'étiquetage de données. Commencez par lancer ce type de tâche sur une petite quantité de données, puis vérifiez si les résultats correspondent à vos attentes. Modifiez vos instructions en fonction des commentaires et des résultats obtenus, puis créez les tâches suivantes que vous répéterez jusqu'à ce que vous soyez prêt à envoyer de plus grandes quantités de données. Vous pourrez ainsi obtenir des résultats de haute qualité et utiliser au mieux votre budget.

Quelle différence existe-t-il entre une "tâche" et une "opération" ?
Une tâche est une action que vous effectuez à l'aide du service d'étiquetage de données, telle que l'importation et l'exportation de données, ou la demande d'étiquetage. Une opération est la tâche de longue durée effectuée par Google qui réalise la tâche que vous avez demandée via un appel d'API.

Comment savoir lorsqu'une opération (d'importation, d'exportation ou d'étiquetage) est terminée ?
Lorsque vous utilisez l'API du service d'étiquetage de données pour demander une importation, une exportation ou un étiquetage, la réponse inclut le nom de l'opération qui va effectuer la tâche demandée. Vous pouvez vérifier l'état de la demande à l'aide de ce nom.
Lorsque l'opération est en cours d'exécution, le champ progressPercent indique la progression (s'il n'est pas affiché, cela signifie que la progression est de 0 %). Une fois l'opération terminée, la réponse inclut la valeur "done": true.
Vous recevez également un e-mail chaque fois qu'une opération se termine.

Comment obtenir l'ID de l'ensemble de données annoté après avoir fait la demande d'étiquetage ?
ListAnnotatedDatasets renvoie les noms de vos ensembles de données annotés.Le format du nom est projects/sample_project_id/datasets/test_dataset_id/annotatedDatasets/sample_id et l'ID est la valeur qui apparaît après annotatedDataSets/.

Que signifie l'erreur HttpError 404 lorsqu'elle est accompagnée du message : "Les accès aux ressources demandées ne sont pas disponibles. Cette demande a été rejetée en raison d'un conflit de ressources." ?
Cela signifie qu'une autre opération en cours d'exécution utilise la ressource. Par exemple, vous pourriez obtenir cette erreur si vous demandez un étiquetage avant que l'opération d'importation des données ne soit terminée.

Pourquoi ne puis-je pas supprimer mon ensemble de données / mon instruction / ma tâche d'étiquetage ?
Il y a probablement un conflit de ressources dû au fait qu'une opération en cours d'exécution utilise la ressource.

Dois-je saisir manuellement toutes mes étiquettes une par une pour créer un ensemble d'étiquettes ?
Oui, si vous utilisez l'UI d'AI Platform Data Labeling. Si vous utilisez l'API, vous pouvez transférer autant d'arguments que vous le souhaitez de manière automatisée.

Pourquoi ma demande d'étiquetage des données du cadre de délimitation d'images est-elle renvoyée en quelques minutes sans aucune annotation ?
Le format de votre image n'est probablement pas compatible.

Cela fait déjà un moment que j'ai envoyé ma tâche d'étiquetage. Pourquoi le pourcentage de progression est-il toujours à zéro ?
Deux raisons sont possibles (vous pouvez contacter cloudml-data-customer@google.com pour en savoir plus) :
  • Votre tâche n'a pas encore été prise en compte en raison du nombre élevé de demandes. La tâche est dans une file d'attente et sera démarrée dès que possible.
  • Vous avez demandé plusieurs étiqueteurs par élément et tous les étiqueteurs n'ont pas encore étiqueté tous les éléments de données. Par exemple, si vous avez demandé trois étiqueteurs, un élément de données n'est marqué comme terminé que lorsque les trois ont terminé de l'étiqueter. Même si tous les éléments de données ont été étiquetés par un ou deux étiqueteurs, le pourcentage de progression reste à zéro.