Créer des instructions pour l'examen HITL

L'outil de l'outil d'étiquetage HITL fournit une interface WYSIWYG (What You See Is What You Get) qui met en correspondance les entités de document avec les étiquettes extraites, ce qui permet à l'outil d'étiquetage de comparer et de corriger facilement. Un document d'instructions est nécessaire pour indiquer aux étiqueteurs humains les étiquettes à rechercher et à ajouter, et au cas où elles seraient manquées par le modèle Document AI ou les filtres de validation de l'étiquetage avec intervention humaine. Notre offre comprend :

  • Les libellés à examiner.
  • Indique si des champs sont obligatoires ou facultatifs.
  • Toute logique métier pour :
    • Corrigez les libellés (par exemple, ajoutez "États-Unis" pour les adresses aux États-Unis qui ne le spécifient pas).
    • Refusez les documents avec le champ de refus approprié (par exemple,factures de plus de 10 000 $).
  • Noms de libellés spéciaux dans le document qui correspondent à des libellés de schéma afin que l'outil de libellé puisse les ajouter (par exemple, "Client #" = "Numéro de compte").
  • Vous pouvez les configurer en tant que filtres dans la configuration de la tâche HITL.

Concevoir des instructions de bonne qualité

Si vous espérez que votre tâche d'ajout d'étiquettes renvoie de bons résultats, vos instructions doivent être de bonne qualité. Les bonnes instructions sont celles qui indiquent aux étiqueteurs humains ce que vous attendez d'eux. Voici quelques consignes pour créer des instructions de bonne qualité:

  • Les étiqueteurs humains n'ont peut-être pas votre connaissance du domaine. Les distinctions que vous demandez aux étiqueteurs de faire doivent être faciles à comprendre pour une personne qui ne connaît pas votre cas d'utilisation.
  • Évitez de formuler des instructions trop longues. Il est préférable qu'un étiqueteur puisse les réviser et les comprendre en moins de 20 minutes.
  • Les instructions doivent décrire le concept de la tâche et donner des détails sur la manière dont les données doivent être étiquetées.
  • Si vos instructions comportent un ensemble d'étiquettes correspondant, elles doivent couvrir toutes les étiquettes de cet ensemble. Le nom de l'étiquette donné dans les instructions doit correspondre à celui donné dans l'ensemble d'étiquettes.
  • Il faut souvent plusieurs itérations avant d'arriver à créer des instructions de bonne qualité. Nous vous recommandons d'utiliser d'abord un petit ensemble de données, puis de modifier vos instructions en fonction des résultats obtenus.

Un fichier d'instructions de bonne qualité doit inclure les sections suivantes:

  • Liste et description des étiquettes: listez tous les libellés utilisés et décrivez la signification de chacun d'eux.
  • Exemples: pour chaque étiquette, donnez au moins trois exemples positifs et un exemple négatif. Ces exemples doivent couvrir différents cas.
  • Couvrez les cas spéciaux. Clarifiez autant de cas spéciaux que possible. Cela réduit la nécessité pour l'étiqueteur d'interpréter l'étiquette. Par exemple, si vous devez dessiner un cadre de délimitation pour une personne, il est préférable de préciser les points suivants :
    • S'il y a plusieurs personnes, avez-vous besoin d'un cadre pour chacune d'entre elles ?
    • Si une personne est cachée, avez-vous besoin d'un cadre ?
    • Avez-vous besoin d'un cadre pour une personne qui n'apparaît que partiellement dans l'image ?
    • Avez-vous besoin d'un cadre pour une personne figurant dans une photo ou un tableau ?
  • Indiquez comment ajouter des annotations. Par exemple :
    • Dans le cas d'un cadre de délimitation, avez-vous besoin d'un cadre restreint ou relativement large ?
    • Dans le cas d'une extraction d'entité de texte, où doit commencer et finir l'entité en question ?
  • Clarification concernant les étiquettes. Si deux étiquettes sont similaires ou faciles à confondre, donnez des exemples pour clarifier les différences.

Exemples visuels

L'exemple visuel permet aux personnes qui attribuent des étiquettes de savoir où trouver les différentes entités dans le document et comment elles se correspondent aux étiquettes extraites dans le schéma. Incluez des exemples visuels dans vos instructions, comme les suivants:

example-instruction