Notes de version
Version de décembre 2022
Outil de configuration HITL
L'onglet "Configuration" sous "Human-In-The-Loop" est désormais présenté sous la forme d'une paire d'étapes ordonnées pour faciliter et structurer l'expérience de configuration. L'utilisateur peut désormais afficher des étapes distinctes pour configurer les paramètres liés au pool de spécialistes et aux filtres pour déclencher l'HITL, et sélectionner les instructions et l'emplacement des résultats pour les spécialistes.
Version d'octobre 2022
Tableau de bord d'analyse des demandes HITL
Human in the Loop dispose désormais d'un onglet dédié, appelé Analytics, qui fournit à l'utilisateur des métriques et des graphiques pour analyser l'état des tâches HITL par processeur et apporter des modifications si nécessaire.
Actuellement, l'utilisateur peut afficher trois métriques différentes. Les données peuvent être agrégées à l'aide d'un sélecteur de période qui propose les options suivantes à l'utilisateur :
Pour chaque période sélectionnée, l'utilisateur peut consulter les informations suivantes:
- Statistiques agrégées: vue instantanée du nombre total de documents importés dans la file d'attente, du nombre total de documents traités (envoyés et refusés) par les spécialistes, et du temps écoulé depuis l'ajout du document le plus ancien dans la file d'attente pour la période sélectionnée.
- Graphique d'activité human-in-the-loop (avec intervention humaine) : graphique montrant les données de série temporelle pour les dates d'ajout des documents à la file d'attente (
enqueuedDocumentCount
) et de traitement des documents par les spécialistes (completedDocumentCount
). - Taux de déclenchement human-in-the-loop (avec intervention humaine) : graphique représentant les données de série temporelle du pourcentage de documents importés ayant déclenché l'examen human-in-the-loop (avec intervention humaine) au cours de la période sélectionnée.
Version de septembre 2022
Remarque: Les clients qui utilisent Document AI Workbench, les processeurs de bons de commande (BP), de factures et de dépenses ont accès à un nouveau schéma qui leur permet de libeller des cases à cocher (si elles sont définies dans le schéma) et de représenter avec précision les entités imbriquées, c'est-à-dire la relation parent-enfant dans l'interface utilisateur d'annotation et d'examen HITL. À mesure que davantage de processeurs adopteront le nouveau schéma, ces notes de version seront mises à jour en conséquence.
Entité imbriquée
- L'interface utilisateur d'annotation accepte désormais le libellé des entités imbriquées. Le panneau de gauche a été actualisé avec un nouveau look pour les lignes imbriquées afin de représenter les entités imbriquées. La valeur de "parent" est la concaténation de tous ses "enfants".
- La sélection d'entités dans le panneau de gauche affiche les libellés parent et enfant.
- Le menu des libellés d'entités dans le document est également actualisé pour prendre en charge le libellé d'entités imbriquées.
- Cliquez sur une étiquette imbriquée pour afficher une boîte de dialogue permettant d'attribuer l'entité parente appropriée à l'entité enfant imbriquée.
Case à cocher
- L'UI d'annotation est compatible avec les cases à cocher d'étiquetage. Dans le panneau de gauche, la case à cocher peut être modifiée dans la ligne.
- La modification des cases à cocher est également disponible dans la boîte de dialogue de modification de l'entité.
Version d'août 2022
Sélection de l'étiquette de l'entité
- La saisie du libellé de l'entité est remplacée par une liste déroulante. Cette liste déroulante contient les options de libellé disponibles lorsque vous ajoutez une entité. Cette modification permet d'éviter aux personnes qui ajoutent des libellés de faire des fautes de frappe et de créer des libellés d'entité indésirables.
Format de date ISO
- Les dates normalisées sont affichées au format ISO 8601(AAAA-MM-JJ).
Version de juillet 2022
Bouton de confirmation rapide
- Un bouton de confirmation est disponible dans les info-bulles des entités pour examiner et confirmer rapidement une valeur d'entité/de libellé. Le bouton "Modifier" a été supprimé, car les utilisateurs peuvent cliquer directement sur l'info-bulle de l'entité pour la modifier.
Version de janvier 2022
Options de libellé d'entité
- Les options de sélection des libellés d'entité sont désormais limitées à la liste des champs filtrés(définie dans la configuration du filtre HITL).
Champs manquants
- Nous affichons désormais les champs manquants (c'est-à-dire les champs marqués comme "Obligatoire" dans la configuration du filtre HITL, mais pour lesquels le processeur n'a pas prédit de valeurs) en rouge vif, ce qui permet à l'examinateur de modifier facilement la valeur du champ.
Échantillons complets aléatoires
- Nous proposons désormais un examen complet (c'est-à-dire toutes les entités du document, et non seulement les champs filtrés) d'un échantillon aléatoire (par exemple, 2% du volume quotidien) de documents. Cela permet de surveiller la dérive du modèle et les données analytiques sur la précision du processeur dans chaque champ. Nous collectons ces données analytiques, qui nous aident à savoir quand un nouvel entraînement est nécessaire. Il sert également d'ensemble de données avec une vérité terrain étiquetée pour l'entraînement des modèles.
- Les clients peuvent activer l'échantillonnage aléatoire et définir son intervalle [1 à 10%] en fonction de leur volume. Il est recommandé de cibler entre 100 et 500 échantillons par semaine. Par exemple, si le client traite 10 000 documents par semaine, vous pouvez définir cette valeur sur 500/10 000 = 5 %.
Configuration simplifiée du modèle HITL pour les nouveaux utilisateurs
- Nous avons simplifié la configuration de l'HITL BYOL pour les clients qui utilisent ce service pour la première fois. Ils peuvent ainsi configurer rapidement une tâche, attribuer des spécialistes et la lancer à partir d'un seul écran. Ils peuvent ainsi l'essayer rapidement avant d'augmenter le volume de production ou d'externaliser l'opération.
- Comme illustré dans la capture d'écran ci-dessous, l'utilisateur devient le gestionnaire par défaut du pool et peut ajouter d'autres spécialistes, qui sont tous automatiquement affectés à la tâche dans le même écran.
- Auparavant, le gestionnaire désigné recevait un lien par e-mail vers la console du gestionnaire, où il pouvait ajouter des spécialistes et leur attribuer la tâche.
- Une fois la tâche envoyée, il (et les autres spécialistes désignés) peut accéder à l'application HITL pour examiner les documents.
- L'utilisateur peut également importer un document de test (un par un) dans la file d'attente de tâches.
Supprimer le séparateur de ligne final
- Les séparateurs de ligne à la fin('\n') sont supprimés dans entity.mentionText.
Version de décembre 2021
Trier les entités dont le score de confiance est faible en haut
- Les entités ayant un score de confiance faible (c'est-à-dire celles qui sont en dessous du seuil de confiance) sont désormais triées en haut de la page, ce qui permet au spécialiste de se concentrer sur ces entités. Cela améliore encore l'efficacité de l'étiquetage.
Instructions facultatives pour les tâches BYOL
- Les instructions PDF à importer pour configurer une tâche HITL sont désormais facultatives. Cela simplifie les tests et les lancements internes rapides, où les spécialistes n'ont pas besoin d'un guide d'instructions.
Options "Ajuster à la largeur" et "Ajuster à la hauteur de la page"
- Bouton permettant d'adapter la page à la largeur ou à la hauteur. Cette fonctionnalité est utile lorsque les documents de taille variable (par exemple, des reçus) sont associés à une tâche.
Nom de la tâche affiché dans l'interface utilisateur du spécialiste
- Le nom de la tâche est désormais affiché dans l'interface utilisateur du spécialiste pour lui fournir des informations supplémentaires sur la tâche et le type de document, ce qui est très utile lorsqu'il est affecté à plusieurs tâches.
- Notez que cette information s'affiche dans les nouveaux processeurs lancés après cette version.
Champ de recherche pour les spécialistes
- Les spécialistes peuvent rechercher des entités/du texte dans les documents. Cela est particulièrement utile pour les documents volumineux et multipages, et améliore la productivité des spécialistes.
Version de septembre 2021
Activez/désactivez l'option pour afficher tous les champs.
- Les libelleurs peuvent être amenés à examiner et à mettre à jour des champs qui ne figurent pas dans l'ensemble d'entités filtrées pour des documents spécifiques de la file d'attente. Vous pouvez activer ou désactiver l'option Afficher toutes les prédictions pour permettre aux annoteurs d'examiner les champs non filtrés.
HITL pour l'analyseur de formulaires
- HITL est désormais compatible avec l'analyseur de formulaires. Les utilisateurs peuvent ainsi examiner et corriger les paires clé-valeur extraites par l'analyseur de formulaires. Le client peut activer le modèle HITL sur le processeur d'analyse de formulaires de la plate-forme DocAI et configurer les noms de clés (comme indiqué dans la capture d'écran ci-dessous) qu'il souhaite filtrer pour l'examen HITL. La sortie de l'examen HITL est générée sous forme de fichiers JSON dans le bucket Google Cloud Storage spécifié par le client une fois l'examen terminé.
- Ils peuvent spécifier d'autres noms de clé séparés par une virgule, par exemple "client, nom du client, client, n° de compte, numéro de compte" afin que le filtre HITL détecte les documents contenant toutes les variantes de nom de clé et les envoie pour examen par HITL.
Version d'août 2021
Pipeline d'audit/de contrôle qualité
- HITL permet désormais d'effectuer une deuxième étape de contrôle qualité ou d'audit, et indique l'exactitude des tâches d'examen (et des libellés). Une équipe de contrôle qualité ou un auditeur peuvent être désignés comme "lecteur expert" pour une tâche. L'équipe d'assurance qualité/l'auditeur reçoit X % (par exemple, entre 1 et 100 %) des documents examinés. Ce paramètre est configurable par le client. L'auditeur peut corriger le résultat du réviseur. Le système suit les corrections et attribue un score de précision (par exemple, 90%) à chaque document audité. Le score de justesse agrégé d'une tâche ou d'un étiqueteur est indiqué dans les tableaux de bord Analytics des tâches et des étiqueteurs, respectivement.
- Pour obtenir des instructions détaillées sur la configuration d'un pipeline d'audit, consultez cette page.
- Désigner un auditeur
- Exactitude des rapports
Analyseurs IA pour les prêts (15 août)
- La technologie HITL est désormais compatible avec certains analyseurs d'IA de prêt, y compris les formulaires 1040, 1040 Schedule E, 1040 Schedule C, 1099 DIV, 1099 G, 1099 INT, 1099 MISC, les bulletins de paie, les relevés bancaires, les formulaires W2, W9, 1120, 1120S, 1065, SSA-1099, 1099 NEC et 1099-R.
Version de juillet 2021
Files d'attente standards et urgentes (2 juillet)
- Nous acceptons désormais deux files d'attente prioritaires (contre une seule auparavant) pour chaque processeur, en fonction de l'urgence de chaque document.
- Envoi : après la prédiction, l'urgence des documents extraits peut être évaluée et envoyée dans deux files d'attente (standard ou urgente/rapide) en fonction de leur urgence. Par exemple, vous pouvez ajouter les factures dont la date d'échéance est urgente à la file d'attente prioritaire. La logique qui évalue l'urgence se trouve actuellement en dehors de HITL et peut être une fonction personnalisée.
- Attribution de tâches : le gestionnaire de libellé voit deux files d'attente différentes avec des priorités différentes, comme illustré dans la capture d'écran ci-dessous. Il peut attribuer le même groupe de libelleurs aux deux files d'attente.
- Priorisation des tâches : les étiqueteurs affectés aux deux tâches traiteront toujours d'abord les documents en attente de la file d'attente prioritaire avant de traiter la file d'attente standard (c'est-à-dire que la priorité de la file d'attente est gérée automatiquement par le système)
- Appel d'API : définir le champ priority dans ReviewDocument
- Capture d'écran de l'UI (des tâches dans l'UI du gestionnaire de libellés) :
Version de juin 2021
Filtres de validation pour le point de terminaison HITL (24 juin)
- Les filtres de validation (configurés dans le processeur) qui filtrent les champs en fonction du score de confiance pour déterminer les documents à mettre en file d'attente pour examen manuel sont désormais également appliqués aux documents envoyés au point de terminaison HITL.
- Lorsque vous appelez l'API ReviewDocument, définissez le champ enable_schema_validation sur "true".
- Notez que si cette valeur est définie et que la validation détermine que le document n'a pas besoin de déclencher un examen manuel, une erreur "CANCELLED" (ANNULÉ) est renvoyée.
API Cancel
Le client peut annuler un document mis en file d'attente pour le traitement HITL en appelant l'API Cancel pour un ID d'opération donné. Un ID d'opération est renvoyé pour chaque document envoyé à HITL.
`POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
Type de facture (examen de la classification)
- L'outil de travail de l'outil d'étiquetage permet d'examiner la classification du type de facture.
Rapport sur le temps d'attente (SLO de latence HITL)
- Un rapport indique le nombre de documents en file d'attente pendant plus de 18 heures et plus de 24 heures. Cette option est utile pour les utilisateurs qui doivent gérer une attente de SLO sur la latence HITL.
URL connue pour le workbench de l'étiqueteur
- Les étiqueteurs affectés à un seul pool peuvent désormais accéder au Workbench via une URL connue et n'ont plus besoin de rechercher des URL cryptiques envoyées dans des notifications par e-mail (par le système ou par le gestionnaire d'étiquetage). Cette URL ne fonctionne pas pour les annoteurs attribués à plusieurs pools.
Paramètre de zoom persistant
- Le plug-in mémorise désormais le paramètre de zoom de l'outil de libellé (pleine largeur ou pleine page) pour les prochaines révisions de documents dans la file d'attente, ce qui lui évite d'avoir à faire un zoom avant pour chaque document.
HITL pour l'analyseur de formulaires
- HITL est désormais compatible avec l'analyseur de formulaires. Les utilisateurs peuvent examiner et corriger les paires clé-valeur extraites par l'analyseur de formulaires, activer le processus HITL sur le processeur d'analyseur de formulaires dans la plate-forme DocAI, et configurer les noms de clés (comme indiqué dans la capture d'écran ci-dessous) qu'ils souhaitent filtrer pour l'examen HITL. La sortie de l'examen manuel est enregistrée dans des fichiers JSON dans le bucket Google Cloud Storage spécifié par le client une fois l'examen terminé.
- Capture d'écran de l'UI pour configurer le modèle HITL sur les analyseurs de formulaires
- UI to configure key-level validation
- Interface utilisateur de l'étiqueteur
Pipeline d'audit/de contrôle qualité
- HITL permet désormais d'effectuer une deuxième étape de contrôle qualité ou d'audit, et indique l'exactitude des tâches d'examen (et des libellés). Une équipe de contrôle qualité ou un auditeur peuvent être désignés comme "lecteur expert" pour une tâche. L'équipe d'assurance qualité/l'auditeur recevra X % (par exemple, entre 1 et 100 %) des documents examinés. Ce paramètre est configurable par le client. L'auditeur peut corriger le résultat du réviseur. Le système suit les corrections et attribue un score de précision (par exemple, 90%) à chaque document audité. Le score de justesse agrégé d'une tâche ou d'un étiqueteur est indiqué dans les tableaux de bord Analytics des tâches et des étiqueteurs, respectivement. Voici des instructions détaillées sur la configuration d'un pipeline d'audit.
Désigner un auditeur
Précision des rapports
Analyseurs d'IA pour les prêts (31 juillet)
- La technologie HITL est désormais prise en charge par certains analyseurs d'IA de prêt, y compris les formulaires 1040, 1040 Schedule E, 1040 Schedule C, 1099 DIV, 1099 G, 1099 INT, 1099 MISC, les bulletins de paie, les relevés bancaires, les formulaires W2, W9, 1120, 1120S, 1065, SSA-1099, 1099 NEC et 1099-R.
Files d'attente standards et Fast Track (2 juillet)
- Nous acceptons désormais deux files d'attente prioritaires (contre une seule auparavant) pour chaque processeur, en fonction de l'urgence de chaque document.
- Envoi : après la prédiction, l'urgence des documents extraits peut être évaluée et envoyée dans deux files d'attente (standard ou urgente/rapide) en fonction de leur urgence. Par exemple, vous pouvez envoyer les factures dont la date d'échéance est urgente dans la file d'attente prioritaire. La logique qui évalue l'urgence peut être saisie via une fonction personnalisée.
- Attribution de tâches : le gestionnaire de libellé voit deux files d'attente différentes avec des priorités différentes, comme illustré dans la capture d'écran ci-dessous. Il peut attribuer le même groupe de libelleurs aux deux files d'attente.
- Priorisation des tâches : les étiqueteurs affectés aux deux tâches traiteront toujours d'abord les documents en attente de la file d'attente prioritaire avant de traiter la file d'attente standard (c'est-à-dire que la priorité de la file d'attente est gérée automatiquement par le système).
- Appel d'API : définir le champ priority dans ReviewDocument
- Capture d'écran de l'interface utilisateur (des tâches dans l'interface utilisateur du gestionnaire de libellés)
Filtres de validation pour le point de terminaison HITL (24 juin)
- Les filtres de validation (configurés dans l'outil de traitement) qui filtrent les champs en fonction du score de confiance pour déterminer les documents à mettre en file d'attente pour examen manuel sont désormais également appliqués aux documents envoyés au point de terminaison HITL.
- Lorsque vous appelez l'API
ReviewDocument
, définissez le champ enable_schema_validation sur "true". Notez que si cette valeur est définie et que la validation détermine que le document n'a pas besoin de déclencher un examen manuel, une erreur "CANCELLED" (ANNULÉ) est renvoyée.
API Cancel
Vous pouvez annuler un document mis en file d'attente pour le traitement HITL en appelant l'API Cancel pour un ID d'opération donné. [Un ID d'opération est renvoyé pour chaque document envoyé à HITL]
`POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
Type de facture (examen de la classification)
- L'outil de travail de l'outil d'étiquetage permet d'examiner la classification du type de facture.
Rapport sur le temps d'attente (SLO de latence HITL)
- Un rapport indique le nombre de documents en file d'attente pendant plus de 18 heures et plus de 24 heures. Cette option est utile pour les utilisateurs qui doivent gérer une attente de SLO sur la latence HITL.
URL connue pour le workbench de l'étiqueteur
- Les libelleurs attribués à un seul pool peuvent désormais accéder à l'atelier de travail à l'URL connue https://datacompute.corp.google.com/w/. Cela peut s'avérer utile si vous perdez l'e-mail contenant l'URL envoyée par le système ou le Gestionnaire d'étiquetage. Cette URL ne fonctionne pas pour les annoteurs attribués à plusieurs pools.
Paramètre de zoom persistant
- Le plug-in mémorise désormais le paramètre de zoom de l'utilisateur (pleine largeur ou pleine page) pour les prochaines révisions de documents dans la file d'attente, ce qui lui évite d'avoir à faire un zoom avant pour chaque document.