Notes de version

Version de décembre 2022

Outil de configuration HITL

L'onglet "Configuration" sous "Human-In-The-Loop" est désormais présenté sous la forme d'une paire d'étapes ordonnées pour faciliter et structurer l'expérience de configuration. Mise à jour de la configuration HITL L'utilisateur peut désormais afficher des étapes distinctes pour configurer les paramètres liés au pool de spécialistes et aux filtres pour déclencher l'HITL, et sélectionner les instructions et l'emplacement des résultats pour les spécialistes.

Version d'octobre 2022

Tableau de bord d'analyse des demandes HITL
  • Human in the Loop dispose désormais d'un onglet dédié, appelé Analytics, qui fournit à l'utilisateur des métriques et des graphiques pour analyser l'état des tâches HITL par processeur et apporter des modifications si nécessaire.

  • Actuellement, l'utilisateur peut afficher trois métriques différentes. Les données peuvent être agrégées à l'aide d'un sélecteur de période qui propose les options suivantes à l'utilisateur : Sélecteur de période

  • Pour chaque période sélectionnée, l'utilisateur peut consulter les informations suivantes:

    • Statistiques agrégées: vue instantanée du nombre total de documents importés dans la file d'attente, du nombre total de documents traités (envoyés et refusés) par les spécialistes, et du temps écoulé depuis l'ajout du document le plus ancien dans la file d'attente pour la période sélectionnée. Tableau des statistiques globales
    • Graphique d'activité human-in-the-loop (avec intervention humaine) : graphique montrant les données de série temporelle pour les dates d'ajout des documents à la file d'attente (enqueuedDocumentCount) et de traitement des documents par les spécialistes (completedDocumentCount). Graphique de l'activité HITL
    • Taux de déclenchement human-in-the-loop (avec intervention humaine) : graphique représentant les données de série temporelle du pourcentage de documents importés ayant déclenché l'examen human-in-the-loop (avec intervention humaine) au cours de la période sélectionnée. Graphique du taux de déclenchement HITL

Version de septembre 2022

Remarque: Les clients qui utilisent Document AI Workbench, les processeurs de bons de commande (BP), de factures et de dépenses ont accès à un nouveau schéma qui leur permet de libeller des cases à cocher (si elles sont définies dans le schéma) et de représenter avec précision les entités imbriquées, c'est-à-dire la relation parent-enfant dans l'interface utilisateur d'annotation et d'examen HITL. À mesure que davantage de processeurs adopteront le nouveau schéma, ces notes de version seront mises à jour en conséquence.

Entité imbriquée
  • L'interface utilisateur d'annotation accepte désormais le libellé des entités imbriquées. Le panneau de gauche a été actualisé avec un nouveau look pour les lignes imbriquées afin de représenter les entités imbriquées. La valeur de "parent" est la concaténation de tous ses "enfants". Panneau de gauche de l'entité imbriquée
  • La sélection d'entités dans le panneau de gauche affiche les libellés parent et enfant. Sélection du panneau de gauche de l'entité imbriquée
  • Le menu des libellés d'entités dans le document est également actualisé pour prendre en charge le libellé d'entités imbriquées. Sélection de menu d'entité imbriquée
  • Cliquez sur une étiquette imbriquée pour afficher une boîte de dialogue permettant d'attribuer l'entité parente appropriée à l'entité enfant imbriquée. Boîte de dialogue "Parent d'entité imbriquée"
Case à cocher
  • L'UI d'annotation est compatible avec les cases à cocher d'étiquetage. Dans le panneau de gauche, la case à cocher peut être modifiée dans la ligne. Panneau de gauche avec case à cocher
  • La modification des cases à cocher est également disponible dans la boîte de dialogue de modification de l'entité. Formulaire de modification avec case à cocher

Version d'août 2022

Sélection de l'étiquette de l'entité
  • La saisie du libellé de l'entité est remplacée par une liste déroulante. Cette liste déroulante contient les options de libellé disponibles lorsque vous ajoutez une entité. Cette modification permet d'éviter aux personnes qui ajoutent des libellés de faire des fautes de frappe et de créer des libellés d'entité indésirables. Sélection de l'étiquette de l'entité
Format de date ISO
  • Les dates normalisées sont affichées au format ISO 8601(AAAA-MM-JJ). Format de date ISO

Version de juillet 2022

Bouton de confirmation rapide
  • Un bouton de confirmation est disponible dans les info-bulles des entités pour examiner et confirmer rapidement une valeur d'entité/de libellé. Le bouton "Modifier" a été supprimé, car les utilisateurs peuvent cliquer directement sur l'info-bulle de l'entité pour la modifier. Confirmation rapide

Version de janvier 2022

Options de libellé d'entité
  • Les options de sélection des libellés d'entité sont désormais limitées à la liste des champs filtrés(définie dans la configuration du filtre HITL). Libellé de l'entité
Champs manquants
  • Nous affichons désormais les champs manquants (c'est-à-dire les champs marqués comme "Obligatoire" dans la configuration du filtre HITL, mais pour lesquels le processeur n'a pas prédit de valeurs) en rouge vif, ce qui permet à l'examinateur de modifier facilement la valeur du champ. Champs manquants
Échantillons complets aléatoires
  • Nous proposons désormais un examen complet (c'est-à-dire toutes les entités du document, et non seulement les champs filtrés) d'un échantillon aléatoire (par exemple, 2% du volume quotidien) de documents. Cela permet de surveiller la dérive du modèle et les données analytiques sur la précision du processeur dans chaque champ. Nous collectons ces données analytiques, qui nous aident à savoir quand un nouvel entraînement est nécessaire. Il sert également d'ensemble de données avec une vérité terrain étiquetée pour l'entraînement des modèles.
  • Les clients peuvent activer l'échantillonnage aléatoire et définir son intervalle [1 à 10%] en fonction de leur volume. Il est recommandé de cibler entre 100 et 500 échantillons par semaine. Par exemple, si le client traite 10 000 documents par semaine, vous pouvez définir cette valeur sur 500/10 000 = 5 %.
Configuration simplifiée du modèle HITL pour les nouveaux utilisateurs
  • Nous avons simplifié la configuration de l'HITL BYOL pour les clients qui utilisent ce service pour la première fois. Ils peuvent ainsi configurer rapidement une tâche, attribuer des spécialistes et la lancer à partir d'un seul écran. Ils peuvent ainsi l'essayer rapidement avant d'augmenter le volume de production ou d'externaliser l'opération.
  • Comme illustré dans la capture d'écran ci-dessous, l'utilisateur devient le gestionnaire par défaut du pool et peut ajouter d'autres spécialistes, qui sont tous automatiquement affectés à la tâche dans le même écran.
    • Auparavant, le gestionnaire désigné recevait un lien par e-mail vers la console du gestionnaire, où il pouvait ajouter des spécialistes et leur attribuer la tâche.
    • Une fois la tâche envoyée, il (et les autres spécialistes désignés) peut accéder à l'application HITL pour examiner les documents.
    • L'utilisateur peut également importer un document de test (un par un) dans la file d'attente de tâches. Configuration simplifiée du modèle HITL 1 Configuration simplifiée du modèle HITL 2
Supprimer le séparateur de ligne final
  • Les séparateurs de ligne à la fin('\n') sont supprimés dans entity.mentionText.

Version de décembre 2021

Trier les entités dont le score de confiance est faible en haut
  • Les entités ayant un score de confiance faible (c'est-à-dire celles qui sont en dessous du seuil de confiance) sont désormais triées en haut de la page, ce qui permet au spécialiste de se concentrer sur ces entités. Cela améliore encore l'efficacité de l'étiquetage. Trier par faible confiance
Instructions facultatives pour les tâches BYOL
  • Les instructions PDF à importer pour configurer une tâche HITL sont désormais facultatives. Cela simplifie les tests et les lancements internes rapides, où les spécialistes n'ont pas besoin d'un guide d'instructions. Instructions facultatives
Options "Ajuster à la largeur" et "Ajuster à la hauteur de la page"
  • Bouton permettant d'adapter la page à la largeur ou à la hauteur. Cette fonctionnalité est utile lorsque les documents de taille variable (par exemple, des reçus) sont associés à une tâche. Option d'ajustement
Nom de la tâche affiché dans l'interface utilisateur du spécialiste
  • Le nom de la tâche est désormais affiché dans l'interface utilisateur du spécialiste pour lui fournir des informations supplémentaires sur la tâche et le type de document, ce qui est très utile lorsqu'il est affecté à plusieurs tâches.
  • Notez que cette information s'affiche dans les nouveaux processeurs lancés après cette version. Nom de la tâche dans l'UI du spécialiste
Champ de recherche pour les spécialistes
  • Les spécialistes peuvent rechercher des entités/du texte dans les documents. Cela est particulièrement utile pour les documents volumineux et multipages, et améliore la productivité des spécialistes. Champ de recherche de spécialistes

Version de septembre 2021

Activez/désactivez l'option pour afficher tous les champs.
  • Les libelleurs peuvent être amenés à examiner et à mettre à jour des champs qui ne figurent pas dans l'ensemble d'entités filtrées pour des documents spécifiques de la file d'attente. Vous pouvez activer ou désactiver l'option Afficher toutes les prédictions pour permettre aux annoteurs d'examiner les champs non filtrés. Activer/Désactiver
HITL pour l'analyseur de formulaires
  • HITL est désormais compatible avec l'analyseur de formulaires. Les utilisateurs peuvent ainsi examiner et corriger les paires clé-valeur extraites par l'analyseur de formulaires. Le client peut activer le modèle HITL sur le processeur d'analyse de formulaires de la plate-forme DocAI et configurer les noms de clés (comme indiqué dans la capture d'écran ci-dessous) qu'il souhaite filtrer pour l'examen HITL. La sortie de l'examen HITL est générée sous forme de fichiers JSON dans le bucket Google Cloud Storage spécifié par le client une fois l'examen terminé.
  • Ils peuvent spécifier d'autres noms de clé séparés par une virgule, par exemple "client, nom du client, client, n° de compte, numéro de compte" afin que le filtre HITL détecte les documents contenant toutes les variantes de nom de clé et les envoie pour examen par HITL. HITL pour l'analyseur de formulaires 1 HITL pour l'analyseur de formulaires 2 HITL pour l'analyseur de formulaires 3

Version d'août 2021

Pipeline d'audit/de contrôle qualité
  • HITL permet désormais d'effectuer une deuxième étape de contrôle qualité ou d'audit, et indique l'exactitude des tâches d'examen (et des libellés). Une équipe de contrôle qualité ou un auditeur peuvent être désignés comme "lecteur expert" pour une tâche. L'équipe d'assurance qualité/l'auditeur reçoit X % (par exemple, entre 1 et 100 %) des documents examinés. Ce paramètre est configurable par le client. L'auditeur peut corriger le résultat du réviseur. Le système suit les corrections et attribue un score de précision (par exemple, 90%) à chaque document audité. Le score de justesse agrégé d'une tâche ou d'un étiqueteur est indiqué dans les tableaux de bord Analytics des tâches et des étiqueteurs, respectivement.
  • Pour obtenir des instructions détaillées sur la configuration d'un pipeline d'audit, consultez cette page.
  • Désigner un auditeur Désigner un auditeur
  • Exactitude des rapports Exactitude des rapports
Analyseurs IA pour les prêts (15 août)
  • La technologie HITL est désormais compatible avec certains analyseurs d'IA de prêt, y compris les formulaires 1040, 1040 Schedule E, 1040 Schedule C, 1099 DIV, 1099 G, 1099 INT, 1099 MISC, les bulletins de paie, les relevés bancaires, les formulaires W2, W9, 1120, 1120S, 1065, SSA-1099, 1099 NEC et 1099-R.

Version de juillet 2021

Files d'attente standards et urgentes (2 juillet)
  • Nous acceptons désormais deux files d'attente prioritaires (contre une seule auparavant) pour chaque processeur, en fonction de l'urgence de chaque document.
  • Envoi : après la prédiction, l'urgence des documents extraits peut être évaluée et envoyée dans deux files d'attente (standard ou urgente/rapide) en fonction de leur urgence. Par exemple, vous pouvez ajouter les factures dont la date d'échéance est urgente à la file d'attente prioritaire. La logique qui évalue l'urgence se trouve actuellement en dehors de HITL et peut être une fonction personnalisée.
  • Attribution de tâches : le gestionnaire de libellé voit deux files d'attente différentes avec des priorités différentes, comme illustré dans la capture d'écran ci-dessous. Il peut attribuer le même groupe de libelleurs aux deux files d'attente.
  • Priorisation des tâches : les étiqueteurs affectés aux deux tâches traiteront toujours d'abord les documents en attente de la file d'attente prioritaire avant de traiter la file d'attente standard (c'est-à-dire que la priorité de la file d'attente est gérée automatiquement par le système)
  • Appel d'API : définir le champ priority dans ReviewDocument
  • Capture d'écran de l'UI (des tâches dans l'UI du gestionnaire de libellés) : Files d'attente prioritaires

Version de juin 2021

Filtres de validation pour le point de terminaison HITL (24 juin)
  • Les filtres de validation (configurés dans le processeur) qui filtrent les champs en fonction du score de confiance pour déterminer les documents à mettre en file d'attente pour examen manuel sont désormais également appliqués aux documents envoyés au point de terminaison HITL.
  • Lorsque vous appelez l'API ReviewDocument, définissez le champ enable_schema_validation sur "true".
  • Notez que si cette valeur est définie et que la validation détermine que le document n'a pas besoin de déclencher un examen manuel, une erreur "CANCELLED" (ANNULÉ) est renvoyée.
API Cancel
  • Le client peut annuler un document mis en file d'attente pour le traitement HITL en appelant l'API Cancel pour un ID d'opération donné. Un ID d'opération est renvoyé pour chaque document envoyé à HITL.

    `POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
    
Type de facture (examen de la classification)
  • L'outil de travail de l'outil d'étiquetage permet d'examiner la classification du type de facture. Classification du type de facture
Rapport sur le temps d'attente (SLO de latence HITL)
  • Un rapport indique le nombre de documents en file d'attente pendant plus de 18 heures et plus de 24 heures. Cette option est utile pour les utilisateurs qui doivent gérer une attente de SLO sur la latence HITL. Temps en file d'attente
URL connue pour le workbench de l'étiqueteur
  • Les étiqueteurs affectés à un seul pool peuvent désormais accéder au Workbench via une URL connue et n'ont plus besoin de rechercher des URL cryptiques envoyées dans des notifications par e-mail (par le système ou par le gestionnaire d'étiquetage). Cette URL ne fonctionne pas pour les annoteurs attribués à plusieurs pools.
Paramètre de zoom persistant
  • Le plug-in mémorise désormais le paramètre de zoom de l'outil de libellé (pleine largeur ou pleine page) pour les prochaines révisions de documents dans la file d'attente, ce qui lui évite d'avoir à faire un zoom avant pour chaque document.

HITL pour l'analyseur de formulaires

  • HITL est désormais compatible avec l'analyseur de formulaires. Les utilisateurs peuvent examiner et corriger les paires clé-valeur extraites par l'analyseur de formulaires, activer le processus HITL sur le processeur d'analyseur de formulaires dans la plate-forme DocAI, et configurer les noms de clés (comme indiqué dans la capture d'écran ci-dessous) qu'ils souhaitent filtrer pour l'examen HITL. La sortie de l'examen manuel est enregistrée dans des fichiers JSON dans le bucket Google Cloud Storage spécifié par le client une fois l'examen terminé.
  • Capture d'écran de l'UI pour configurer le modèle HITL sur les analyseurs de formulaires Analyseur de formulaires HITL
  • UI to configure key-level validation Validation au niveau des clés
  • Interface utilisateur de l'étiqueteur Interface utilisateur du libelléur de l'analyseur de formulaires

Pipeline d'audit/de contrôle qualité

  • HITL permet désormais d'effectuer une deuxième étape de contrôle qualité ou d'audit, et indique l'exactitude des tâches d'examen (et des libellés). Une équipe de contrôle qualité ou un auditeur peuvent être désignés comme "lecteur expert" pour une tâche. L'équipe d'assurance qualité/l'auditeur recevra X % (par exemple, entre 1 et 100 %) des documents examinés. Ce paramètre est configurable par le client. L'auditeur peut corriger le résultat du réviseur. Le système suit les corrections et attribue un score de précision (par exemple, 90%) à chaque document audité. Le score de justesse agrégé d'une tâche ou d'un étiqueteur est indiqué dans les tableaux de bord Analytics des tâches et des étiqueteurs, respectivement. Voici des instructions détaillées sur la configuration d'un pipeline d'audit.
  • Désigner un auditeur Désigner un auditeur

  • Précision des rapports Précision des rapports

Analyseurs d'IA pour les prêts (31 juillet)

  • La technologie HITL est désormais prise en charge par certains analyseurs d'IA de prêt, y compris les formulaires 1040, 1040 Schedule E, 1040 Schedule C, 1099 DIV, 1099 G, 1099 INT, 1099 MISC, les bulletins de paie, les relevés bancaires, les formulaires W2, W9, 1120, 1120S, 1065, SSA-1099, 1099 NEC et 1099-R.

Files d'attente standards et Fast Track (2 juillet)

  • Nous acceptons désormais deux files d'attente prioritaires (contre une seule auparavant) pour chaque processeur, en fonction de l'urgence de chaque document.
  • Envoi : après la prédiction, l'urgence des documents extraits peut être évaluée et envoyée dans deux files d'attente (standard ou urgente/rapide) en fonction de leur urgence. Par exemple, vous pouvez envoyer les factures dont la date d'échéance est urgente dans la file d'attente prioritaire. La logique qui évalue l'urgence peut être saisie via une fonction personnalisée.
  • Attribution de tâches : le gestionnaire de libellé voit deux files d'attente différentes avec des priorités différentes, comme illustré dans la capture d'écran ci-dessous. Il peut attribuer le même groupe de libelleurs aux deux files d'attente.
  • Priorisation des tâches : les étiqueteurs affectés aux deux tâches traiteront toujours d'abord les documents en attente de la file d'attente prioritaire avant de traiter la file d'attente standard (c'est-à-dire que la priorité de la file d'attente est gérée automatiquement par le système).
  • Appel d'API : définir le champ priority dans ReviewDocument
  • Capture d'écran de l'interface utilisateur (des tâches dans l'interface utilisateur du gestionnaire de libellés) Capture d'écran de l'UI

Filtres de validation pour le point de terminaison HITL (24 juin)

  • Les filtres de validation (configurés dans l'outil de traitement) qui filtrent les champs en fonction du score de confiance pour déterminer les documents à mettre en file d'attente pour examen manuel sont désormais également appliqués aux documents envoyés au point de terminaison HITL.
  • Lorsque vous appelez l'API ReviewDocument, définissez le champ enable_schema_validation sur "true". Notez que si cette valeur est définie et que la validation détermine que le document n'a pas besoin de déclencher un examen manuel, une erreur "CANCELLED" (ANNULÉ) est renvoyée.

API Cancel

  • Vous pouvez annuler un document mis en file d'attente pour le traitement HITL en appelant l'API Cancel pour un ID d'opération donné. [Un ID d'opération est renvoyé pour chaque document envoyé à HITL]

         `POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
    

Type de facture (examen de la classification)

  • L'outil de travail de l'outil d'étiquetage permet d'examiner la classification du type de facture. Classification du type de facture

Rapport sur le temps d'attente (SLO de latence HITL)

  • Un rapport indique le nombre de documents en file d'attente pendant plus de 18 heures et plus de 24 heures. Cette option est utile pour les utilisateurs qui doivent gérer une attente de SLO sur la latence HITL. Rapport "Temps d'attente dans la file d'attente"

URL connue pour le workbench de l'étiqueteur

  • Les libelleurs attribués à un seul pool peuvent désormais accéder à l'atelier de travail à l'URL connue https://datacompute.corp.google.com/w/. Cela peut s'avérer utile si vous perdez l'e-mail contenant l'URL envoyée par le système ou le Gestionnaire d'étiquetage. Cette URL ne fonctionne pas pour les annoteurs attribués à plusieurs pools.

Paramètre de zoom persistant

  • Le plug-in mémorise désormais le paramètre de zoom de l'utilisateur (pleine largeur ou pleine page) pour les prochaines révisions de documents dans la file d'attente, ce qui lui évite d'avoir à faire un zoom avant pour chaque document.