Versionshinweise

Version vom Dezember 2022

HITL-Konfigurationsschritt-für-Schritt-Anleitung

Der Tab „Konfiguration“ unter „Mensch im Kreislauf“ ist jetzt als geordnetes Paar von Schritten formatiert, um die Einrichtung zu vereinfachen und zu strukturieren. HITL-Konfiguration aktualisiert Nutzer können jetzt separate Schritte zur Konfiguration von Einstellungen für den Spezialistenpool und Filter zum Auslösen von HITL aufrufen und den Speicherort für Anleitungen und Ergebnisse für Spezialisten auswählen.

Version 2.14 (Oktober 2022)

Dashboard für HITL-Anfrageanalysen
  • „Human in the Loop“ hat jetzt einen eigenen Tab namens Analytics. Dort finden Nutzer Messwerte und Diagramme, mit denen sie den Status von HITL-Aufgaben pro Prozessor analysieren und bei Bedarf Änderungen vornehmen können.

  • Derzeit gibt es drei verschiedene Messwerte, die sich der Nutzer ansehen kann. Die Daten können über eine Auswahl für den Zeitraum zusammengefasst werden. Dabei stehen dem Nutzer die folgenden Optionen zur Verfügung: Zeitraumauswahl

  • Für jeden ausgewählten Zeitraum können Nutzer Folgendes sehen:

    • Zusammengefasste Statistiken: Eine Übersicht über die Gesamtzahl der Dokumente, die erfolgreich in die Warteschlange hochgeladen wurden, die Gesamtzahl der von Spezialisten abgeschlossenen Dokumente (d. h. eingereichten und abgelehnten Dokumente) und die Zeit seit dem Hinzufügen des ältesten Dokuments in die Warteschlange für den ausgewählten Zeitraum. Tabelle mit zusammengefassten Statistiken
    • Diagramm mit Human-in-the-Loop-Aktivitäten: Ein Diagramm mit Zeitreihendaten dazu, wann Dokumente der Warteschlange hinzugefügt wurden (enqueuedDocumentCount) und wann sie von Spezialisten bearbeitet wurden (completedDocumentCount). HITL-Aktivitätsdiagramm
    • Human-in-the-Loop-Triggerrate: Ein Diagramm mit den Zeitreihendaten für den Prozentsatz der hochgeladenen Dokumente, die im ausgewählten Zeitraum eine Human-in-the-Loop-Überprüfung ausgelöst haben. Diagramm zur HITL-Triggerrate

Version vom September 2022

Hinweis: Kunden, die die Document AI Workbench, die Auftragsbearbeitung (Purchase Order, PO), die Rechnungsverarbeitung und die Bearbeitung von Ausgaben nutzen, haben Zugriff auf ein neues Schema, mit dem sie Kästchen (falls im Schema definiert) kennzeichnen und verschachtelte Entitäten (d.h. übergeordnete und untergeordnete Beziehungen) in der HITL-Anmerkungs- und -Überprüfungsoberfläche korrekt darstellen können. Sobald weitere Abwickler das neue Schema übernehmen, werden diese Versionshinweise entsprechend aktualisiert.

Verschachtelte Entität
  • Die Benutzeroberfläche für Anmerkungen unterstützt jetzt das Labeling für verschachtelte Entitäten. Der linke Bereich wurde aktualisiert und enthält jetzt eine neue Darstellung für verschachtelte Zeilen, die verschachtelte Entitäten darstellen. Der Wert von „übergeordnet“ ist die Konkatenierung aller „untergeordneten“ Elemente. Linker Bereich für verschachtelte Entitäten
  • Im linken Bereich der Entitätsauswahl werden über- und untergeordnete Labels angezeigt. Auswahl im linken Bereich einer verschachtelten Entität
  • Das Menü für Entitätslabels in Dokumenten wird ebenfalls aktualisiert, um verschachtelte Entitätslabels zu unterstützen. Auswahlmenü für verschachtelte Entitäten
  • Wenn Sie auf ein verschachteltes Label klicken, wird ein Dialogfeld eingeblendet, in dem Sie die richtige übergeordnete Entität für die verschachtelte untergeordnete Entität zuweisen können. Dialogfeld für übergeordnete Entität
Kästchen
  • Die Benutzeroberfläche für Anmerkungen unterstützt das Anklicken von Kästchen. Im linken Bereich kann das Kästchen in der Zeile bearbeitet werden. Kästchen im linken Bereich
  • Die Bearbeitung von Kästchen ist auch im Dialogfeld zum Bearbeiten von Entitäten verfügbar. Kästchen-Bearbeitungsformular

Version 2.14.0 vom August 2022

Entitätslabelauswahl
  • Die Eingabe für das Entitätslabel wird durch eine Drop-down-Liste ersetzt. Diese Drop-down-Liste enthält die verfügbaren Labeloptionen beim Hinzufügen einer neuen Entität. Mit dieser Änderung wird verhindert, dass Labeler Tippfehler machen und unerwünschte Entitätslabels erstellen. Entitätslabelauswahl
ISO-Datumsformat
  • Normalisierte Datumsangaben werden im ISO 8601-Format(TT. MM. JJJJ) angezeigt. ISO-Datumsformat

Juli 2022

Schaltfläche „Schnell bestätigen“
  • In den Entitäts-Tooltips ist die Schaltfläche „Bestätigen“ verfügbar, mit der Sie einen Entitäts-/Labelwert schnell überprüfen und bestätigen können. Die Schaltfläche „Bearbeiten“ wurde entfernt, da Nutzer zum Bearbeiten direkt auf die Entitäts-Kurzinfo klicken können. Schnellbestätigung

Version 2022.01

Optionen für Entitätslabels
  • Die Auswahloptionen für Entitätslabels sind jetzt auf die Liste der gefilterten Felder beschränkt, die in der HITL-Filterkonfiguration festgelegt sind. Entitätslabel
Fehlende Felder
  • Fehlende Felder (d.h. Felder, die in der HITL-Filterkonfiguration als „Erforderlich“ gekennzeichnet sind, für die der Prozessor jedoch keine Werte vorhergesagt hat) werden jetzt in einer deutlichen roten Farbe angezeigt, damit die Prüfer den Wert des Felds ganz einfach aktualisieren können. Fehlende Felder
Vollständige Zufallsstichproben
  • Wir unterstützen jetzt die vollständige Überprüfung (d.h. aller Entitäten im Dokument, nicht nur der gefilterten Felder) einer zufälligen Stichprobe (z.B. 2% des täglichen Volumens) von Dokumenten. So können wir die Modellabweichung und die Verarbeitungsgenauigkeit in den einzelnen Feldern im Blick behalten. Anhand dieser Analysen erkennen wir, wann ein Update erforderlich ist. Dieser dient auch als Dataset mit gekennzeichneter Ground Truth für das Auffrischen von Modellen.
  • Kunden können die Funktion aktivieren und die Größe der Stichprobe [1–10%] basierend auf ihrem Volumen festlegen. Es empfiehlt sich, 100–500 Beispiele pro Woche zu verwenden. Wenn der Kunde also 10.000 Dokumente pro Woche verarbeitet, kann dieser Wert auf 500/10.000 = 5 % festgelegt werden.
Vereinfachte HITL-Konfiguration für Erstnutzer
  • Wir haben die BYOL-HITL-Konfiguration für Erstnutzer von HITL vereinfacht, damit sie eine Aufgabe schnell konfigurieren, Spezialisten zuweisen und sie auf einem einzigen Bildschirm starten können. So können sie sie schnell testen, bevor sie das Produktionsvolumen skalieren oder den Betrieb auslagern.
  • Wie im Screenshot unten zu sehen, wird der Nutzer zum Standardmanager des Pools und kann weitere Spezialisten hinzufügen, die der Aufgabe auf demselben Bildschirm automatisch zugewiesen werden.
    • Bisher erhielt der zuständige Manager einen Link zur Manager-Konsole, über den er Spezialisten hinzufügen und ihnen die Aufgabe zuweisen konnte.
    • Nach dem Einreichen der Aufgabe können sie (und andere zugewiesene Spezialisten) die Dokumente in der HITL App überprüfen.
    • Der Nutzer kann auch einzelne Testdokumente in die Aufgabenwarteschlange hochladen. Vereinfachte HITL-Konfiguration 1 Vereinfachte HITL-Konfiguration 2
Endzeichen entfernen
  • Abschließende Zeilenenden('\n') werden in „entity.mentionText“ entfernt.

Version 2.9 (Dezember 2021)

Entitäten mit niedriger Konfidenzstufe nach oben sortieren
  • Entitäten mit niedriger Konfidenz (d.h. Entitäten unter dem Konfidenzgrenzwert) werden jetzt oben auf der Seite sortiert, damit sich die Spezialisten auf diese Entitäten konzentrieren können. Das führt zu einer weiteren Effizienzsteigerung beim Labeling. Nach geringer Zuverlässigkeit sortieren
Optionale Anleitung für BYOL-Aufgaben
  • Die PDF-Anleitung, die zum Konfigurieren einer HITL-Aufgabe hochgeladen werden muss, ist jetzt optional. Das vereinfacht Tests und schnelle interne Einführungen, bei denen die Spezialisten keine Anleitung benötigen. Anleitung optional
Optionen „An Breite anpassen“ und „An Seitenhöhe anpassen“
  • Schaltfläche, um die Seite an die Breite oder Höhe anzupassen. Das ist nützlich, wenn Spezialisten in einer Aufgabe Dokumente mit variabler Größe (z.B. Belege) haben. Option „An Fenstergröße anpassen“
In der Benutzeroberfläche für Spezialisten angezeigter Aufgabenname
  • Der Aufgabenname wird jetzt in der Benutzeroberfläche des Spezialisten angezeigt, um ihm zusätzlichen Kontext zur Aufgabe und zum Dokumenttyp zu bieten. Das ist sehr nützlich, wenn dem Spezialisten mehrere Aufgaben zugewiesen sind.
  • Hinweis: Dieser Wert wird in neuen Prozessoren angezeigt, die nach diesem Release gestartet wurden. Name der Aufgabe in der Benutzeroberfläche für Spezialisten
Suchfeld für Spezialisten
  • Spezialisten können in Dokumenten nach Entitäten/Text suchen. Das ist besonders bei großen mehrseitigen Dokumenten hilfreich und steigert die Produktivität der Spezialisten. Suchfeld für Spezialisten

Version vom September 2021

Umschalten, um alle Felder anzuzeigen
  • Bei bestimmten Dokumenten in der Warteschlange müssen die Bearbeiter möglicherweise Felder prüfen und aktualisieren, die nicht im gefilterten Satz von Entitäten enthalten sind. Sie können die Option Alle Vorhersagen anzeigen aktivieren, damit die Labeler nicht gefilterte Felder überprüfen können. Wechseln
HITL für Formularparser
  • HITL unterstützt jetzt den Formularparser, sodass Nutzer die vom Formularparser extrahierten Schlüssel/Wert-Paare prüfen und korrigieren können. Der Kunde kann HITL auf dem Form Parser-Prozessor auf der DocAI-Plattform aktivieren und die Schlüsselnamen konfigurieren (wie im Screenshot unten dargestellt), die für die HITL-Überprüfung gefiltert werden sollen. Die HITL-Ausgabe wird nach Abschluss der HITL-Überprüfung als JSON-Dateien im vom Kunden angegebenen Google Cloud Storage-Bucket abgelegt.
  • Sie können kommagetrennte alternative Schlüsselnamen angeben, z. B. „kunde, kundename, kund, konto #, kontonummer“, damit der HITL-Filter Dokumente mit allen Varianten des Schlüsselnamens erfasst und zur HITL-Überprüfung sendet. HITL für Formularparser 1 HITL für Formularparser 2 HITL für Formularparser 3

Version 2.14.0 (August 2021)

Audit-/QA-Pipeline
  • HITL ermöglicht jetzt eine zweite QA- oder Prüfphase und meldet die Richtigkeit der Überprüfungsaufgaben (und der Bearbeiter). Ein QA-Team oder Prüfer kann einer Aufgabe als „Expertenlabeler“ zugewiesen werden. Das QA-Team/der Prüfer erhält X % (z. B. 1–100 %) der geprüften Dokumente. Dieser Wert kann vom Kunden konfiguriert werden. Der Prüfer kann die Ausgabe des Prüfers korrigieren. Das System überwacht die Korrekturen und weist jedem geprüften Dokument einen Richtigkeitsfaktor zu (z.B. 90%). Der Gesamtgenauigkeitswert einer Aufgabe oder eines Labelers wird in den Dashboards „Aufgaben“ und „Labeler-Analysen“ angezeigt.
  • Hier finden Sie eine ausführliche Anleitung zum Konfigurieren einer Analysepipeline.
  • Prüfer benennen Prüfer festlegen
  • Genauigkeit der Berichte Genauigkeit von Berichten
AI-Parser für das Kreditwesen (15. August)
  • HITL wird jetzt von einigen Lending AI-Parsern unterstützt, darunter 1040, 1040 Schedule E, 1040 Schedule C, 1099 DIV, 1099 G, 1099 INT, 1099 MISC, Lohnabrechnungen, Kontoauszüge, W2, W9, 1120, 1120S, 1065, SSA-1099, 1099 NEC, 1099-R.

Juli 2021

Standard- und dringende Warteschlangen (2. Juli)
  • Wir unterstützen jetzt zwei Prioritätswarteschlangen (anstelle von einer) für jeden Prozessor, je nach Dringlichkeit des jeweiligen Dokuments.
  • Einreichung: Nach der Vorhersage können die extrahierten Dokumente auf Dringlichkeit bewertet und je nach Dringlichkeit des Dokuments in zwei Warteschlangen (Standard oder Dringend/Beschleunigt) eingereicht werden. Rechnungen mit dringenden Fälligkeitsdaten können beispielsweise in die Fast-Track-Warteschlange gestellt werden. Die Logik, die die Dringlichkeit bewertet, befindet sich derzeit außerhalb von HITL und kann eine benutzerdefinierte Funktion sein.
  • Aufgabenzuweisung: Der Labelmanager sieht zwei verschiedene Warteschlangen mit unterschiedlichen Prioritäten, wie im Screenshot unten dargestellt. Er kann beiden Warteschlangen dieselbe Gruppe von Labelern zuweisen.
  • Aufgabenpriorisierung: Labeler, die beiden Aufgaben zugewiesen sind, verarbeiten immer zuerst alle ausstehenden Dokumente in der Fast-Track-Warteschlange, bevor sie die Standardwarteschlange bearbeiten.Die Warteschlangenpriorisierung wird also automatisch vom System verwaltet.
  • API-Aufruf – Legen Sie im Feld „ReviewDocument“ das Feld priority fest.
  • Screenshot der Benutzeroberfläche (von Aufgaben in der Labeling Manager-Benutzeroberfläche) – Prioritätswarteschlangen

Juni 2021

Validierungsfilter für HITL-Endpunkt (24. Juni)
  • Die im Prozessor konfigurierten Validierungsfilter, die die Felder nach Konfidenzwert filtern, um zu bestimmen, welche Dokumente für die manuelle Überprüfung in die Warteschlange gestellt werden, werden jetzt auch auf Dokumente angewendet, die an den HITL-Endpunkt gesendet werden.
  • Legen Sie beim Aufrufen der ReviewDocument API das Feld enable_schema_validation auf „true“ fest.
  • Wenn diese Option festgelegt ist und die Validierung feststellt, dass das Dokument keine manuelle Überprüfung auslösen muss, wird der Fehler „ABGEBROCHEN“ zurückgegeben.
API kündigen
  • Kunden können ein Dokument, das für die HITL-Verarbeitung in die Warteschlange gestellt wurde, abbrechen, indem sie die Cancel API für eine bestimmte Vorgangs-ID aufrufen. Für jedes an HITL gesendete Dokument wird eine Vorgangs-ID zurückgegeben.

    `POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
    
Rechnungsart (Klassifizierungsüberprüfung)
  • Die Labeler Workbench unterstützt die Überprüfung der Klassifizierung des Rechnungstyps. Klassifizierung der Rechnungsart
Bericht „Wartezeit in der Warteschlange“ (HITL-Latenz-SLO)
  • In einem Bericht wird angezeigt, wie viele Dokumente seit mehr als 18 Stunden und seit mehr als 24 Stunden in der Warteschlange stehen. Das ist nützlich für Nutzer, die eine SLO-Erwartung für die HITL-Latenz verwalten müssen. Zeit in der Warteschlange
Bekannte URL für Labeler Workbench
  • Labeler, die einem einzelnen Pool zugewiesen sind, können jetzt über eine bekannte URL auf die Workbench zugreifen und müssen nicht nach kryptischen URLs suchen, die in E-Mail-Benachrichtigungen vom System oder vom Labeling Manager gesendet werden. Diese URL funktioniert nicht für Labeler, die mehreren Pools zugewiesen sind.
Einstellung für fixierten Zoom
  • Das Plug-in merkt sich jetzt die Zoomeinstellung des Bearbeiters (Vollbreite oder Vollseite) für die nächsten Dokumentüberprüfungen in der Warteschlange, sodass er nicht bei jedem Dokument herangezoomt werden muss.

HITL für Formularparser

  • HITL unterstützt jetzt den Formular-Parser. Nutzer können die vom Formular-Parser extrahierten Schlüssel/Wert-Paare überprüfen und korrigieren, HITL für den Formular-Parser-Prozessor auf der DocAI-Plattform aktivieren und die Schlüsselnamen konfigurieren (wie im Screenshot unten dargestellt), die für die HITL-Überprüfung gefiltert werden sollen. Die HITL-Ausgabe wird nach Abschluss der HITL-Überprüfung in JSON-Dateien im vom Kunden angegebenen Google Cloud Storage-Bucket gespeichert.
  • UI-Screenshots zum Konfigurieren von HITL für Formularparser HITL-Formularparser
  • Benutzeroberfläche zum Konfigurieren der Validierung auf Schlüsselebene Validierung auf Schlüsselebene
  • Labeler-Benutzeroberfläche Benutzeroberfläche des Formularparser-Labelers

Audit-/QA-Pipeline

  • HITL ermöglicht jetzt eine zweite QA- oder Prüfphase und meldet die Richtigkeit der Überprüfungsaufgaben (und der Bearbeiter). Ein QA-Team oder Prüfer kann einer Aufgabe als „Expertenlabeler“ zugewiesen werden. Das QA-Team/der Prüfer erhält X % (z. B. 1–100 %) der geprüften Dokumente. Dieser Wert kann vom Kunden konfiguriert werden. Der Prüfer kann die Ausgabe des Prüfers korrigieren. Das System überwacht die Korrekturen und weist jedem geprüften Dokument einen Richtigkeitsfaktor zu (z.B. 90%). Der Gesamtgenauigkeitswert einer Aufgabe oder eines Labelers wird in den Dashboards „Aufgaben“ und „Labeler Analytics“ angezeigt. Hier finden Sie eine ausführliche Anleitung zum Konfigurieren einer Analysepipeline.
  • Prüfer benennen Prüfer benennen

  • Genauigkeit der Berichte Genauigkeit der Berichte

KI-Parser für das Kreditwesen (31. Juli)

  • HITL wird jetzt von einigen Lending AI-Parsern unterstützt, darunter 1040, 1040 Schedule E, 1040 Schedule C, 1099 DIV, 1099 G, 1099 INT, 1099 MISC, Lohnabrechnungen, Kontoauszüge, W2, W9, 1120, 1120S, 1065, SSA-1099, 1099 NEC, 1099-R.

Standard- und Fast-Track-Warteschlangen (2. Juli)

  • Wir unterstützen jetzt zwei Prioritätswarteschlangen (anstelle von einer) für jeden Prozessor, je nach Dringlichkeit des jeweiligen Dokuments.
  • Einreichung: Nach der Vorhersage können die extrahierten Dokumente auf Dringlichkeit bewertet und je nach Dringlichkeit des Dokuments in zwei Warteschlangen (Standard oder Dringend/Beschleunigt) eingereicht werden. Rechnungen mit dringenden Fälligkeitsdaten können beispielsweise in die Fast-Track-Warteschlange gestellt werden. Die Logik, mit der die Dringlichkeit bewertet wird, kann über eine benutzerdefinierte Funktion eingegeben werden.
  • Aufgabenzuweisung: Der Labelmanager sieht zwei verschiedene Warteschlangen mit unterschiedlichen Prioritäten, wie im Screenshot unten dargestellt. Er kann beiden Warteschlangen dieselbe Gruppe von Labelern zuweisen.
  • Aufgabenpriorisierung: Labeler, die beiden Aufgaben zugewiesen sind, verarbeiten immer zuerst alle ausstehenden Dokumente in der Fast-Track-Warteschlange, bevor sie die Standardwarteschlange bearbeiten.Die Warteschlangenpriorisierung wird also automatisch vom System verwaltet.
  • API-Aufruf – Legen Sie im Feld „ReviewDocument“ das Feld priority fest.
  • Screenshot der Benutzeroberfläche (von Aufgaben in der Labeling Manager-Benutzeroberfläche) Screenshot der Benutzeroberfläche

Validierungsfilter für HITL-Endpunkt (24. Juni)

  • Die im Prozessor konfigurierten Validierungsfilter, die die Felder nach Konfidenzwert filtern, um zu bestimmen, welche Dokumente für die manuelle Überprüfung in die Warteschlange gestellt werden, werden jetzt auch auf Dokumente angewendet, die an den HITL-Endpunkt gesendet werden.
  • Legen Sie beim Aufrufen der ReviewDocument API das Feld enable_schema_validation auf „true“ fest. Wenn diese Option festgelegt ist und die Validierung ergibt, dass das Dokument nicht manuell überprüft werden muss, wird der Fehler „ABGEBROCHEN“ zurückgegeben.

API kündigen

  • Sie können ein Dokument, das für die HITL-Verarbeitung in die Warteschlange gestellt wurde, abbrechen, indem Sie die Cancel API für eine bestimmte Vorgangs-ID aufrufen. [Für jedes an HITL gesendete Dokument wird eine Vorgangs-ID zurückgegeben.]

         `POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
    

Rechnungsart (Klassifizierungsüberprüfung)

  • Die Labeler Workbench unterstützt die Überprüfung der Klassifizierung des Rechnungstyps. Klassifizierung der Rechnungsart

Bericht „Wartezeit in der Warteschlange“ (HITL-Latenz-SLO)

  • In einem Bericht wird angezeigt, wie viele Dokumente seit mehr als 18 Stunden und seit mehr als 24 Stunden in der Warteschlange stehen. Das ist nützlich für Nutzer, die eine SLO-Erwartung für die HITL-Latenz verwalten müssen. Bericht zur Wartezeit

Bekannte URL für Labeler Workbench

  • Labeler, die einem einzelnen Pool zugewiesen sind, können jetzt über die bekannte URL https://datacompute.corp.google.com/w/ auf die Workbench zugreifen. Das ist nützlich, falls die E-Mail mit der URL, die vom System oder Labeling Manager gesendet wurde, verloren geht. Diese URL funktioniert nicht für Labeler, die mehreren Pools zugewiesen sind.

Einstellung für fixierten Zoom

  • Das Plug-in merkt sich jetzt die Zoomeinstellung eines Bearbeiters (Vollbreite oder Vollseite) für die nächsten Dokumente in der Warteschlange, sodass er nicht bei jedem Dokument herangezoomt werden muss.