Version vom Dezember 2022
HITL-Konfigurationsassistent
Der Tab „Konfiguration“ unter „Human-in-the-Loop“ ist jetzt als geordnetes Paar von Schritten formatiert, um die Einrichtung zu vereinfachen und zu strukturieren.
Der Nutzer kann jetzt separate Schritte zum Konfigurieren von Einstellungen für den Spezialistenpool und Filter zum Auslösen von HITL aufrufen und den Ort für Anweisungen und Ergebnisse für Spezialisten auswählen.
Version vom Oktober 2022
HITL Requester Analytics-Dashboard
„Human in the Loop“ hat jetzt einen eigenen Tab namens Analytics. Dort finden Nutzer Messwerte und Diagramme, mit denen sie den Status von HITL-Aufgaben pro Prozessor analysieren und bei Bedarf Änderungen vornehmen können.
Derzeit können Nutzer drei verschiedene Messwerte aufrufen. Die Daten können mit einer Zeitbereichsauswahl zusammengefasst werden, die dem Nutzer die folgenden Optionen bietet:
Für jeden ausgewählten Zeitraum kann der Nutzer Folgendes sehen:
- Zusammengefasste Statistiken: Eine Momentaufnahme der Gesamtzahl der Dokumente, die erfolgreich in die Warteschlange hochgeladen wurden, der Gesamtzahl der von Spezialisten bearbeiteten (d. h. eingereichten und abgelehnten) Dokumente und der Zeit seit dem Hinzufügen des ältesten Dokuments in der Warteschlange für den ausgewählten Zeitraum.
- Diagramm für Human-in-the-Loop-Aktivitäten: Ein Diagramm mit Zeitreihendaten, das zeigt, wann Dokumente der Warteschlange hinzugefügt wurden (
enqueuedDocumentCount
) und wann sie von Spezialisten bearbeitet wurden (completedDocumentCount
). - Human-in-the-Loop-Triggerrate: Ein Diagramm mit den Zeitreihendaten für den Prozentsatz der hochgeladenen Dokumente, die im ausgewählten Zeitraum eine Human-in-the-Loop-Überprüfung ausgelöst haben.
- Zusammengefasste Statistiken: Eine Momentaufnahme der Gesamtzahl der Dokumente, die erfolgreich in die Warteschlange hochgeladen wurden, der Gesamtzahl der von Spezialisten bearbeiteten (d. h. eingereichten und abgelehnten) Dokumente und der Zeit seit dem Hinzufügen des ältesten Dokuments in der Warteschlange für den ausgewählten Zeitraum.
Version vom September 2022
Hinweis: Kunden, die Document AI Workbench, Purchase Order (PO), Invoice und Expense Processors verwenden, haben Zugriff auf ein neues Schema, mit dem sie Checkboxen (sofern im Schema definiert) kennzeichnen und verschachtelte Einheiten, d.h. die Beziehung zwischen übergeordneten und untergeordneten Elementen, in der Benutzeroberfläche für die Annotation und Überprüfung von HITL-Aufgaben korrekt darstellen können. Wenn weitere Prozessoren das neue Schema übernehmen, werden diese Versionshinweise entsprechend aktualisiert.
Verschachtelte Entität
- Die Annotationsoberfläche unterstützt jetzt das Labeling für verschachtelte Einheiten. Der linke Bereich wurde aktualisiert und zeigt verschachtelte Zeilen für verschachtelte Einheiten an. Der Wert von „parent“ ist die Verkettung aller zugehörigen „children“.
- In der Entitätsauswahl im linken Bereich werden Labels für über- und untergeordnete Elemente angezeigt.
- Das Menü für das Labeln von Entitäten im Dokument wird ebenfalls aktualisiert, um das Labeln von verschachtelten Entitäten zu unterstützen.
- Wenn Sie auf ein verschachteltes Label klicken, wird ein Dialogfeld eingeblendet, in dem Sie die richtige übergeordnete Entität für die verschachtelte untergeordnete Entität zuweisen können.
Kästchen
- Die Annotations-Benutzeroberfläche unterstützt das Hinzufügen von Labels zu Kästchen. Im linken Bereich kann das Kästchen in der Zeile bearbeitet werden.
- Die Bearbeitung über das Kästchen ist auch im Dialogfeld zum Bearbeiten von Entitäten verfügbar.
August 2022
Entitätslabel auswählen
- Die Eingabe von Entitätslabels wird durch eine Drop-down-Liste ersetzt. Diese Drop-down-Liste enthält die verfügbaren Labeloptionen beim Hinzufügen einer neuen Einheit. Diese Änderung soll Tippfehler und unerwünschte Entity-Labels verhindern.
ISO-Datumsformat
- Normalisierte Datumsangaben werden im ISO 8601-Datumsformat(JJJJ-MM-TT) angezeigt.
Veröffentlichung im Juli 2022
Schaltfläche für Schnellbestätigung
- In den Tooltips für Entitäten ist eine Schaltfläche „Bestätigen“ verfügbar, mit der Sie einen Entitäts-/Labelwert schnell überprüfen und bestätigen können. Die Schaltfläche „Bearbeiten“ wurde entfernt, da Nutzer direkt auf die Kurzinfo für die Einheit klicken können, um sie zu bearbeiten.
Veröffentlichung im Januar 2022
Optionen für Entitätslabels
- Die Auswahloptionen für das Label der Einheit sind jetzt auf die Liste der gefilterten Felder beschränkt, die in der HITL-Filterkonfiguration festgelegt sind.
Fehlende Felder
- Fehlende Felder (d. h. Felder, die in der HITL-Filterkonfiguration als „Erforderlich“ gekennzeichnet sind, für die der Prozessor aber keine Werte vorhergesagt hat) werden jetzt in einer auffälligen roten Farbe angezeigt. So kann der Prüfer den Wert des Felds ganz einfach aktualisieren.
Zufällige vollständige Stichproben
- Wir unterstützen jetzt die vollständige Überprüfung (d.h. alle Einheiten im Dokument, nicht nur die gefilterten Felder) einer Stichprobe von Dokumenten (z.B. 2% des täglichen Volumens). Das ist nützlich, um die Modellabweichung und die Analysen zur Genauigkeit des Prozessors in jedem Feld zu überwachen. Wir erfassen diese Analysen, um zu wissen, wann ein erneutes Training erforderlich ist. Es dient auch als Dataset mit gelabeltem Ground Truth für das Trainieren von Modellen.
- Kunden können die zufällige Stichprobe [1–10%] basierend auf ihrem Volumen aktivieren und festlegen. Es wäre hilfreich, wenn Sie 100–500 Proben pro Woche analysieren könnten. Wenn ein Kunde also 10.000 Dokumente pro Woche verarbeitet, kann dieser Wert auf 500/10.000 = 5 % festgelegt werden.
Vereinfachte HITL-Konfiguration für neue Nutzer
- Wir haben die BYOL-HITL-Konfiguration für HITL-Neukunden vereinfacht. Sie können jetzt schnell eine Aufgabe konfigurieren, Spezialisten zuweisen und sie über einen einzigen Bildschirm starten. So können sie die Funktion schnell testen, bevor sie das Produktionsvolumen erhöhen oder den Vorgang auslagern.
- Wie im Screenshot unten zu sehen ist, wird der Nutzer zum Standardmanager des Pools ernannt. Er kann weitere Spezialisten hinzufügen, die alle auf demselben Bildschirm automatisch der Aufgabe zugewiesen werden.
- Bisher wurde dem zugewiesenen Manager ein Link zur Manager Console gesendet, in der er Spezialisten hinzufügt und die Aufgabe diesen Spezialisten zuweist.
- Nachdem sie die Aufgabe eingereicht haben, können sie (und andere zugewiesene Spezialisten) in der HITL-App Dokumente überprüfen.
- Der Nutzer kann auch ein Testdokument (jeweils einzeln) in die Aufgabenwarteschlange hochladen.
Entfernen des abschließenden Zeilenumbruchs
- Nachgestellte Zeilenumbrüche („\n“) werden in „entity.mentionText“ entfernt.
Version vom Dezember 2021
Entitäten mit niedrigem Konfidenzwert oben sortieren
- Die Objekte mit niedriger Konfidenz (d.h. Objekte unter dem Konfidenzschwellenwert) werden jetzt oben auf der Seite sortiert, damit sich der Spezialist auf diese Objekte konzentrieren kann. Das führt zu einer weiteren Effizienzsteigerung beim Labeling.
Anleitung für BYOL-Aufgaben optional
- Die PDF-Anleitung, die zum Konfigurieren einer HITL-Aufgabe hochgeladen werden muss, ist jetzt optional. Das vereinfacht Tests und schnelle interne Markteinführungen, bei denen die Spezialisten keine Anleitung benötigen.
Optionen „An Breite anpassen“ und „An Seitenhöhe anpassen“
- Schaltfläche zum Anpassen der Seite an die Breite oder Höhe. Das ist nützlich, wenn Spezialisten in einer Aufgabe Dokumente mit variabler Größe haben, z.B. Belege.
Aufgabennamen, der in der Spezialisten-Benutzeroberfläche angezeigt wird
- Der Aufgabenname wird jetzt in der Spezialisten-Benutzeroberfläche angezeigt, um zusätzlichen Kontext zur Aufgabe und zum Dokumenttyp zu liefern. Das ist sehr nützlich, wenn einem Spezialisten mehrere Aufgaben zugewiesen sind.
- Hinweis: Diese Informationen werden in neuen Prozessoren angezeigt, die nach diesem Release gestartet werden.
Suchfeld für Spezialisten
- Spezialisten können in Dokumenten nach Elementen/Text suchen. Das ist besonders bei großen, mehrseitigen Dokumenten hilfreich und steigert die Produktivität der Spezialisten.
Veröffentlichung im September 2021
Umschalten, um alle Felder anzuzeigen
- Labeler müssen möglicherweise Felder überprüfen und aktualisieren, die für bestimmte Dokumente in der Warteschlange nicht im gefilterten Satz von Rechtssubjekten enthalten sind.
Sie können die Option Alle Vorhersagen anzeigen aktivieren, damit Labeler auch nicht gefilterte Felder prüfen können.
HITL für Formularparser
- HITL unterstützt jetzt den Formularparser. Nutzer können die vom Formularparser extrahierten Schlüssel/Wert-Paare also prüfen und korrigieren. Der Kunde kann HITL für den Form Parser-Prozessor auf der DocAI-Plattform aktivieren und die Schlüsselnamen konfigurieren (siehe Screenshot unten), nach denen er für die HITL-Überprüfung filtern möchte. Die HITL-Ausgabe wird nach Abschluss der HITL-Überprüfung als JSON-Dateien im vom Kunden angegebenen Google Cloud Storage-Bucket abgelegt.
- Sie können durch Kommas getrennte alternative Schlüsselnamen angeben, z. B. „customer, customer name, client, account #, account number“. So werden Dokumente mit allen Schlüsselnamensvarianten vom HITL-Filter erfasst und zur HITL-Überprüfung gesendet.
Version vom August 2021
Audit-/QA-Pipeline
- HITL ermöglicht jetzt eine zweite QA- oder Audit-Phase und gibt die Genauigkeit der Überprüfungsaufgaben (und der Labeler) an. Einem Team für Qualitätssicherung oder einem Prüfer kann die Rolle „Expert Labeler“ für eine Aufgabe zugewiesen werden. Das QA-Team/der Auditor erhält X Prozent (z. B. 1–100 %, vom Kunden konfigurierbar) der überprüften Dokumente. Der Auditor kann die Ausgabe des Prüfers korrigieren. Das System verfolgt die Korrekturen und weist jedem geprüften Dokument einen Genauigkeitswert zu (z.B. 90%). Der aggregierte Genauigkeitswert einer Aufgabe oder eines Labelers wird im jeweiligen Dashboard für Aufgaben- und Labeler-Analysen angegeben.
- Hier finden Sie eine ausführliche Anleitung zum Konfigurieren einer Audit-Pipeline.
- Prüfer benennen
- Berichtsgenauigkeit
Lending AI-Parser (15. August)
- HITL wird jetzt für einige Lending AI-Parser unterstützt, darunter 1040, 1040 Schedule E, 1040 Schedule C, 1099 DIV, 1099 G, 1099 INT, 1099 MISC, Paystubs, Banks Statements, W2, W9, 1120, 1120S, 1065, SSA-1099, 1099 NEC und 1099-R.
Version vom Juli 2021
Standard- und dringende Warteschlangen (2. Juli)
- Wir unterstützen jetzt zwei Prioritätswarteschlangen (statt einer) für jeden Prozessor, basierend auf der Dringlichkeit der einzelnen Dokumente.
- Einreichung: Nach der Vorhersage können die extrahierten Dokumente auf Dringlichkeit geprüft und je nach Dringlichkeit des Dokuments in zwei Warteschlangen eingereicht werden (Standard vs. Dringend/Fast-Track). Rechnungen mit dringenden Fälligkeitsdaten können beispielsweise in die Fast-Track-Warteschlange eingereicht werden. Die Logik, mit der die Dringlichkeit bewertet wird, befindet sich derzeit außerhalb von HITL und kann eine benutzerdefinierte Funktion sein.
- Aufgabenzuweisung: Der Labeling-Manager sieht zwei verschiedene Warteschlangen mit unterschiedlichen Prioritäten, wie im Screenshot unten dargestellt, und kann dieselbe Gruppe von Labelern beiden Warteschlangen zuweisen.
- Aufgabenpriorisierung: Labeler, die beiden Aufgaben zugewiesen sind, bearbeiten immer zuerst alle ausstehenden Dokumente in der Fast-Track-Warteschlange, bevor sie die Standardwarteschlange bearbeiten.Die Priorisierung der Warteschlange wird also automatisch vom System übernommen.
- API-Aufruf – Legen Sie das Feld priority im ReviewDocument fest.
- Screenshot der Benutzeroberfläche (von Aufgaben in der Labeling Manager-Benutzeroberfläche) –
Version vom Juni 2021
Validierungsfilter für HITL-Endpunkt (24. Juni)
- Die im Prozessor konfigurierten Validierungsfilter, mit denen die Felder nach Konfidenzwert gefiltert werden, um zu bestimmen, welche Dokumente für die manuelle Überprüfung in die Warteschlange gestellt werden, werden jetzt auch auf Dokumente angewendet, die an den HITL-Endpunkt gesendet werden.
- Setzen Sie beim Aufrufen der ReviewDocument API das Feld enable_schema_validation auf „true“.
- Wenn dieser Wert festgelegt ist und bei der Validierung festgestellt wird, dass für das Dokument keine manuelle Überprüfung erforderlich ist, wird der Fehler CANCELLED zurückgegeben.
API kündigen
Kunden können ein Dokument, das für die HITL-Verarbeitung in die Warteschlange gestellt wurde, abbrechen, indem sie die Cancel API für eine bestimmte Vorgangs-ID aufrufen. Für jedes an HITL gesendete Dokument wird eine Vorgangs-ID zurückgegeben.
`POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
Rechnungsart (Überprüfung der Klassifizierung)
- Die Labeler Workbench unterstützt die Überprüfung der Klassifizierung von Rechnungstypen.
Bericht „Wartezeit in der Warteschlange (HITL-Latenz-SLO)“
- In einem Bericht wird angezeigt, wie viele Dokumente seit mehr als 18 Stunden und seit mehr als 24 Stunden in der Warteschlange sind. Das ist nützlich für Nutzer, die eine SLO-Erwartung für die HITL-Latenz verwalten müssen.
Bekannte URL für Labeler Workbench
- Labeler, die einem einzelnen Pool zugewiesen sind, können jetzt über eine bekannte URL auf die Workbench zugreifen und müssen nicht mehr nach kryptischen URLs suchen, die in E-Mail-Benachrichtigungen (vom System oder vom Labeling Manager) gesendet werden. Diese URL funktioniert nicht für Labeler, die mehreren Pools zugewiesen sind.
Einstellung für fixierten Zoom
- Das Plug-in merkt sich jetzt die Zoom-Einstellung des Labelers (volle Breite vs. volle Seite) für die nächsten Dokumentprüfungen in der Warteschlange, sodass er nicht für jedes Dokument zoomen muss.
HITL für Formularparser
- HITL unterstützt jetzt den Formularparser. Nutzer können die von Form Parser extrahierten Schlüssel/Wert-Paare prüfen und korrigieren, HITL für den Form Parser-Prozessor in der DocAI-Plattform aktivieren und die Schlüsselnamen konfigurieren, nach denen für die HITL-Prüfung gefiltert werden soll (siehe Screenshot unten). Die HITL-Ausgabe wird nach Abschluss der HITL-Überprüfung in JSON-Dateien im vom Kunden angegebenen Google Cloud Storage-Bucket gespeichert.
- Screenshots der Benutzeroberfläche zum Konfigurieren von HITL für Formularparser
- Benutzeroberfläche zum Konfigurieren der Validierung auf Schlüsselebene
- Labeler-Benutzeroberfläche
Audit-/QA-Pipeline
- HITL ermöglicht jetzt eine zweite QA- oder Audit-Phase und gibt die Genauigkeit der Überprüfungsaufgaben (und der Labeler) an. Einem Team für Qualitätssicherung oder einem Prüfer kann die Rolle „Expert Labeler“ für eine Aufgabe zugewiesen werden. Das QA-Team/der Auditor erhält X Prozent (z. B. 1–100 %, vom Kunden konfigurierbar) der geprüften Dokumente. Der Auditor kann die Ausgabe des Prüfers korrigieren. Das System verfolgt die Korrekturen und weist jedem geprüften Dokument einen Genauigkeitswert zu (z.B. 90%). Der aggregierte Genauigkeitswert einer Aufgabe oder eines Labelers wird im jeweiligen Dashboard für Aufgaben- und Labeler-Analysen angegeben. Hier finden Sie eine detaillierte Anleitung zum Konfigurieren einer Audit-Pipeline.
Prüfer benennen
Berichtsgenauigkeit
Lending AI-Parser (31. Juli)
- HITL wird jetzt für einige Lending AI-Parser unterstützt, darunter 1040, 1040 Schedule E, 1040 Schedule C, 1099 DIV, 1099 G, 1099 INT, 1099 MISC, Paystubs, Banks Statements, W2, W9, 1120, 1120S, 1065, SSA-1099, 1099 NEC und 1099-R.
Standard- und Fast Track-Warteschlangen (2. Juli)
- Wir unterstützen jetzt zwei Prioritätswarteschlangen (statt einer) für jeden Prozessor, basierend auf der Dringlichkeit der einzelnen Dokumente.
- Einreichung: Nach der Vorhersage können die extrahierten Dokumente auf Dringlichkeit geprüft und je nach Dringlichkeit des Dokuments in zwei Warteschlangen eingereicht werden (Standard vs. Dringend/Fast-Track). Rechnungen mit dringenden Fälligkeitsdaten können beispielsweise in die Fast-Track-Warteschlange eingereicht werden. Die Logik, mit der die Dringlichkeit bewertet wird, kann über eine benutzerdefinierte Funktion eingegeben werden.
- Aufgabenzuweisung: Der Labeling-Manager sieht zwei verschiedene Warteschlangen mit unterschiedlichen Prioritäten, wie im Screenshot unten dargestellt, und kann dieselbe Gruppe von Labelern beiden Warteschlangen zuweisen.
- Aufgabenpriorisierung: Labeler, die beiden Aufgaben zugewiesen sind, bearbeiten immer zuerst alle ausstehenden Dokumente in der Fast-Track-Warteschlange, bevor sie die Standardwarteschlange bearbeiten.Die Priorisierung der Warteschlange wird also automatisch vom System übernommen.
- API-Aufruf – Legen Sie das Feld priority im ReviewDocument fest.
- Screenshot der Benutzeroberfläche (von Aufgaben in der Labeling Manager-Benutzeroberfläche)
Validierungsfilter für HITL-Endpunkt (24. Juni)
- Die im Prozessor konfigurierten Validierungsfilter, mit denen die Felder nach Konfidenzwert gefiltert werden, um zu bestimmen, welche Dokumente für die manuelle Überprüfung in die Warteschlange gestellt werden, werden jetzt auch auf Dokumente angewendet, die an den HITL-Endpunkt gesendet werden.
- Wenn Sie die
ReviewDocument
API aufrufen, setzen Sie das Feld enable_schema_validation auf „true“. Wenn dieser Wert festgelegt ist und bei der Validierung festgestellt wird, dass für das Dokument keine manuelle Überprüfung erforderlich ist, wird ein CANCELLED-Fehler zurückgegeben.
API kündigen
Sie können ein Dokument, das für die HITL-Verarbeitung in die Warteschlange gestellt wurde, abbrechen, indem Sie die Cancel API für eine bestimmte Vorgangs-ID aufrufen. [Für jedes an HITL gesendete Dokument wird eine Vorgangs-ID zurückgegeben.]
`POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
Rechnungsart (Überprüfung der Klassifizierung)
- Die Labeler Workbench unterstützt die Überprüfung der Klassifizierung von Rechnungstypen.
Bericht „Wartezeit in der Warteschlange (HITL-Latenz-SLO)“
- In einem Bericht wird angezeigt, wie viele Dokumente seit mehr als 18 Stunden und seit mehr als 24 Stunden in der Warteschlange sind. Das ist nützlich für Nutzer, die eine SLO-Erwartung für die HITL-Latenz verwalten müssen.
Bekannte URL für Labeler Workbench
- Labeler, die einem einzelnen Pool zugewiesen sind, können jetzt über eine bekannte URL auf die Workbench zugreifen: https://datacompute.corp.google.com/w/. Das ist nützlich, falls die E-Mail mit der URL, die vom System oder Labeling Manager gesendet wurde, einmal verloren geht. Diese URL funktioniert nicht für Labeler, die mehreren Pools zugewiesen sind.
Einstellung für fixierten Zoom
- Das Plug-in speichert jetzt die Zoom-Einstellung (volle Breite oder ganze Seite) eines Labelers für die nächsten Dokumentprüfungen in der Warteschlange, sodass er nicht für jedes Dokument zoomen muss.