Benutzerdefinierter Extrahierer – Übersicht

Mit einem benutzerdefinierten Extractor werden Entitäten aus Dokumenten eines bestimmten Typs extrahiert. So können beispielsweise die Elemente in einem Menü oder der Name und die Kontaktdaten aus einem Lebenslauf extrahiert werden.

Übersicht

Der benutzerdefinierte Extractor soll es Document AI-Nutzern ermöglichen, benutzerdefinierte Lösungen für die Entitätsextraktion für neue Dokumenttypen zu erstellen, für die keine vortrainierten Prozessoren verfügbar sind. Der benutzerdefinierte Extractor umfasst eine Kombination aus layoutbewussten Deep-Learning-Modellen (für generative KI und benutzerdefinierte Modelle) und stempelbasierten Modellen.

Welche Trainingsmethode sollte ich verwenden?

Der benutzerdefinierte Extractor unterstützt mit drei verschiedenen Modi eine Vielzahl von Anwendungsfällen.

Trainingsmethode Dokumentbeispiele Abweichungen beim Dokumentlayout Freitext oder Absätze Anzahl der Trainingsdokumente für die produktionsreife Qualität, je nach Variabilität
Foundation Model (generative KI) optimieren. Vertrag, Nutzungsbedingungen, Rechnung, Kontoauszug, Frachtbrief, Lohnabrechnung Von hoch nach niedrig (bevorzugt) Hoch. Mittel: 0–50 Dokumente
Benutzerdefiniertes Modell Modell. Ähnliche Formulare mit unterschiedlichem Layout über Jahre oder Anbieter hinweg (z. B. W9) Niedrig bis mittel. Niedrig. Hoch: 10–100 Dokumente oder mehr
Vorlage Steuerformulare mit einem festen Layout (z. B. Formulare 941 und 709) Niedrig. Niedrig (3 Dokumente)

Da für Basismodelle in der Regel weniger Trainingsdokumente erforderlich sind, werden sie als erste Option für alle variablen Layouts empfohlen.

Konfidenzwert

Der Konfidenzwert gibt an, wie stark Ihr Modell die einzelnen Entitäten mit dem prognostizierten Wert verknüpft. Der Wert liegt zwischen null und eins. Je näher er an eins liegt, desto höher ist die Wahrscheinlichkeit, dass der Wert der Entität entspricht. So können Nutzer Trigger für die manuelle Überprüfung einzelner Entitäten festlegen, wenn der Wert niedrig ist. Beispiel: Es wird ermittelt, ob der Text in einem Element „Hallo Welt!“ oder „Hallo Welt!“ lautet.

Mit diesem Ansatz lassen sich einzelne Entitäten mit geringer Konfidenz erkennen, Grenzwerte für die Verwendung von Vorhersagen festlegen, der optimale Konfidenzgrenzwert ausgewählt und neue Strategien für das Training von Modellen mit höherer Genauigkeit und Konfidenzwerten entwickelt werden.

Weitere Informationen zu Bewertungskonzepten und ‑messwerten finden Sie unter Leistung bewerten.