Benutzerdefinierter Extrahierer – Übersicht

Mit dem benutzerdefinierten Extraktor werden Entitäten aus Dokumenten eines bestimmten Typs extrahiert. So kann das Tool beispielsweise die Elemente in einem Menü oder den Namen und die Kontaktdaten aus einem Lebenslauf extrahieren.

Übersicht

Das Ziel des benutzerdefinierten Extraktors ist es, Document AI-Nutzern die Möglichkeit zu geben, benutzerdefinierte Lösungen zur Entitätsextraktion für neue Dokumenttypen zu erstellen, für die keine vortrainierten Prozessoren verfügbar sind. Der benutzerdefinierte Extraktor umfasst eine Kombination aus layoutbewussten Deep-Learning-Modellen (für generative KI und benutzerdefinierte Modelle) und vorlagenbasierten Modellen.

Welche Trainingsmethode sollte ich verwenden?

Der benutzerdefinierte Extraktor unterstützt eine Vielzahl von Anwendungsfällen mit drei verschiedenen Modi.

Trainingsmethode Beispieldokumente Variationen des Dokumentlayouts Freitext oder Absätze Anzahl der Trainingsdokumente für eine produktionsreife Qualität, je nach Variabilität
Optimierung und Foundation Model (generative KI) Vertrag, Nutzungsbedingungen, Rechnung, Kontoauszug, Frachtbrief, Lohnabrechnungen. Absteigend (bevorzugt) Hoch Mittel: 0–50+ Dokumente
Benutzerdefiniertes Modell Modell Ähnliche Formulare mit Layoutabweichungen zwischen den Jahren oder Anbietern (z. B. W9). Gering bis mittel. Niedrig Hoch: 10–100 Dokumente oder mehr.
Vorlage Steuerformulare mit einem festen Layout, z. B. die Formulare 941 und 709. Keine. Niedrig Niedrig (3 Dokumente)

Da Foundation Models in der Regel weniger Trainingsdokumente benötigen, werden sie als erste Option für alle variablen Layouts empfohlen.

Konfidenzwert

Der Konfidenzwert gibt an, wie stark Ihr Modell die einzelnen Einheiten mit dem vorhergesagten Wert in Verbindung bringt. Der Wert liegt zwischen 0 und 1. Je näher er an 1 liegt, desto höher ist die Konfidenz des Modells, dass der Wert der Entität entspricht. So können Nutzer Trigger für die manuelle Überprüfung einzelner Einheiten festlegen, wenn der Wert niedrig ist. Beispiel: Ermitteln, ob der Text in einer Einheit „Hello, world!“ oder „HeIIo vvorld!“ lautet.

Die Vorteile dieses Ansatzes bestehen darin, dass einzelne Einheiten mit geringer Konfidenz erkannt werden können, Schwellenwerte für die Verwendung von Vorhersagen festgelegt werden können, der optimale Konfidenzschwellenwert ausgewählt werden kann und neue Strategien für das Trainieren von Modellen mit höherer Genauigkeit und höheren Konfidenzwerten entwickelt werden können.

Weitere Informationen zu Bewertungskonzepten und ‑messwerten finden Sie unter Leistung bewerten.