Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Mit dem benutzerdefinierten Extraktor werden Entitäten aus Dokumenten eines bestimmten Typs extrahiert. So kann das Tool beispielsweise die Elemente in einem Menü oder den Namen und die Kontaktdaten aus einem Lebenslauf extrahieren.
Übersicht
Das Ziel des benutzerdefinierten Extraktors ist es, Document AI-Nutzern die Möglichkeit zu geben, benutzerdefinierte Lösungen zur Entitätsextraktion für neue Dokumenttypen zu erstellen, für die keine vortrainierten Prozessoren verfügbar sind. Der benutzerdefinierte Extraktor umfasst eine Kombination aus layoutbewussten Deep-Learning-Modellen (für generative KI und benutzerdefinierte Modelle) und vorlagenbasierten Modellen.
Welche Trainingsmethode sollte ich verwenden?
Der benutzerdefinierte Extraktor unterstützt eine Vielzahl von Anwendungsfällen mit drei verschiedenen Modi.
Trainingsmethode
Beispieldokumente
Variationen des Dokumentlayouts
Freitext oder Absätze
Anzahl der Trainingsdokumente für eine produktionsreife Qualität, je nach Variabilität
Ähnliche Formulare mit Layoutabweichungen zwischen den Jahren oder Anbietern (z. B. W9).
Gering bis mittel.
Niedrig
Hoch: 10–100 Dokumente oder mehr.
Vorlage
Steuerformulare mit einem festen Layout, z. B. die Formulare 941 und 709.
Keine.
Niedrig
Niedrig (3 Dokumente)
Da Foundation Models in der Regel weniger Trainingsdokumente benötigen, werden sie als erste Option für alle variablen Layouts empfohlen.
Konfidenzwert
Der Konfidenzwert gibt an, wie stark Ihr Modell die einzelnen Einheiten mit dem vorhergesagten Wert in Verbindung bringt. Der Wert liegt zwischen 0 und 1. Je näher er an 1 liegt, desto höher ist die Konfidenz des Modells, dass der Wert der Entität entspricht.
So können Nutzer Trigger für die manuelle Überprüfung einzelner Einheiten festlegen, wenn der Wert niedrig ist. Beispiel: Ermitteln, ob der Text in einer Einheit „Hello, world!“ oder „HeIIo vvorld!“ lautet.
Die Vorteile dieses Ansatzes bestehen darin, dass einzelne Einheiten mit geringer Konfidenz erkannt werden können, Schwellenwerte für die Verwendung von Vorhersagen festgelegt werden können, der optimale Konfidenzschwellenwert ausgewählt werden kann und neue Strategien für das Trainieren von Modellen mit höherer Genauigkeit und höheren Konfidenzwerten entwickelt werden können.
Weitere Informationen zu Bewertungskonzepten und ‑messwerten finden Sie unter Leistung bewerten.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-04 (UTC)."],[[["\u003cp\u003eCustom extractors are designed to identify and extract specific entities from various document types, including menus and resumes, for which pre-trained processors may not exist.\u003c/p\u003e\n"],["\u003cp\u003eThe custom extractor employs a combination of layout-aware deep learning models and template-based models to accommodate diverse document structures.\u003c/p\u003e\n"],["\u003cp\u003eThree training methods are available for the custom extractor: fine-tuning with foundation models, custom models, and template-based models, each suited for different levels of document layout variability.\u003c/p\u003e\n"],["\u003cp\u003eFoundation models are the preferred training option for documents with variable layouts, as they typically require fewer training documents compared to other methods.\u003c/p\u003e\n"],["\u003cp\u003eThe confidence score, ranging from zero to one, indicates the model's certainty in associating a value with a predicted entity, enabling users to set review thresholds and improve model accuracy.\u003c/p\u003e\n"]]],[],null,["# Custom extractor overview\n=========================\n\nCustom extractor extracts entities from documents of a particular type. For\nexample, it can extract the items in a menu or the name and contact information\nfrom a resume.\n\nOverview\n--------\n\nThe goal of the custom extractor is to enable Document AI users to build\ncustom entity extraction solutions for new document\ntypes for which no pre-trained processors are available. Custom extractor includes\na combination of layout-aware deep learning models (for generative AI and custom\nmodels) and template-based models.\n\nWhich training method should I use?\n-----------------------------------\n\nCustom extractor supports a wide range of use cases with three different modes.\n\nBecause foundation models typically require fewer training documents, they're\nrecommended as the first option for all variable layouts.\n\nConfidence score\n----------------\n\nThe confidence score communicates how strongly your model associates each entity\nwith the predicted value. The value is between zero and one, the closer it is to\none, the higher the model's confidence that the value corresponds to the entity.\nThis allows users to set triggers for manual review of individual entities when\nthe value is low. For example, determining whether the text in an entity is\n\"Hello, world!\" or \"HeIIo vvorld!\"\n\nThe benefits of this approach allow for spotting individual entities with low\nconfidence, setting thresholds for which predictions are used, selecting the\noptimal [confidence threshold](/document-ai/docs/evaluate#confidence_threshold), and development\nof new strategies for training models with higher accuracy and confidence scores.\n\nFor more information on evaluation concepts and metrics, see [Evaluate\nPerformance](/document-ai/docs/evaluate#all-labels)"]]