L'analizzatore sintattico di moduli estrae coppie chiave-valore, tabelle, segni di selezione (caselle di controllo)
e campi generici per aumentare e automatizzare l'estrazione. Può estrarre fino a 11
entità generiche e caselle di controllo predefinite. Non specificare i campi (schema)
che vuoi estrarre con l'analizzatore sintattico di moduli. Il modello rileva e restituisce le entità
di interesse da ogni pagina dei documenti.
Estrattore personalizzato
L'estrattore personalizzato estrae le entità che definisci nello schema e offre tre opzioni di modellazione: modello di base, modello personalizzato e modello personalizzato basato su modello. Dato che i modelli di base
hanno dato risultati promettenti con pochi o nessun dato di addestramento, ti consigliamo di iniziare
con il modello di base come prima opzione e provare altre opzioni in base alle necessità.
I modelli di base eseguono la previsione zero-shot o few-shot in base a un massimo di 5 documenti etichettati nel set di dati e la previsione ottimizzata con più di 10 documenti etichettati nel set di dati.
Metodo di addestramento
Esempi di documenti
Variante del layout del documento
Testo o paragrafi in formato libero
Numero di documenti di addestramento per una qualità pronta per la produzione, a seconda della variabilità
Modello di base e ottimizzazione (AI generativa).
Contratto, termini di servizio, fattura, estratto conto bancario, polizza di carico, buste paga.
Dal più alto al più basso (preferito).
Alto.
Medio: 0-50+ documenti.
Modello personalizzato.
Modello.
Moduli simili con variazioni di layout nel corso degli anni o tra i fornitori (ad esempio, il modulo W9).
Da basso a medio.
Basso.
Alto: 10-100+ documenti.
Modello.
Moduli fiscali con un layout fisso (ad esempio, i moduli 941 e 709).
Nessuno.
Basso.
Basso (3 documenti).
Poiché i modelli di base in genere richiedono meno documenti di addestramento, sono
consigliati come prima opzione per tutti i layout delle variabili.
Parser del layout
Layout Parser trasforma i documenti in vari formati in rappresentazioni strutturate, rendendo accessibili contenuti come paragrafi, tabelle, elenchi ed elementi strutturali come intestazioni, intestazioni di pagina e piè di pagina e creando blocchi sensibili al contesto che facilitano il recupero di informazioni in una serie di app di AI generativa e di scoperta.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[[["\u003cp\u003eDocument AI offers tools like Form Parser, Custom extractor, and Layout Parser for extracting information from documents based on various use cases.\u003c/p\u003e\n"],["\u003cp\u003eForm Parser automatically extracts key-value pairs, tables, selection marks, and up to 11 generic entities without needing a predefined schema.\u003c/p\u003e\n"],["\u003cp\u003eThe Custom extractor allows users to define their extraction schema and offers three modeling options: foundation model, custom model-based, and custom template-based.\u003c/p\u003e\n"],["\u003cp\u003eFoundation models in Custom extractors are recommended as the first option due to their ability to perform with minimal training data.\u003c/p\u003e\n"],["\u003cp\u003eLayout Parser transforms documents into structured data, identifying elements such as paragraphs, tables, lists, headings, and headers/footers, for use in information retrieval and generative AI applications.\u003c/p\u003e\n"]]],[],null,["# Extraction overview\n===================\n\nDocument AI offers multiple products to extract information from documents\nfor different use cases:\n\n- [Form Parser](#form-parser)\n- Custom extractor, which offers three different modeling types:\n\n - Foundation model\n - Custom model based\n - Custom template based\n- [Layout Parser](#layout-parser)\n\nForm Parser\n-----------\n\nForm Parser extracts key-value pairs (KVP), tables, selection marks (checkboxes),\nand generic fields to augment and automate extraction. It can extract up to 11\ngeneric entities and checkboxes out of the box. You don't specify the fields (schema),\nyou want to extract with the Form Parser. The model detects and returns entities\nof interest from each page of documents.\n\nCustom extractor\n----------------\n\nThe custom extractor extracts entities you define in schema and offers three modeling options:\nfoundation model, custom model based, and custom template based. Given promising\nresults from foundation models with little to no training data, we recommend starting\nwith the foundation model as the first option and try out other options as needed.\nThe foundation models do zero- to few-shot prediction, based on up to 5 labeled\ndocuments in the dataset, and fine-tuned prediction with more than 10 labeled documents in the dataset.\n\nBecause foundation models typically require fewer training documents, they're\nrecommended as the first option for all variable layouts.\n\nLayout Parser\n-------------\n\n| **Note:** Layout Parser is in Public preview\n\nLayout Parser transforms documents in various formats into structured\nrepresentations, making content like paragraphs, tables, lists, and structural\nelements like headings, page headers, and footers accessible, and creating\ncontext-aware chunks that facilitate information retrieval in a range of\ngenerative AI and discovery apps."]]