Información general sobre los extractores personalizados
Organízate con las colecciones
Guarda y clasifica el contenido según tus preferencias.
El extractor personalizado extrae entidades de documentos de un tipo concreto. Por ejemplo, puede extraer los elementos de un menú o el nombre y la información de contacto de un currículum.
Información general
El objetivo del extractor personalizado es permitir que los usuarios de Document AI creen soluciones de extracción de entidades personalizadas para nuevos tipos de documentos para los que no hay procesadores preentrenados disponibles. El extractor personalizado incluye una combinación de modelos de aprendizaje profundo que tienen en cuenta el diseño (para IA generativa y modelos personalizados) y modelos basados en plantillas.
¿Qué método de entrenamiento debo usar?
El extractor personalizado admite una amplia gama de casos prácticos con tres modos diferentes.
Método de entrenamiento
Ejemplos de documentos
Variación del diseño del documento
Texto o párrafos de formato libre
Número de documentos de entrenamiento para alcanzar una calidad apta para producción, en función de la variabilidad
Afinación y modelo básico (IA generativa).
Contrato, términos del servicio, factura, extracto bancario, conocimiento de embarque o nómina.
De alto a bajo (opción preferida).
Alto.
Medio: de 0 a 50 documentos.
Modelo personalizado.
Modelo.
Formularios similares con variaciones en el diseño a lo largo de los años o entre proveedores (por ejemplo, el formulario W9).
De baja a media.
Bajo.
Alto: de 10 a más de 100 documentos.
Plantilla.
Formularios fiscales con un diseño fijo (por ejemplo, los formularios 941 y 709).
Ninguno
Bajo.
Bajo (3 documentos).
Como los modelos fundacionales suelen requerir menos documentos de entrenamiento, se recomiendan como primera opción para todos los diseños variables.
Puntuación de confianza
La puntuación de confianza indica la solidez con la que tu modelo asocia cada entidad con el valor previsto. El valor está comprendido entre cero y uno. Cuanto más se acerque a uno, mayor será la confianza del modelo en que el valor corresponde a la entidad.
De esta forma, los usuarios pueden definir activadores para revisar manualmente entidades concretas cuando el valor es bajo. Por ejemplo, determinar si el texto de una entidad es "Hello, world!" o "HeIIo vvorld!".
Las ventajas de este enfoque permiten detectar entidades individuales con un nivel de confianza bajo, establecer umbrales para las predicciones que se utilizan, seleccionar el umbral de confianza óptimo y desarrollar nuevas estrategias para entrenar modelos con puntuaciones de precisión y confianza más altas.
Para obtener más información sobre los conceptos y las métricas de evaluación, consulta Evaluar el rendimiento.
[[["Es fácil de entender","easyToUnderstand","thumb-up"],["Me ofreció una solución al problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Es difícil de entender","hardToUnderstand","thumb-down"],["La información o el código de muestra no son correctos","incorrectInformationOrSampleCode","thumb-down"],["Me faltan las muestras o la información que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-10 (UTC)."],[[["\u003cp\u003eCustom extractors are designed to identify and extract specific entities from various document types, including menus and resumes, for which pre-trained processors may not exist.\u003c/p\u003e\n"],["\u003cp\u003eThe custom extractor employs a combination of layout-aware deep learning models and template-based models to accommodate diverse document structures.\u003c/p\u003e\n"],["\u003cp\u003eThree training methods are available for the custom extractor: fine-tuning with foundation models, custom models, and template-based models, each suited for different levels of document layout variability.\u003c/p\u003e\n"],["\u003cp\u003eFoundation models are the preferred training option for documents with variable layouts, as they typically require fewer training documents compared to other methods.\u003c/p\u003e\n"],["\u003cp\u003eThe confidence score, ranging from zero to one, indicates the model's certainty in associating a value with a predicted entity, enabling users to set review thresholds and improve model accuracy.\u003c/p\u003e\n"]]],[],null,["Custom extractor extracts entities from documents of a particular type. For\nexample, it can extract the items in a menu or the name and contact information\nfrom a resume.\n\nOverview\n\nThe goal of the custom extractor is to enable Document AI users to build\ncustom entity extraction solutions for new document\ntypes for which no pre-trained processors are available. Custom extractor includes\na combination of layout-aware deep learning models (for generative AI and custom\nmodels) and template-based models.\n\nWhich training method should I use?\n\nCustom extractor supports a wide range of use cases with three different modes.\n\n| **Training method** || **Document examples** | **Document layout variation** | **Free form text or paragraphs** | **Number of training documents for production-ready quality, depending on variability** |\n|---------------|-----------|--------------------------------------------------------------------------------|-------------------------------|----------------------------------|-----------------------------------------------------------------------------------------|\n| Fine tune and foundation model (generative AI). || Contract, terms of service, invoice, bank statement, bill of lading, payslips. | High to Low (preferred). | High. | Medium: 0-50+ documents. |\n| Custom model. | Model. | Similar forms with layout variation across years or vendors (for example, W9). | Low to medium. | Low. | High: 10-100+ documents. |\n| Custom model. | Template. | Tax forms with a fixed layout (for example, Forms 941 and 709). | None. | Low. | Low (3 documents). |\n\nBecause foundation models typically require fewer training documents, they're\nrecommended as the first option for all variable layouts.\n\nConfidence score\n\nThe confidence score communicates how strongly your model associates each entity\nwith the predicted value. The value is between zero and one, the closer it is to\none, the higher the model's confidence that the value corresponds to the entity.\nThis allows users to set triggers for manual review of individual entities when\nthe value is low. For example, determining whether the text in an entity is\n\"Hello, world!\" or \"HeIIo vvorld!\"\n\nThe benefits of this approach allow for spotting individual entities with low\nconfidence, setting thresholds for which predictions are used, selecting the\noptimal [confidence threshold](/document-ai/docs/evaluate#confidence_threshold), and development\nof new strategies for training models with higher accuracy and confidence scores.\n\nFor more information on evaluation concepts and metrics, see [Evaluate\nPerformance](/document-ai/docs/evaluate#all-labels)"]]