Descripción general del extractor personalizado

El extractor personalizado extrae entidades de documentos de un tipo particular. Por ejemplo, puede extraer los elementos de un menú o el nombre y la información de contacto de un currículum.

Descripción general

El objetivo del extractor personalizado es permitir que los usuarios de Document AI creen soluciones de extracción de entidades personalizadas para nuevos tipos de documentos para los que no hay procesadores previamente entrenados disponibles. El extractor personalizado incluye una combinación de modelos de aprendizaje profundo que tienen en cuenta el diseño (para modelos personalizados y de IA generativa) y modelos basados en plantillas.

¿Qué método de entrenamiento debo usar?

El extractor personalizado admite una amplia variedad de casos de uso con tres modos diferentes.

Método de entrenamiento Ejemplos de documentos Variación del diseño del documento Texto o párrafos de formato libre Cantidad de documentos de entrenamiento para una calidad lista para la producción, según la variabilidad
Modelo de ajuste y de base (IA generativa) Contrato, condiciones del servicio, factura, estado de cuenta, conocimiento de embarque o comprobantes de pago De mayor a menor (opción preferida) Alto. Mediana: De 0 a más de 50 documentos
Modelo personalizado. Modelo. Formularios similares con variación de diseño entre años o proveedores (por ejemplo, el W9) De baja a media. Baja. Alta: De 10 a más de 100 documentos
Plantilla. Formularios fiscales con un diseño fijo (por ejemplo, los formularios 941 y 709) Ninguno Baja. Baja (3 documentos).

Dado que los modelos de base suelen requerir menos documentos de entrenamiento, se recomiendan como la primera opción para todos los diseños de variables.

Puntuación de confianza

La puntuación de confianza comunica la intensidad con la que tu modelo asocia cada entidad con el valor predicho. El valor se encuentra entre cero y uno. Cuanto más cerca esté de uno, mayor será la confianza del modelo en que el valor corresponde a la entidad. Esto permite que los usuarios establezcan activadores para la revisión manual de entidades individuales cuando el valor es bajo. Por ejemplo, determinar si el texto de una entidad es "Hello, world!" o "HeIIo vvorld!"

Los beneficios de este enfoque permiten detectar entidades individuales con un nivel de confianza bajo, establecer umbrales para las predicciones que se usan, seleccionar el umbral de confianza óptimo y desarrollar nuevas estrategias para entrenar modelos con puntuaciones de confianza y precisión más altas.

Para obtener más información sobre los conceptos y las métricas de evaluación, consulta Evalúa el rendimiento.