Información general sobre los extractores personalizados

El extractor personalizado extrae entidades de documentos de un tipo concreto. Por ejemplo, puede extraer los elementos de un menú o el nombre y la información de contacto de un currículum.

Información general

El objetivo del extractor personalizado es permitir que los usuarios de Document AI creen soluciones de extracción de entidades personalizadas para nuevos tipos de documentos para los que no hay procesadores preentrenados disponibles. El extractor personalizado incluye una combinación de modelos de aprendizaje profundo que tienen en cuenta el diseño (para IA generativa y modelos personalizados) y modelos basados en plantillas.

¿Qué método de entrenamiento debo usar?

El extractor personalizado admite una amplia gama de casos prácticos con tres modos diferentes.

Método de entrenamiento Ejemplos de documentos Variación del diseño del documento Texto o párrafos de formato libre Número de documentos de entrenamiento para alcanzar una calidad apta para producción, en función de la variabilidad
Afinación y modelo básico (IA generativa). Contrato, términos del servicio, factura, extracto bancario, conocimiento de embarque o nómina. De alto a bajo (opción preferida). Alto. Medio: de 0 a 50 documentos.
Modelo personalizado. Modelo. Formularios similares con variaciones en el diseño a lo largo de los años o entre proveedores (por ejemplo, el formulario W9). De baja a media. Bajo. Alto: de 10 a más de 100 documentos.
Plantilla. Formularios fiscales con un diseño fijo (por ejemplo, los formularios 941 y 709). Ninguno Bajo. Bajo (3 documentos).

Como los modelos fundacionales suelen requerir menos documentos de entrenamiento, se recomiendan como primera opción para todos los diseños variables.

Puntuación de confianza

La puntuación de confianza indica la solidez con la que tu modelo asocia cada entidad con el valor previsto. El valor está comprendido entre cero y uno. Cuanto más se acerque a uno, mayor será la confianza del modelo en que el valor corresponde a la entidad. De esta forma, los usuarios pueden definir activadores para revisar manualmente entidades concretas cuando el valor es bajo. Por ejemplo, determinar si el texto de una entidad es "Hello, world!" o "HeIIo vvorld!".

Las ventajas de este enfoque permiten detectar entidades individuales con un nivel de confianza bajo, establecer umbrales para las predicciones que se utilizan, seleccionar el umbral de confianza óptimo y desarrollar nuevas estrategias para entrenar modelos con puntuaciones de precisión y confianza más altas.

Para obtener más información sobre los conceptos y las métricas de evaluación, consulta Evaluar el rendimiento.