Descripción general de la extracción

Document AI ofrece varios productos para extraer información de documentos en diferentes casos prácticos:

Análisis de formularios

Form Parser extrae pares clave-valor, tablas, marcas de selección (casillas de verificación) y campos genéricos para aumentar y automatizar la extracción. Puede extraer hasta 11 entidades genéricas y casillas de verificación de forma predeterminada. No especifica los campos (esquema) que quiere extraer con el analizador de formularios. El modelo detecta y devuelve las entidades de interés de cada página de los documentos.

Extractor personalizado

El extractor personalizado extrae las entidades que definas en el esquema y ofrece tres opciones de modelado: modelo base, modelo personalizado y plantilla personalizada. Teniendo en cuenta los resultados prometedores de los modelos básicos con pocos o ningún dato de entrenamiento, te recomendamos que empieces con el modelo básico como primera opción y pruebes otras opciones según sea necesario. Los modelos básicos hacen predicciones con pocos o ningún ejemplo, basándose en un máximo de 5 documentos etiquetados del conjunto de datos, y predicciones ajustadas con más de 10 documentos etiquetados del conjunto de datos.

Método de entrenamiento Ejemplos de documentos Variación del diseño del documento Texto o párrafos de formato libre Número de documentos de entrenamiento para alcanzar una calidad apta para producción, en función de la variabilidad
Afinación y modelo básico (IA generativa). Contrato, términos del servicio, factura, extracto bancario, conocimiento de embarque o nómina. De alto a bajo (opción preferida). Alto. Medio: de 0 a 50 documentos.
Modelo personalizado. Modelo. Formularios similares con variaciones en el diseño a lo largo de los años o entre proveedores (por ejemplo, el formulario W9). De baja a media. Bajo. Alto: de 10 a más de 100 documentos.
Plantilla. Formularios fiscales con un diseño fijo (por ejemplo, los formularios 941 y 709). Ninguno Bajo. Bajo (3 documentos).

Como los modelos fundacionales suelen requerir menos documentos de entrenamiento, se recomiendan como primera opción para todos los diseños variables.

Analizador de diseños

Layout Parser transforma documentos en varios formatos en representaciones estructuradas, lo que permite acceder a contenido como párrafos, tablas, listas y elementos estructurales, como encabezados, encabezados de página y pies de página. Además, crea fragmentos contextualizados que facilitan la recuperación de información en una amplia gama de aplicaciones de IA generativa y de descubrimiento.