Descripción general del modelo previamente entrenado
Document AI ofrece varios productos para procesar documentos en busca de información para diferentes casos de uso.
Analizadores previamente entrenados
Para obtener más información, consulta Explora procesadores previamente entrenados.
Analizador de estados de cuenta
El analizador de estados de cuenta extrae pares clave-valor (KVK). Puede extraer hasta 17 entidades genéricas. Algunos ejemplos son: número de cuenta, nombre del cliente, nombre del banco y elementos de tabla, como depósitos y retiros. No especificas los campos (esquema) que quieres extraer. El analizador de estados de cuenta admite enriquecimiento y normalización.
Analizador de W2
El analizador de W2 extrae información del formulario W2 del IRS como KVP. Puede extraer hasta 12 entidades genéricas, como el nombre del empleado, el número de seguridad social, el empleador y los salarios. No especificas los campos (esquema) que quieres extraer. El analizador de W2 admite el enriquecimiento.
Analizador de pasaportes de EE.UU.
El analizador de pasaportes de EE.UU. extrae KVP. Puede extraer hasta siete entidades genéricas. Entre estos, se incluyen los nombres de pila, los apellidos, el ID del documento y la fecha de nacimiento. No especificas los campos (esquema) que quieres extraer. El analizador de pasaportes de EE.UU. admite la normalización.
Analizador de utilidades
El analizador de utilidades extrae KVP. Puede extraer hasta 75 entidades genéricas de las facturas de servicios públicos. Estos incluyen el nombre del proveedor, el importe pagado anterior y las líneas de pedido, como el importe, la descripción, el código de producto y la cantidad. No especificas los campos (esquema) que deseas extraer con el analizador de utilidad.
Analizador de revisión de documentos de identidad
El analizador de revisión de documentos de identidad predice la validez de los documentos de identidad con varios indicadores.
- Detección de
fraud_signals_is_identity_document
: Predice si una imagen contiene un documento de identidad reconocido. - Detección de
fraud_signals_suspicious_words
: Predice si hay palabras que no son típicas en los IDs. - Detección de
fraud_signals_image_manipulation
: Predice si la imagen se alteró o se manipuló con una herramienta de edición de imágenes. - Detección de
fraud_signals_online_duplicate
: Predice si la imagen se puede encontrar en línea (solo en EE.UU.).
Analizador de notas de pago
El analizador de notas de pago extrae KVP. Puede extraer hasta 26 entidades genéricas de los recibos de pago. Estos incluyen el nombre del empleado, el bono, las comisiones, el tiempo extra y la fecha de pago. No especificas los campos (esquema) que quieres extraer. El analizador de recibos de sueldo admite enriquecimiento y normalización.
Analizador de licencias de conducir de EE.UU.
El analizador de licencias de conducir de EE.UU. extrae KVP. Puede extraer hasta ocho entidades genéricas de una licencia de conducir. Algunos ejemplos son: nombre de pila, apellido, ID de documento y fecha de vencimiento. No especificas los campos (esquema) que quieres extraer. El analizador de licencias de conducir de EE.UU. admite la normalización.
Analizador de gastos
El analizador de gastos extrae KVP. Puede extraer hasta 17 entidades genéricas de los informes de gastos. Algunos ejemplos son: Fecha del gasto, nombre del proveedor, importe total y moneda. No especificas los campos (esquema) que quieres extraer. El analizador de gastos admite enriquecimiento y normalización.
Analizador de facturas
El analizador de facturas extrae KVP. Puede extraer hasta 46 entidades genéricas de las facturas. Estos incluyen el número de factura, el nombre del proveedor, el importe de la factura, el importe fiscal, la fecha de facturación y la fecha de vencimiento. No especificas los campos (esquema) que quieres extraer. El analizador de facturas admite el enriquecimiento y la normalización.
Summarizer
El Generador de resúmenes proporciona resúmenes con viñetas y de resumen para documentos cortos y largos. El resumidor también te permite especificar la longitud de la salida del resumen como completa, media o breve.