Comportamiento de los divisores de documentos
El resultado del procesador del divisor contiene información de división para el documento de entrada, incluida una puntuación de confianza. La API de Document AI genera un objeto JSON Document
, y el formato de salida usa el campo entities
para representar las divisiones de documentos. La información adicional depende del tipo específico de divisor.
Entity.type
especifica la clasificación del documento. Para obtener una lista completa de los tipos de documentos que se pueden identificar, consulta las siguientes listas.Entity.pageAnchor.pageRefs[]
especifica las páginas que contienen cada subdocumento. Ten en cuenta quepageRefs[].page
se basa en cero y es el índice en el campodocument.pages[]
.
El divisor no está diseñado para dividir documentos lógicos de más de 30 páginas. Los documentos lógicos de más de 30 páginas (p.ej., un estado de cuenta bancario de 40 páginas) se pueden dividir en dos o más documentos y clasificar por separado.
Los divisores identifican los límites de las páginas, pero no dividen el documento de entrada por ti. El SDK de Document AI Toolbox proporciona funciones de utilidad que pueden dividir el documento de entrada según el resultado de un procesador de divisores.
Tipos de documentos identificados
[1] El analizador correspondiente para este formulario no admite este tipo de doc. Esto significa que el separador puede identificar y clasificar documentos de este tipo, pero Document AI no proporciona un analizador para extraer información.
Ejemplos de salida
Procesadores | Muestras de salida |
---|
Muestras de código
Los divisores identifican los límites de las páginas, pero no dividen el documento de entrada por ti. Puedes usar la caja de herramientas de Document AI para dividir físicamente un archivo PDF con los límites de página. En las siguientes muestras de código, se imprimen los rangos de páginas sin dividir el PDF:
Java
Para obtener más información, consulta la documentación de referencia de la API de Document AI Java.
Para autenticarte en Document AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Para obtener más información, consulta la documentación de referencia de la API de Document AI Node.js.
Para autenticarte en Document AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Python
Para obtener más información, consulta la documentación de referencia de la API de Document AI Python.
Para autenticarte en Document AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Document
procesado.
Python
Para obtener más información, consulta la documentación de referencia de la API de Document AI Python.
Para autenticarte en Document AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.