Divisor personalizado
El divisor personalizado se diseñó para dividir documentos compuestos (documentos compuestos por varias clases) en varios documentos de una sola clase con la identificación de cada documento lógico. Por ejemplo, un paquete hipotecario contiene varias clases dentro de él, como la aplicación, la verificación de ingresos y el ID con foto. Los procesadores divisores personalizados se entrenan desde cero con tus propios documentos y clases personalizadas para poder usarse.
Descripción y uso del divisor
Creas divisores personalizados que se adaptan específicamente a tus documentos y que se entrenan y evalúan con tus datos. Este procesador identifica las clases de documentos de un conjunto de clases definido por el usuario. Luego, puedes usar este procesador entrenado en documentos de producción. Por lo general, usarías un divisor personalizado en archivos compuestos por diferentes tipos de documentos lógicos y, luego, usarías la identificación de clase de cada uno para pasar los documentos a un procesador de extracción adecuado para extraer las entidades.
Debido a que los modelos del AA no son perfectos y tienen una cierta tasa de error, y a que los errores en la división suelen ser muy problemáticos (una división incorrecta hace mal dos documentos y causa errores de extracción), se recomienda tener siempre un paso de revisión manual después de la predicción de división, pero antes de la división del archivo real. Según los requisitos empresariales, existen alternativas a la revisión manual en todo momento:
- Usa las puntuaciones de confianza en la predicción para decidir si omites la revisión manual (si es lo suficientemente alta). Ese umbral de puntuación de confianza debe determinarse en función de los datos históricos sobre las tasas de error en determinadas puntuaciones de confianza. Esta debería ser una decisión empresarial basada en la tolerancia del proceso empresarial para errores y el requisito de evitar la revisión manual.
- En algunos casos de uso, los documentos divididos se pueden enrutar directamente al extractor apropiado según la clase predicha. Luego, si la extracción está incompleta o tiene puntuaciones de confianza bajas, aísla los documentos divididos y activa el documento compuesto original y la decisión de división para que se revisen. Esto tiene requisitos de flujo de trabajo bastante complejos.
Crea un divisor personalizado en la consola de Google Cloud
En esta guía de inicio rápido, se describe cómo usar Document AI para crear y entrenar un divisor personalizado que divide y clasifique los documentos de adquisición. La mayor parte de la preparación del documento está lista, de modo que puedas enfocarte en crear un divisor personalizado.
El siguiente es un flujo de trabajo típico para crear y usar un divisor personalizado:
- Crear un divisor personalizado en Document AI.
- Crear un conjunto de datos con un bucket de Cloud Storage vacío.
- Definir y crear el esquema del procesador (clases).
- Importar documentos.
- Asignar documentos a los conjuntos de entrenamiento y pruebas.
- Anotar los documentos de forma manual en Document AI Workbench o con tareas de etiquetado.
- Entrenar el procesador.
- Evaluar el procesador.
- Implementar el procesador.
- Probar el procesador.
- Usar el procesador en tus documentos.
Si tienes tus documentos en carpetas separadas por clase, puedes omitir el paso 6 si especificas la clase en el momento de la importación.
Para seguir la guía paso a paso en esta tarea directamente en la consola de Google Cloud, haz clic en Guiarme:
Antes de comenzar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Document AI, Cloud Storage APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Document AI, Cloud Storage APIs.
Crea un procesador
En la consola de Google Cloud, en la sección Document AI, ve a la página Workbench.
En Custom Document Splitter, selecciona
Crear procesador .En el menú Crear procesador, ingresa un nombre para tu procesador, como
my-custom-document-splitter
.Selecciona la región más cercana a ti.
Selecciona Crear. Aparecerá la pestaña Processor Details.
Configura el conjunto de datos
Para entrenar este nuevo procesador, debes crear un conjunto de datos con datos de entrenamiento y de prueba a fin de ayudar al procesador a identificar los documentos que deseas dividir y clasificar.
Este conjunto de datos requiere una nueva ubicación para él. Puede ser un bucket de Cloud Storage vacío o una carpeta, o puedes permitir una ubicación administrada por Google (interna).
- Si deseas usar el almacenamiento administrado por Google, selecciona esa opción.
- Si deseas usar tu propio almacenamiento para usar claves de encriptación administradas por el cliente (CMEK), selecciona Especificaré mi propia ubicación de almacenamiento y sigue el procedimiento posterior.
Crea un bucket de Cloud Storage para el conjunto de datos
Ve a la pestaña
Entrenar del procesador.Selecciona Establecer la ubicación del conjunto de datos. Se te pedirá que selecciones o crees un bucket o una carpeta de Cloud Storage vacíos.
Selecciona Explorar para abrir la opción Seleccionar carpeta.
Haz clic en el ícono Crear un bucket nuevo y sigue las instrucciones para crear un bucket nuevo. Después de crear el bucket, aparecerá la página Seleccionar carpeta. Si deseas obtener más información para crear un bucket de Cloud Storage, consulta Buckets de Cloud Storage.
En la página Seleccionar carpeta de tu bucket, elige el botón Seleccionar en la parte inferior del diálogo.
Asegúrate de que la ruta de destino se propague con el nombre del bucket que seleccionaste. Seleccione Crear conjunto de datos. La creación del conjunto de datos puede tardar varios minutos.
Define el esquema del procesador
Puedes crear el esquema del procesador antes o después de importar documentos a tu conjunto de datos. El esquema proporciona etiquetas que utilizas para anotar documentos.
En la pestaña Entrenar, selecciona
Editar esquema en la parte inferior izquierda. Se abrirá la página Administrar etiquetas.Selecciona
Crear etiqueta .Ingresa el nombre de la etiqueta. Selecciona Crear. Consulta Define el procesador del esquema para obtener instrucciones detalladas para crear y editar un esquema.
Crea cada una de las siguientes etiquetas para el esquema del procesador.
bank_statement
form_1040
form_w2
form_w9
paystub
Selecciona
Guardar cuando las etiquetas estén completas.
Importa un documento sin etiquetas a un conjunto de datos
El siguiente paso es comenzar a importar documentos sin etiquetar a tu conjunto de datos y etiquetarlos. Una alternativa recomendada es importar documentos organizados en carpetas por clase, si están disponibles.
Si estás trabajando en tu propio proyecto, tú decidirás cómo etiquetar tus datos. Consulta Opciones de etiquetado.
Los procesadores personalizados de Document AI requieren un mínimo de 10 documentos en los conjuntos de entrenamiento y de prueba, junto con 10 instancias de cada etiqueta en cada conjunto. Para obtener el mejor rendimiento, recomendamos al menos 50 documentos en cada conjunto, con 50 instancias de cada etiqueta. En general, una mayor cantidad de datos de entrenamiento produce una mayor exactitud.
En la pestaña Entrenar, selecciona
Importar documentos .Para este ejemplo, ingresa esta ruta de acceso en
Ruta de origen . Contiene un documento PDF.cloud-samples-data/documentai/Custom/Lending-Splitter/PDF-Unlabeled
Establece la
Etiqueta del documento como Ninguna.Establece el menú desplegable
División del conjunto de datos en Sin asignar.El documento de esta carpeta no recibe una etiqueta ni se asigna al conjunto de prueba o entrenamiento de forma predeterminada.
Selecciona
Importar . Document AI lee los documentos del bucket en el conjunto de datos. No modifica el bucket de importación ni lee desde el bucket una vez que se completa la importación.
Cuando importas documentos, puedes asignarlos de forma opcional al conjunto de Entrenamiento o Prueba cuando se importan, o esperar para asignarlos más tarde.
Si deseas borrar uno o más documentos que importaste, selecciónalos en la pestaña Entrenar y selecciona Borrar.
Si deseas obtener más información para preparar tus datos para importar, consulta la Guía de preparación de datos.
Opcional: Etiquetas por lotes de documentos en la importación
Puedes etiquetar todos los documentos que se encuentran en un directorio en particular en la importación para ahorrar tiempo en el etiquetado. Si tienes los documentos de entrenamiento organizados por clase en carpetas, puedes usar el campo Etiqueta del documento para especificar la clase de esos documentos y evitar el etiquetado manual de cada documento.
En la imagen, Bank_statements y Invoice están disponibles con etiquetas definidas (clases de documentos) que puedes seleccionar. También puedes usar CREATE LABEL
y definir una clase
nueva.
- Haz clic en Importar documentos.
Ingresa la siguiente ruta en Ruta de acceso. Este bucket contiene documentos sin etiquetar en formato PDF.
cloud-samples-data/documentai/Custom/Patents/PDF-CDC-BatchLabel
En la lista División de datos, selecciona División automática. Esto divide automáticamente los documentos para tener un 80% en el conjunto de entrenamiento y un 20% en el conjunto de prueba.
En la sección Aplicar etiquetas, selecciona Elegir etiqueta.
Para obtener estos documentos de muestra, selecciona otro.
Haz clic en Importar (Import) y espera a que los documentos se importen. Puedes salir de esta página y volver más tarde.
Etiqueta un documento
El proceso de aplicación de etiquetas a un documento se conoce como anotación.
Regresa a la pestaña Entrenar y selecciona
un documento para abrir la consola de Administración de etiquetas.Este documento contiene varios grupos de páginas que se deben identificar y etiquetar. Primero, debes identificar los puntos de división. Mueve el mouse entre las páginas 1 y 2 en la vista de imagen y selecciona en el símbolo
+ .Crea puntos de división antes de los siguientes números de página: 2, 3, 4 y 5.
La consola debería verse de la siguiente manera cuando termines.
En el menú desplegable
Tipo de documento , selecciona la etiqueta adecuada para cada grupo de páginas.Página(s) Tipo de documento 1 paystub
2 form_w9
3 bank_statement
4 form_w2
5 y 6 form_1040
El documento etiquetado debería verse de la siguiente manera cuando se complete:
Selecciona
Marcar como etiquetado cuando termines de anotar el documento.En la pestaña Entrenar, el panel izquierdo muestra que se etiquetó 1 documento.
Asigna el documento anotado en el conjunto de entrenamiento
Ahora que etiquetaste este documento de ejemplo, puedes asignarlo al conjunto de entrenamiento.
En la pestaña Entrenar, selecciona la casilla de verificación
Seleccionar todo .En la lista
Asignar al conjunto , selecciona Entrenamiento.
En el panel izquierdo, puedes ver que se asignó 1 documento al conjunto de entrenamiento.
Importa datos con el etiquetado por lotes
A continuación, importarás archivos PDF sin etiquetar que se clasifican en diferentes carpetas de Cloud Storage según su tipo. El etiquetado por lotes ayuda a ahorrar tiempo, ya que asigna una etiqueta en el momento de la importación según la ruta.
En la pestaña Entrenar, selecciona
Importar documentos .Ingresa la siguiente ruta en
Ruta de acceso del origen . Esta carpeta contiene archivos PDF de los estados de cuenta.cloud-samples-data/documentai/Custom/Lending-Splitter/PDF-CDS-BatchLabel/bank-statement
Establece la
Etiqueta del documento comobank_statement
.Configura el menú
División del conjunto de datos como División automática. Esto divide automáticamente los documentos para tener un 80% en el conjunto de entrenamiento y un 20% en el conjunto de prueba.Selecciona
Agregar otra carpeta para agregar más carpetas.Repite los pasos anteriores con las siguientes rutas de acceso y etiquetas de documentos:
Ruta de acceso del bucket Etiqueta del documento cloud-samples-data/documentai/Custom/Lending-Splitter/PDF-CDS-BatchLabel/1040
form_1040
cloud-samples-data/documentai/Custom/Lending-Splitter/PDF-CDS-BatchLabel/w2
form_w2
cloud-samples-data/documentai/Custom/Lending-Splitter/PDF-CDS-BatchLabel/w9
form_w9
cloud-samples-data/documentai/Custom/Lending-Splitter/PDF-CDS-BatchLabel/paystub
paystub
La consola debería verse de la siguiente manera cuando se complete:
Selecciona
Importar . La importación tarda varios minutos.
Cuando finalice la importación, busca los documentos en la pestaña Entrenar.
Importa datos etiquetados previamente
En esta guía, se proporcionan datos etiquetados previamente en formato Document
como archivos JSON.
Este es el mismo formato que genera Document AI cuando procesa un documento, lo etiqueta con interacción humana o exporta un conjunto de datos.
En la pestaña Entrenar, selecciona
Importar documentos .Ingresa la siguiente ruta en
Ruta de acceso del origen .cloud-samples-data/documentai/Custom/Lending-Splitter/JSON-Labeled
Establece la
Etiqueta del documento como Ninguna.Establece el menú desplegable
División del conjunto de datos en División automática.Selecciona
Importar .
Cuando finalice la importación, busca los documentos en la pestaña Entrenar.
Entrena el procesador
Ahora que importaste los datos de entrenamiento y prueba, puedes entrenar el procesador. Dado que el entrenamiento puede tardar varias horas, asegúrese de haber configurado el procesador con los datos y las etiquetas correspondientes antes de comenzar el entrenamiento.
Selecciona
Entrenar una versión nueva .En el campo
Nombre de la versión , ingresa un nombre para esta versión del procesador, comomy-cds-version-1
.(Opcional) Selecciona Ver estadísticas de etiquetas para buscar información sobre las etiquetas de documentos. Esto puede ayudarte a determinar tu cobertura. Selecciona Cerrar para volver a la configuración de entrenamiento.
Selecciona
Comenzar entrenamiento . Puedes verificar el estado en el panel derecho.
Implementa la versión del procesador
Una vez finalizado el entrenamiento, navega a la pestaña
Administrar versiones . Puedes ver detalles sobre la versión que acabas de entrenar.Selecciona los
tres puntos verticales a la derecha de la versión que deseas implementar y selecciona Implementar versión.Selecciona
Implementar en la ventana emergente.La implementación tarda unos minutos en completarse.
Evalúa y prueba el procesador
Una vez finalizada la implementación, navega a la pestaña
Evaluar y probar .En esta página, puedes ver las métricas de evaluación, incluidas la puntuación F1, la precisión y recuperación del documento completo, y las etiquetas individuales. Para obtener más información sobre la evaluación y las estadísticas, consulta Evalúa el procesador.
Descarga un documento que no haya participado en pruebas ni entrenamientos anteriores para que puedas usarlo para evaluar la versión del procesador. Si usas tus propios datos, debes usar un documento que se reserve para ello.
Selecciona
Subir documento de prueba y selecciona el documento que acabas de descargar.Se abrirá la página Análisis de divisor personalizado. El resultado de la pantalla mostrará qué tan bien se dividió y clasificó el documento.
La consola debería verse de la siguiente manera cuando se complete:
También puedes volver a ejecutar la evaluación en un conjunto de prueba diferente o en una versión del procesador.
Importa datos con el etiquetado automático (opcional)
Después de implementar una versión de procesador entrenado, puedes usar el etiquetado automático para ahorrar tiempo en el etiquetado cuando importas documentos nuevos.
En la pestaña Entrenar, selecciona
Importar documentos .Ingresa la siguiente ruta en
Ruta de acceso del origen . Esta carpeta contiene archivos PDF sin etiquetas de varios tipos de documentos.cloud-samples-data/documentai/Custom/Lending-Splitter/PDF-CDS-AutoLabel
Establece la
Etiqueta del documento como Etiquetado automático.Establece el menú desplegable
División del conjunto de datos en División automática.En la sección Etiquetado automático, configura la
versión como la versión que entrenaste antes.- Por ejemplo:
2af620b2fd4d1fcf
.
- Por ejemplo:
Selecciona
Importar y espera a que los documentos se importen.No puedes usar documentos etiquetados automáticamente para entrenamiento o pruebas sin marcarlos como etiquetados. Ve a la sección
Etiquetado automático para ver los documentos etiquetados automáticamente.Selecciona el primer documento para ingresar a la consola de etiquetado.
Verifica que la etiqueta sea correcta y, de lo contrario, ajústala.
Cuando termines, selecciona
Marcar como etiquetado .Repite la verificación de etiquetas en cada documento etiquetado automáticamente.
Vuelve a la página Entrenar y selecciona Entrenar una versión nueva para usar los datos en el entrenamiento.
Usar el procesador
Creaste y entrenaste correctamente un procesador de divisores personalizado.
Puedes administrar tus versiones de procesador con entrenamiento personalizado como cualquier otra versión de procesador. Para obtener más información, consulta Administra versiones de procesadores.
Una vez implementado, puedes enviar una solicitud de procesamiento a tu procesador personalizado y la respuesta se puede manejar de la misma manera que otros procesadores divisores.
Limpia
Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.
Para evitar cargos innecesarios de Google Cloud , usa la consola de Google Cloud para borrar el procesador y el proyecto si no los necesitas.
Si creaste un proyecto nuevo para aprender sobre Document AI y ya no lo necesitas, bórralo.
Si usaste un proyecto existente de Google Cloud , borra los recursos que creaste para evitar que se generen cargos en tu cuenta:
En el menú de navegación de la consola de Google Cloud, selecciona Document AI y, luego, Mis procesadores.
Selecciona
Más acciones en la misma fila del procesador que quieres borrar.Selecciona Borrar procesador, escribe el nombre del procesador y, luego, vuelve a seleccionar Borrar para confirmar.