Conceptos

A continuación, se incluyen algunos conceptos y funciones que se usan en este producto:

Concepto Definición
Revisar Proceso de comparar visualmente los valores de los campos extraídos con los valores reales del documento y corregir las extracciones incorrectas, o bien agregar los campos extraídos que omitieron los procesadores de DocAI.
Etiquetador Es la persona que revisa el documento extraído. El cliente puede usar su propio personal (Bring-your-own-labeler o BYOL) o usar los etiquetadores de Google para la revisión de HITL.
Tarea Es una fila de documentos extraídos que revisan los etiquetadores. Un procesador genera una sola tarea cuando se configura para la revisión de HITL.
Labeler Workbench Es la IU que usa un etiquetador para revisar documentos. La IU presenta documentos de la cola que el etiquetador puede revisar, corregir y enviar o rechazar.
  • Los etiquetadores de BYOL deben tener una cuenta de Gmail o de Google Workforce para acceder a la IU de etiquetado.
  • Los etiquetadores pueden acceder a Workbench a través de un vínculo que el administrador de etiquetado envía por correo electrónico cuando se asigna una tarea.
Tiempo de respuesta Es el tiempo que tarda un etiquetador en procesar un documento. Labeler Workbench hace un seguimiento de la hora de envío de los documentos y presenta estadísticas de eficiencia (p.ej., para cada revisión de documentos del etiquetador).
Administrador de etiquetado Se asigna uno o más administradores de etiquetado a un grupo de etiquetadores para que puedan hacer lo siguiente:
  • Agregar o quitar etiquetadores de los grupos de etiquetadores
  • Asignar o anular la asignación de tareas a un etiquetador Un administrador de etiquetas puede acceder a todas las tareas del proyecto. Pueden cambiar las asignaciones de tareas a los etiquetadores según las prioridades cambiantes de las tareas.
  • Pausar tareas para que los etiquetadores puedan trabajar en las siguientes tareas que se les asignen
En la situación de BYOL, el cliente proporciona los administradores de etiquetado. Cuando se usan etiquetadores de Google, Google proporciona el Administrador de etiquetado.
Consola del Administrador de etiquetado Es la IU que usa un administrador de etiquetado para administrar los grupos de etiquetadores y las asignaciones de tareas. Abrir la consola
Documentos en cola, respondidos, completados y rechazados en una tarea Una tarea es un flujo de trabajo continuo. Un documento pasa por los siguientes estados:
  • En cola: A medida que el procesador procesa los documentos, estos se enqueued (se agregan) a la tarea de HITL.
  • Respondido: Cuando un etiquetador revisa, corrige y envía un documento, este se completa y se guarda en el bucket de Cloud Storage configurado del cliente.
  • Completado: Cuando todos los etiquetadores responden un documento si la tarea tiene activada la replicación (varios etiquetadores trabajan en cada documento de la tarea). Cuando la tarea no tiene replicación ( revisada por un solo etiquetador), Respondida es lo mismo que Completada.
  • Rechazado: Un documento puede rechazarse si no es válido (tipo de documento diferente, falsificado, etc.) o si es de mala calidad (reflejos, bordes cortados, etc.).
Una sola tarea por procesador No admitimos varias tareas por procesador. Si los clientes necesitan procesar un solo tipo de documento (facturas, por ejemplo) en diferentes tareas, pueden configurar varios procesadores con la revisión de HITL.
Asignación de tareas y grupos de etiquetadores El Administrador de etiquetado agrega etiquetadores a un grupo. Una vez que se agregan, se puede asignar cualquier etiquetador del grupo a una tarea. Ten en cuenta que no se debe confundir el "grupo de etiquetadores" con el "grupo" de etiquetadores asignados a una tarea. Los grupos se administran a nivel del proyecto y se usan para determinar el acceso de los etiquetadores a las estadísticas y las tareas. Cualquier etiquetador del grupo se puede asignar a una o más tareas del proyecto.
Grupo de etiquetadores Se crea un grupo de etiquetadores a nivel del proyecto, que no debe confundirse con las asignaciones de tareas. El administrador de etiquetas puede asignar cualquier etiquetador a cualquier tarea, de modo que varios etiquetadores puedan revisar documentos en paralelo y completar la tarea más rápido. El cliente puede asignar un grupo de etiquetadores a cualquier tarea del proyecto.
Filtros y umbrales de validación Los campos extraídos tienen una puntuación de confianza (de 0 a 100) que representa la confianza en que la extracción de DocAI es precisa. Los clientes pueden configurar el umbral de validación para cada campo, de modo que solo las páginas con campos que estén por debajo de este umbral se pongan en cola para su revisión. Los campos que superen el umbral no se pondrán en cola. Los clientes pueden configurar 3 tipos de filtros de validación:
  • Filtro a nivel del campo: Selecciona los campos importantes que se deben revisar y especifica un umbral de confianza para cada campo. Si este umbral se establece en el 100% para cualquier campo, todas las páginas que contengan este campo se enviarán para su revisión.
  • Filtro a nivel del documento: Selecciona un umbral de confianza general a nivel del documento. Si algún campo está por debajo del umbral, se envía toda la página para su revisión. Si este umbral se establece en el 100%, todos los documentos previstos se envían para su revisión.
  • Sin filtro: Todos los documentos publicados en el extremo de HITL se envían para su revisión.
Estadísticas del Administrador de etiquetas El administrador de etiquetado obtiene estadísticas de cada tarea y cada etiquetador, incluidas las tareas en cola, las respondidas, las omitidas, las completadas, el tiempo promedio de procesamiento por documento y el tiempo total de respuesta. Se accede a las estadísticas en la pestaña Analytics de la consola del Administrador de etiquetado.