Notas de novedades

Lanzamiento de diciembre del 2022

Configurador de HITL

La pestaña "Configuración" de "Human-In-The-Loop" ahora tiene el formato de un par de pasos ordenados para que la configuración sea más sencilla y estructurada. Configuración de HITL actualizada Ahora, el usuario puede ver pasos independientes para configurar los ajustes relacionados con el grupo de especialistas y los filtros para activar la intervención humana, así como seleccionar las instrucciones y la ubicación de los resultados para los especialistas.

Lanzamiento de octubre del 2022

Panel de analíticas de solicitantes de HITL
  • La función Intervención humana ahora tiene una pestaña específica llamada Analíticas, que proporciona al usuario métricas y gráficos para analizar el estado de las tareas de intervención humana por procesador y hacer los cambios necesarios.

  • Actualmente, el usuario puede ver tres métricas diferentes. Los datos se pueden agregar mediante un selector de periodo que ofrece al usuario las siguientes opciones: Selector de intervalo de tiempo

  • En cada intervalo de tiempo seleccionado, el usuario puede ver lo siguiente:

    • Estadísticas agregadas: una vista general del número total de documentos que se han subido correctamente a la cola, el número total de documentos completados (es decir, enviados y rechazados) por especialistas y el tiempo transcurrido desde que se añadió el documento más antiguo a la cola en el periodo seleccionado. Tabla de estadísticas agregadas
    • Gráfico de actividad de los servicios con intervención humana: muestra los datos de la serie temporal de los momentos en los que se añadieron documentos a la cola (enqueuedDocumentCount) y en los que los especialistas completaron los documentos (completedDocumentCount). Gráfico de actividad de intervención humana
    • Tasa de activación de la intervención humana: gráfico que muestra los datos de la serie temporal del porcentaje de documentos subidos que han activado la revisión con intervención humana en el periodo seleccionado. Gráfico de la tasa de activación de HITL

Lanzamiento de septiembre del 2022

Nota: Los clientes que usan Document AI Workbench y los procesadores de facturas, pedidos de compra y gastos tienen acceso a un nuevo esquema que les permite etiquetar casillas de verificación (si se definen en el esquema) y representar con precisión las entidades anidadas, es decir, la relación entre elementos principales y secundarios, en la interfaz de usuario de anotación y revisión de HITL. A medida que más procesadores se adapten al nuevo esquema, estas notas de la versión se actualizarán para reflejarlo.

Entidad anidada
  • La interfaz de usuario de anotación ahora permite etiquetar entidades anidadas. El panel de la izquierda se actualiza con un nuevo diseño para las filas anidadas que representan entidades anidadas. El valor de "parent" es la concatenación de todos sus "children". Panel izquierdo de entidad anidada
  • En el panel de la izquierda, se muestran las etiquetas de las entidades superiores y secundarias. Nested Entity Left Panel Select
  • El menú de etiquetas de entidades del documento también se actualiza para admitir el etiquetado de entidades anidadas. Selección de menú de entidad anidada
  • Al hacer clic en una etiqueta anidada, se muestra un cuadro de diálogo para asignar la entidad superior correcta a la entidad secundaria anidada. Cuadro de diálogo de entidad superior anidada
Casilla
  • La interfaz de usuario de anotación admite casillas de etiquetado. En el panel de la izquierda, la casilla se puede editar en la fila. Panel izquierdo de casilla de verificación
  • También puedes editar las casillas en el cuadro de diálogo de edición de entidades. Formulario de edición de casilla

Lanzamiento de agosto del 2022

Selector de etiquetas de entidad
  • La entrada de la etiqueta de entidad se sustituye por una lista desplegable. Esta lista desplegable contiene las opciones de etiqueta disponibles al añadir una entidad. Este cambio ayuda a evitar que los etiquetadores cometan errores tipográficos y creen etiquetas de entidades no deseadas. Selector de etiquetas de entidad
Formato de fecha ISO
  • Las fechas normalizadas se muestran en formato de fecha ISO 8601(aaaa-mm-dd). Formato de fecha ISO

Lanzamiento de julio del 2022

Botón de confirmación rápida
  • En las descripciones emergentes de las entidades, hay un botón Confirmar que permite revisar y confirmar rápidamente el valor de una entidad o una etiqueta. Se ha quitado el botón Editar, ya que los usuarios pueden hacer clic directamente en la descripción emergente de la entidad para editarla. Confirmación rápida

Lanzamiento de enero del 2022

Opciones de etiqueta de entidad
  • Las opciones de selección de etiquetas de entidad ahora se limitan a la lista de campos filtrados(definidos en la configuración del filtro de revisión humana). Etiqueta de entidad
Faltan campos
  • Ahora mostramos los campos que faltan (es decir, los campos marcados como "Obligatorio" en la configuración del filtro de revisión humana, pero para los que el procesador no ha predicho valores) en un color rojo distinto, lo que facilita que el revisor actualice el valor del campo. Faltan campos
Muestras completas aleatorias
  • Ahora se pueden revisar por completo (es decir, todas las entidades del documento, no solo los campos filtrados) muestras aleatorias de documentos (por ejemplo, el 2% del volumen diario). Esto resulta útil para monitorizar la deriva del modelo y las analíticas sobre la precisión del procesador en cada campo. Recogemos estas analíticas, que se usan para saber cuándo es necesario volver a entrenar el modelo. También sirve como conjunto de datos con la verdad fundamental etiquetada para entrenar modelos.
  • Los clientes pueden habilitar esta opción y definir la muestra aleatoria (entre el 1 y el 10 %) en función de su volumen. Sería útil segmentar entre 100 y 500 muestras por semana. Por lo tanto, si un cliente procesa 10.000 documentos a la semana, este valor puede ser 500/10.000 = 5 %.
Configuración de HITL simplificada para usuarios nuevos
  • Hemos simplificado la configuración de la revisión humana en el bucle (HITL) con la opción de traer tu propia licencia (BYOL) para los clientes que la usen por primera vez. De esta forma, podrán configurar una tarea, asignar especialistas y lanzarla desde una sola pantalla, lo que les permitirá probarla rápidamente antes de aumentar el volumen de producción o externalizar la operación.
  • Como se muestra en la captura de pantalla de abajo, el usuario se convierte en el gestor predeterminado del grupo y puede añadir más especialistas, que se asignan automáticamente a la tarea en la misma pantalla.
    • Antes, el gestor asignado recibía un correo con un enlace a la consola de gestor, donde añadía especialistas y les asignaba la tarea.
    • Una vez que hayan enviado la tarea, ellos (y otros especialistas asignados) podrán ir a la aplicación HITL para revisar los documentos.
    • El usuario también puede subir un documento de prueba (de uno en uno) a la cola de tareas. Configuración de HITL simplificada 1 Configuración simplificada de HITL 2
Eliminar el salto de línea final
  • Los saltos de línea finales('\n') se eliminan en entity.mentionText.

Lanzamiento de diciembre del 2021

Ordenar las entidades con una puntuación de confianza baja en la parte superior
  • Las entidades con una puntuación de confianza baja (es decir, las entidades por debajo del umbral de confianza) ahora se ordenan en la parte superior de la página, lo que permite al especialista centrarse en ellas. Esto permite mejorar aún más la eficiencia del etiquetado. Ordenar por baja confianza
Instrucciones opcionales para tareas de BYOL
  • Ahora es opcional subir las instrucciones en PDF para configurar una tarea de revisión humana. De esta forma, se simplifican las pruebas y los lanzamientos internos rápidos, ya que los especialistas no necesitan una guía de instrucciones. Instrucciones opcionales
Opción de ajustar al ancho y a la altura de la página
  • Botón para ajustar la página al ancho o al alto. Esto resulta útil cuando los especialistas tienen documentos de tamaño variable (por ejemplo, recibos) en una tarea. Opción de ajuste
Nombre de la tarea que se muestra en la interfaz de usuario de Especialista
  • Ahora, el nombre de la tarea se muestra en la interfaz de usuario del especialista para proporcionarle más contexto sobre la tarea y el tipo de documento, lo que resulta muy útil cuando se le asignan varias tareas.
  • Ten en cuenta que esto se muestra en los nuevos procesadores que se activen después de esta versión. Specialist UI Task Name
Cuadro de búsqueda de especialistas
  • Los especialistas pueden buscar entidades o texto en documentos. Esto es especialmente útil en el caso de documentos extensos de varias páginas y aumenta la productividad de los especialistas. Cuadro de búsqueda de especialistas

Lanzamiento de septiembre del 2021

Activa o desactiva la opción para mostrar todos los campos.
  • Es posible que los etiquetadores tengan que revisar y actualizar los campos que no estén en el conjunto de entidades filtrado de documentos específicos de la cola. Puedes activar o desactivar la opción Mostrar todas las predicciones para permitir que los etiquetadores revisen los campos no filtrados. Alternar
Revisión humana en el bucle para el analizador de formularios
  • La revisión humana ahora es compatible con el analizador de formularios, por lo que los usuarios pueden revisar y corregir los pares clave-valor extraídos por el analizador de formularios. El cliente puede habilitar la intervención humana en el bucle en el procesador Form Parser de la plataforma DocAI y configurar los nombres de las claves (como se muestra en la captura de pantalla de abajo) que quiera filtrar para la revisión humana. Una vez completada la revisión humana, los resultados de la HITL se almacenan como archivos JSON en el segmento de Google Cloud Storage que haya especificado el cliente.
  • Pueden especificar nombres de clave alternativos separados por comas, como "cliente, nombre del cliente, cliente, cuenta n.º, número de cuenta", de forma que el filtro de revisión humana detecte los documentos con todas las variaciones del nombre de clave y los envíe a revisión humana. HITL para Form Parser 1 HITL para Form Parser 2 Revisión humana del analizador de formularios 3

Lanzamiento de agosto del 2021

Flujo de procesamiento de auditoría o control de calidad
  • La HITL ahora permite una segunda fase de control de calidad o una fase de auditoría, e informa de la precisión de las tareas de revisión (y de los etiquetadores). Se puede asignar un equipo de control de calidad o un auditor como "etiquetador experto" a una tarea. El equipo de control de calidad o el auditor recibe un porcentaje de los documentos revisados (por ejemplo, del 1 % al 100%, que el cliente puede configurar). El auditor puede corregir el resultado del revisor. El sistema registra las correcciones y asigna una puntuación de precisión (por ejemplo, 90%) a cada documento auditado. La puntuación de precisión agregada de una tarea o un etiquetador se muestra en los paneles de control de analíticas de tareas y de etiquetadores, respectivamente.
  • Aquí tienes instrucciones detalladas sobre cómo configurar una canalización de auditoría.
  • Designar un auditor Designar auditor
  • Precisión de los informes Precisión de los informes
Analizadores de IA para préstamos (15 de agosto)
  • Ahora se admite la revisión humana en el bucle en algunos analizadores de IA de préstamos, como 1040, 1040 Schedule E, 1040 Schedule C, 1099 DIV, 1099 G, 1099 INT, 1099 MISC, nóminas, extractos bancarios, W2, W9, 1120, 1120S, 1065, SSA-1099, 1099 NEC y 1099-R.

Lanzamiento de julio del 2021

Colas estándar y urgentes (2 de julio)
  • Ahora admitimos dos colas de prioridad (en lugar de una) para cada procesador, en función de la urgencia de cada documento.
  • Envío: después de la predicción, los documentos extraídos se pueden evaluar para determinar su urgencia y enviarse a dos colas (estándar o urgente/rápida) en función de la urgencia del documento. Por ejemplo, las facturas con fechas de vencimiento urgentes se pueden enviar a la cola de tramitación rápida. La lógica que evalúa la urgencia está fuera de la revisión humana y puede ser una función personalizada.
  • Asignación de tareas: el gestor de etiquetado ve dos colas diferentes con prioridades distintas, como se muestra en la captura de pantalla de abajo, y puede asignar el mismo grupo de etiquetadores a ambas colas.
  • Priorización de tareas: los etiquetadores asignados a ambas tareas siempre procesarán primero los documentos pendientes de la cola de vía rápida antes de procesar la cola estándar (es decir, el sistema gestiona automáticamente la priorización de las colas).
  • Llamada a la API: define el campo priority en ReviewDocument
  • Captura de pantalla de la interfaz de usuario (de las tareas de la interfaz de Gestor de etiquetas): Colas de prioridad

Versión de junio del 2021

Filtros de validación para el endpoint de HITL (24 de junio)
  • Los filtros de validación (configurados en el procesador) que filtran los campos por puntuación de confianza para determinar los documentos que se deben poner en cola para la revisión humana ahora también se aplican a los documentos enviados al endpoint de intervención humana.
  • Cuando llames a la API ReviewDocument, asigna el valor true al campo enable_schema_validation.
  • Ten en cuenta que, si se define este valor y la validación determina que el documento no necesita una revisión humana, se devuelve un error CANCELLED.
Cancel API
  • El cliente puede cancelar un documento en cola para el procesamiento de HITL invocando la API Cancel para un ID de operación determinado. Se devuelve un ID de operación por cada documento enviado a la revisión humana.

    `POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
    
Tipo de factura (revisión de clasificación)
  • Labeler Workbench permite revisar la clasificación de los tipos de factura. Clasificación del tipo de factura
Informe Tiempo en cola (SLO de latencia de intervención humana)
  • En un informe se indica cuántos documentos están en cola durante más de 18 horas y más de 24 horas. Esto es útil para los usuarios que necesitan gestionar una expectativa de SLO en la latencia de HITL. Tiempo en la cola
URL conocida de la herramienta de etiquetador
  • Los etiquetadores asignados a un solo grupo ahora pueden acceder al espacio de trabajo a través de una URL conocida y no tienen que buscar URLs crípticas enviadas en notificaciones por correo electrónico (por el sistema o por el gestor de etiquetado). Esta URL no funciona para los etiquetadores asignados a varios grupos.
Ajuste de zoom fijo
  • Ahora, el complemento recuerda el ajuste de zoom del etiquetador (ancho completo o página completa) para las siguientes revisiones de documentos de la cola, de modo que no tenga que hacer zoom en cada documento.

Revisión humana en el bucle para el analizador de formularios

  • HITL ahora admite el analizador de formularios. Los usuarios pueden revisar y corregir los pares clave-valor extraídos por el analizador de formularios, habilitar la intervención humana en el procesador del analizador de formularios en la plataforma DocAI y configurar los nombres de las claves (como se muestra en la captura de pantalla de abajo) que quieran filtrar para la revisión con intervención humana. Una vez completada la revisión humana, el resultado de la interacción humana en el bucle se guarda en archivos JSON en el segmento de Google Cloud Storage especificado por el cliente.
  • Capturas de pantalla de la interfaz de usuario para configurar la revisión humana en el bucle en los analizadores de formularios Análisis de formularios con intervención humana
  • Interfaz de usuario para configurar la validación a nivel de clave Validación a nivel de clave
  • Interfaz de usuario de la herramienta de etiquetado Interfaz de etiquetado de Analizador de formularios

Flujo de procesamiento de auditoría o control de calidad

  • La HITL ahora permite una segunda fase de control de calidad o una fase de auditoría, e informa de la precisión de las tareas de revisión (y de los etiquetadores). Se puede asignar un equipo de control de calidad o un auditor como "etiquetador experto" a una tarea. El equipo de control de calidad o el auditor recibirá un porcentaje de los documentos revisados (por ejemplo, del 1 % al 100%, que el cliente puede configurar). El auditor puede corregir el resultado del revisor. El sistema registra las correcciones y asigna una puntuación de precisión (por ejemplo, 90%) a cada documento auditado. La puntuación de precisión agregada de una tarea o un etiquetador se muestra en los paneles de control de analíticas de tareas y de etiquetadores, respectivamente. Aquí tienes instrucciones detalladas sobre cómo configurar una canalización de auditoría.
  • Designar un auditor Designar un auditor

  • Precisión de los informes Precisión de los informes

Analizadores de IA para préstamos (31 de julio)

  • Ahora se admite la revisión humana en el bucle en algunos analizadores de IA de préstamos, como 1040, 1040 Schedule E, 1040 Schedule C, 1099 DIV, 1099 G, 1099 INT, 1099 MISC, nóminas, extractos bancarios, W2, W9, 1120, 1120S, 1065, SSA-1099, 1099 NEC y 1099-R.

Colas estándar y de acceso rápido (2 de julio)

  • Ahora admitimos dos colas de prioridad (en lugar de una) para cada procesador, en función de la urgencia de cada documento.
  • Envío: después de la predicción, los documentos extraídos se pueden evaluar para determinar su urgencia y enviarse a dos colas (estándar o urgente/rápida) en función de la urgencia del documento. Por ejemplo, las facturas con fechas de vencimiento urgentes se pueden enviar a la cola de tramitación rápida. La lógica que evalúa la urgencia se puede introducir mediante una función personalizada.
  • Asignación de tareas: el gestor de etiquetado ve dos colas diferentes con prioridades distintas, como se muestra en la captura de pantalla de abajo, y puede asignar el mismo grupo de etiquetadores a ambas colas.
  • Priorización de tareas: los etiquetadores asignados a ambas tareas siempre procesarán primero los documentos pendientes de la cola de vía rápida antes de procesar la cola estándar (es decir, el sistema gestiona automáticamente la priorización de las colas).
  • Llamada a la API: define el campo priority en ReviewDocument
  • Captura de pantalla de la interfaz de usuario (de las tareas en la interfaz de Gestor de etiquetas) Captura de pantalla de la interfaz de usuario

Filtros de validación para el endpoint de HITL (24 de junio)

  • Los filtros de validación (configurados en el procesador) que filtran los campos por puntuación de confianza para determinar los documentos que se deben poner en cola para la revisión humana ahora también se aplican a los documentos enviados al endpoint de intervención humana.
  • Cuando llames a la API ReviewDocument, define el campo enable_schema_validation como true. Ten en cuenta que, si se define este valor y la validación determina que el documento no necesita activar la revisión humana, se devolverá un error CANCELLED.

Cancel API

  • Para cancelar un documento en cola para el procesamiento de HITL, invoca la API Cancel con un ID de operación concreto. [Se devuelve un ID de operación por cada documento enviado a la revisión humana]

         `POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
    

Tipo de factura (revisión de clasificación)

  • Labeler Workbench permite revisar la clasificación de los tipos de factura. Clasificación del tipo de factura

Informe Tiempo en cola (SLO de latencia de intervención humana)

  • En un informe se indica cuántos documentos están en cola durante más de 18 horas y más de 24 horas. Esto es útil para los usuarios que necesitan gestionar una expectativa de SLO en la latencia de HITL. Informe Tiempo en cola

URL conocida de la herramienta de etiquetador

  • Los etiquetadores asignados a un solo grupo ahora pueden acceder al espacio de trabajo en una URL conocida: https://datacompute.corp.google.com/w/. Esta opción es útil si pierdes el correo con la URL que te envió el sistema o el gestor de etiquetado. Esta URL no funciona para los etiquetadores asignados a varios grupos.

Ajuste de zoom fijo

  • Ahora, el complemento recuerda el ajuste de zoom de un etiquetador (ancho completo o página completa) para las siguientes revisiones de documentos de la cola, de modo que no tenga que ampliar cada documento.