Prácticas recomendadas y limitaciones conocidas

Prácticas recomendadas

  • Un solo grupo de etiquetadores por proyecto: En la situación de BYOL, aunque la IU de configuración de HITL admite la creación de grupos de etiquetadores nuevos para cada procesador, se recomienda usar un solo grupo de etiquetadores en todos los procesadores de un proyecto para simplificar las cosas. Esto se debe a que los usuarios de varios grupos de etiquetadores aún se pueden asignar a la misma tarea, y asignar un grupo de etiquetadores a una tarea no impide que el administrador de etiquetado asigne otros etiquetadores a esa tarea.
  • Múltiples tareas/tipo de documento: Es posible que se requieran varias tareas para procesar un solo tipo de documento. Esto es obligatorio en las siguientes situaciones:
    • Etiquetadores con diferentes habilidades o credenciales necesarias para revisar o validar diferentes campos del mismo documento
    • Es posible que los documentos con diferentes campos (p.ej., facturas de diferentes proveedores) necesiten un esquema diferente para validarse y, por lo tanto, deban enrutarse a diferentes tareas.
    • Los documentos de diferentes clientes tienen diferentes grupos de etiquetadores trabajando en ellos (p.ej., facturas de diferentes clientes, idiomas o países).
    En este caso, te recomendamos que crees varios procesadores (y tareas) y que publiques los documentos en la tarea correspondiente. [Es posible que se requiera un clasificador para clasificar estos documentos y publicarlos en el procesador correcto].
  • Limita la revisión a los campos obligatorios (en lugar de todos los campos extraídos en la página) para ahorrar tiempo y costos de revisión: El tiempo de respuesta por página se ajusta según la cantidad de campos que se deben revisar. Los costos de los etiquetadores de Google se basan en la cantidad de campos revisados. Por lo tanto, se recomienda limitar los campos que se revisarán a los que se usan en el proceso comercial posterior.
    • Por ejemplo, una factura puede tener más de 30 campos, pero es posible que desees limitar la revisión a solo 4 o 5 campos que sean importantes para liquidar la factura.
  • Cómo nombrar procesadores habilitados para HITL: El nombre de la tarea de HITL es el mismo que el nombre del procesador. Se recomienda usar un nombre que los administradores y los etiquetadores comprendan, y que se distinga fácilmente de otras tareas en las que trabajarán.
  • Prioritizing Tasks: Si se le asignan varias tareas a un etiquetador, este las procesa de forma secuencial. Si un etiquetador necesita cambiar de tarea (p.ej., para responder a una derivación del cliente o cumplir con un SLO), el administrador de etiquetado debe anular la asignación de la tarea actual y asignar la tarea de alta prioridad a los etiquetadores a través de la pestaña Assignments en la consola del administrador de etiquetado.
    • La cuadrícula Labelers X Tasks de la consola (que se muestra a continuación) permite que el administrador de etiquetado vea todas las asignaciones de etiquetadores a varias tareas y ajuste qué etiquetador trabaja en qué tarea para admitir las prioridades de las tareas.
  • Cómo configurar filtros de validación Filtros de validación
  • Documentos rechazados: El estado de rechazo del documento junto con el código de motivo [p. ej., tipo de documento diferente, falsificado, reflejo, borroso, borde cortado, etc.] se captura en los archivos JSON del documento (construcción TextChange para todos los cambios, HumanReview para el motivo de rechazo) y se genera en el bucket de Cloud Storage configurado. Se recomienda usar estos metadatos para separar los documentos rechazados.
  • Manejo de un gran volumen de documentos: Las cuotas actuales limitan a 600 solicitudes de documentos en línea por minuto y hasta 5 solicitudes simultáneas sin conexión (por lotes), cada una de las cuales maneja hasta 50 documentos. Se espera que controle 36,000 solicitudes en línea por hora y hasta 15,000 solicitudes de documentos sin conexión (por lotes) por hora [ya que cada lote controla hasta 50 documentos]. Si se requieren volúmenes más altos, comunícate con el equipo de asistencia.
  • Administra el tiempo y los costos de las validaciones manuales: La validación manual puede ser costosa, ya sea que uses tus propios etiquetadores o etiquetadores de Google. El tiempo dedicado por página se escala con la cantidad de campos revisados. El personal de Google (en vista previa privada) se factura por etiqueta revisada. Puedes controlar tu esfuerzo y costo de revisión limitando la interacción humana a los campos importantes que se deben verificar y corregir. Para ello, usa los filtros de validación a nivel de las etiquetas en la pantalla de configuración de revisión manual.
  • Acceso con un solo inicio de sesión con credenciales de Enterprise: Labeler Workbench y Labeling Manager Console admiten credenciales de la fuerza laboral de Google o de Gmail. Si se requiere el inicio de sesión único con credenciales empresariales, crea cuentas básicas de Google Workforce para tu equipo de etiquetadores. Google Workforce admite SAML, y puedes configurar tu proveedor de SSO para acceder a Labeler Workbench o a Labeling Manager Console con credenciales empresariales.

Limitaciones y soluciones conocidas

A continuación, se indican algunas limitaciones conocidas y posibles soluciones alternativas. Actualmente, estamos abordando las limitaciones.

  • El cuadro delimitador debe capturar algo de texto: Si se usa HITL para anotar documentos para el entrenamiento, cualquier cuadro delimitador dibujado debe detectar algo de OCR. El valor no debe estar vacío. Ingresar un valor de forma manual no soluciona este problema.
  • Nuevo grupo de etiquetadores
  • VPC-SC: Es posible que los clientes con VPC-SC activado en su proyecto de HITL no puedan usar los etiquetadores de Google para la revisión de HITL.
  • Latencia posterior a la revisión: Después de revisar un documento, puede tardar hasta 30 minutos en depositarse en la carpeta de Cloud Storage preconfigurada.
  • Límite de 10 páginas: La revisión de HITL se limita a 10 páginas para las facturas. Las facturas de más de 10 páginas no se envían para su revisión por HITL.
  • Flujo de trabajo de un solo etiquetador: Las tareas del flujo de trabajo actual se limitan a una sola revisión del etiquetador. Si varios revisores deben revisar el documento (para el control de calidad, la prevención de fraudes, etc.), sube los documentos revisados a un segundo procesador en el modo "Omitir procesador, enviar todos los documentos para la revisión de HITL" para que se revisen.
  • Edit Labeling Managers of Labeling pool: En las tareas de BYOL, no se pueden agregar ni quitar administradores de etiquetado a un grupo de etiquetado una vez que se crea. Solución alternativa: Cuando crees un nuevo grupo de etiquetado,
    • Asigna más de 1 administrador de etiquetado para que, si uno se va antes de que se complete la tarea, los demás puedan administrar el grupo y las asignaciones de tareas.
    • Las personas que necesiten ver los paneles de estadísticas de etiquetadores o tareas en la IU del Administrador de etiquetado deben agregarse como administradores del grupo cuando se cree el grupo.
  • Cómo cancelar una tarea: Una vez que se inicia una tarea, no se puede cancelar. La solución alternativa es que el administrador de etiquetado pause la tarea o quite la asignación de los etiquetadores de la tarea en la consola del Administrador de etiquetado.
  • Asignar una tarea a todo un grupo de etiquetadores con un solo clic: Actualmente, no se admite esta función, pero estará disponible pronto. La solución alternativa es seleccionar a todos los etiquetadores y asignarles la tarea.
  • Nuevo grupo de etiquetadores
  • Etiquetadores de BYOL con cuentas de Google Workspace: Si los administradores y los etiquetadores de BYOL tienen cuentas de Google Workspace, es posible que el administrador de Google Workspace deba habilitar "Otros servicios" en la parte inferior de la página Servicios de Google (capturas de pantalla a continuación) para habilitar el acceso a la Consola del administrador de etiquetado y a Labeler Workbench. Google Workspace