Prácticas recomendadas
- Un solo grupo de etiquetadores por proyecto: en el caso de la opción Trae tu propio idioma, aunque la interfaz de usuario de configuración de HITL permite crear grupos de etiquetadores para cada procesador, se recomienda usar un solo grupo de etiquetadores en todos los procesadores de un proyecto para simplificar las cosas. Esto se debe a que se pueden asignar usuarios de varios grupos de etiquetadores a la misma tarea, y asignar un grupo de etiquetadores a una tarea no impide que el gestor de etiquetado asigne otros etiquetadores a esa tarea.
- Varias tareas o tipos de documentos: es posible que se necesiten varias tareas para procesar un solo tipo de documento. Esto es obligatorio en los siguientes casos:
- Etiquetadores con diferentes habilidades o credenciales necesarias para revisar o validar distintos campos del mismo documento.
- Los documentos con campos diferentes (por ejemplo, facturas de distintos proveedores) pueden necesitar un esquema diferente para validarse, por lo que deben dirigirse a tareas diferentes.
- Los documentos de distintos clientes tienen diferentes grupos de etiquetadores (por ejemplo, facturas de diferentes clientes, idiomas o países).
- Limitar la revisión a los campos obligatorios (en lugar de a todos los campos extraídos de la página) para ahorrar tiempo y costes de revisión: el tiempo de respuesta por página se ajusta según el número de campos que se deben revisar. Los costes de la etiquetadora de Google se basan en el número de campos revisados. Por lo tanto, se recomienda limitar los campos que se van a revisar a los que se utilizan en el proceso empresarial posterior.
- Por ejemplo, una factura puede tener más de 30 campos, pero puede que solo quieras revisar 4 o 5 campos que sean importantes para liquidarla.
- Nombres de los procesadores habilitados para HITL: el nombre de la tarea de HITL es el mismo que el del procesador. Te recomendamos que uses un nombre que entiendan los administradores y los etiquetadores, y que se distinga fácilmente de otras tareas en las que estén trabajando.
- Priorizar tareas: si se asignan varias tareas a un etiquetador, este las procesa de forma secuencial. Si un etiquetador necesita cambiar de tarea (por ejemplo, para responder a una incidencia de un cliente o cumplir un SLO), el gestor de etiquetado debe quitarle la tarea actual y asignarle la tarea de alta prioridad a los etiquetadores mediante la pestaña Assignments(Asignaciones) de la consola del gestor de etiquetado.
- La cuadrícula Etiquetadores X Tareas de la consola (que se muestra a continuación) permite al gestor de etiquetado ver todas las asignaciones de etiquetadores a varias tareas y ajustar qué etiquetador trabaja en qué tarea para cumplir las prioridades de las tareas.
-
Configurar filtros de validación
- Documentos rechazados: el estado de rechazo del documento junto con el código de motivo (por ejemplo, tipo de documento diferente, falsificado, reflejo, borroso, borde cortado, etc.) se registra en los archivos JSON del documento (construcción TextChange para todos los cambios y HumanReview para el motivo del rechazo), que se generan en el bucket de Cloud Storage configurado. Se recomienda usar estos metadatos para separar los documentos rechazados.
- Gestión de grandes volúmenes de documentos: las cuotas actuales limitan las solicitudes de documentos online a 600 por minuto y las solicitudes offline (por lotes) simultáneas a 5, cada una de las cuales puede gestionar hasta 50 documentos. Se espera que gestione 36.000 solicitudes online por hora y hasta 15.000 solicitudes de documentos sin conexión (por lotes) por hora, ya que cada lote gestiona hasta 50 documentos. Si necesitas volúmenes más altos, ponte en contacto con el equipo de Asistencia.
- Gestionar el tiempo y los costes de validación humana: la validación humana puede ser costosa, tanto si utilizas tus propios etiquetadores como si contratas etiquetadores de Google. El tiempo dedicado por página se ajusta según el número de campos revisados. Los empleados de Google (en vista previa privada) facturan por cada etiqueta revisada. Puedes controlar el coste y la dedicación de las revisiones limitando la intervención humana a los campos más importantes que deben verificarse y corregirse. Para ello, utiliza los filtros de validación a nivel de etiqueta en la pantalla de configuración Revisión humana.
- Acceso con inicio de sesión único con credenciales de Enterprise: Labeler Workbench y Labeling Manager Console admiten credenciales de Google Workforce o de Gmail. Si se requiere el inicio de sesión único con credenciales de empresa, crea cuentas de Google de Basic Workforce para tus etiquetadores. Google Workforce admite SAML y puedes configurar tu proveedor de SSO para iniciar sesión en Labeler Workbench o en la consola de Labeling Manager con credenciales de empresa.
Limitaciones conocidas y soluciones alternativas
A continuación, se indican algunas limitaciones conocidas y posibles soluciones alternativas. Estamos trabajando para solucionar estas limitaciones.
- El cuadro delimitador debe incluir texto: si se usa HITL para anotar documentos con fines de entrenamiento, cualquier cuadro delimitador que se dibuje debe detectar algún OCR. El valor no puede estar vacío. Introducir un valor manualmente no soluciona este problema.
- VPC-SC: es posible que los clientes que tengan activado VPC-SC en su proyecto de intervención humana no puedan usar los etiquetadores de Google para la revisión con intervención humana.
- Latencia posterior a la revisión: una vez que se ha revisado un documento, puede tardar hasta 30 minutos en depositarse en la carpeta de Cloud Storage preconfigurada.
- Límite de 10 páginas: la revisión con intervención humana se limita a 10 páginas en las facturas. Las facturas de más de 10 páginas no se envían a revisión humana.
- Flujo de trabajo de un solo etiquetador: las tareas del flujo de trabajo actual se limitan a una sola revisión del etiquetador. Si el documento debe revisarlo más de un revisor (por ejemplo, para comprobar la calidad o prevenir el fraude), sube los documentos revisados a un segundo procesador en el modo "Saltar procesador y enviar todos los documentos para que los revise un humano".
- Editar administradores de etiquetado del conjunto de etiquetado: en las tareas de BYOL, los administradores de etiquetado no se pueden añadir ni quitar de un conjunto de etiquetado una vez que se ha creado. Solución alternativa: al crear un nuevo grupo de etiquetado,
- Asigna más de un administrador de etiquetado para que, si uno de ellos se va antes de que se complete la tarea, los demás puedan gestionar el grupo y las asignaciones de tareas.
- Los usuarios que necesiten ver los paneles de control de analíticas de etiquetadores o tareas en la interfaz de usuario de Gestor de etiquetado deben añadirse como administradores del grupo al crear el grupo.
- Cancelar una tarea: una vez que se ha iniciado una tarea, no se puede cancelar. Para solucionar este problema, el Gestor de etiquetado debe pausar la tarea o quitar a los etiquetadores de la tarea en la consola del Gestor de etiquetado.
- Asignar una tarea a todo un grupo de etiquetadores con un solo clic: esta función no está disponible por el momento, pero lo estará en breve. La solución alternativa es seleccionar a todos los etiquetadores y asignarles la tarea.
- Etiquetadores con BYOL y cuentas de Google Workspace: si los gestores y etiquetadores con BYOL tienen cuentas de Google Workspace, es posible que el administrador de Google Workspace tenga que habilitar "Otros servicios" en la parte inferior de la página Servicios de Google (capturas de pantalla más abajo) para permitir el acceso a la consola de gestión de etiquetas y al espacio de trabajo de etiquetado.

