Práticas recomendadas e limitações conhecidas

Práticas recomendadas

  • Conjunto de etiquetadores único por projeto: no cenário BYOL, embora a IU de configuração da HITL suporte a criação de novos conjuntos de etiquetadores para cada processador, recomenda-se a utilização de um único conjunto de etiquetadores em todos os processadores num projeto para simplificar. Isto acontece porque os utilizadores de vários conjuntos de etiquetadores podem continuar a ser atribuídos à mesma tarefa, e a atribuição de um conjunto de etiquetadores a uma tarefa não impede que o gestor de etiquetagem atribua outros etiquetadores a essa tarefa.
  • Várias tarefas/tipo de documento: podem ser necessárias várias tarefas para processar um único tipo de documento. Esta ação é necessária nos seguintes cenários:
    • Etiquetadores com diferentes competências ou credenciais necessárias para rever/validar diferentes campos do mesmo documento.
    • Os documentos com campos diferentes (por exemplo, faturas de diferentes fornecedores) podem precisar de um esquema diferente para serem validados e, por isso, têm de ser encaminhados para tarefas diferentes.
    • Os documentos de diferentes clientes têm diferentes conjuntos de etiquetadores a trabalhar neles (por exemplo, faturas de diferentes clientes, idiomas ou países).
    Neste cenário, recomendamos que crie vários processadores (e tarefas) e publique os documentos na tarefa adequada. [Pode ser necessário um classificador para classificar estes documentos e publicá-los no processador correto].
  • Limite a revisão aos campos necessários (em comparação com todos os campos extraídos na página) para poupar tempo e custos de revisão: o tempo de resposta/página é proporcional ao número de campos a rever. Os custos do etiquetador da Google baseiam-se no número de campos revistos. Por conseguinte, é recomendável limitar os campos a rever aos usados no processo empresarial a jusante.
    • Por exemplo, uma fatura pode ter mais de 30 campos, mas pode querer limitar a revisão apenas a 4 ou 5 campos importantes para liquidar a fatura.
  • Atribuir nomes a processadores com HITL: o nome da tarefa HITL é igual ao nome do processador. Recomendamos que use um nome que seja compreendido pelos gestores de etiquetagem e pelos etiquetadores, e que seja facilmente distinguido de outras tarefas em que possam estar a trabalhar.
  • Priorizar tarefas: se um etiquetador estiver atribuído a várias tarefas, processa-as sequencialmente. Se um etiquetador precisar de mudar de tarefas (por exemplo, para responder a uma reclamação de um cliente ou cumprir um SLO), o gestor de etiquetagem deve anular a atribuição da tarefa atual e atribuir a tarefa de alta prioridade aos etiquetadores através do separador Atribuições na consola do gestor de etiquetagem.
    • A grelha Labelers X Tasks na consola (mostrada abaixo) permite ao gestor de etiquetagem ver todas as atribuições de etiquetadores a várias tarefas e ajustar o etiquetador que trabalha em cada tarefa para suportar as prioridades das tarefas.
  • Definir filtros de validação Filtros de validação
  • Documentos rejeitados: o estado rejeitado do documento, juntamente com o código do motivo [por exemplo, tipo de documento diferente, falsificado, brilho, desfocado, corte na extremidade, etc.], é captado nos ficheiros JSON de documentos (construção TextChange para todas as alterações, HumanReview para o motivo da rejeição), gerado no contentor do Cloud Storage configurado. Recomendamos que use estes metadados para separar os documentos rejeitados.
  • Processamento de um grande volume de carregamento de documentos: as quotas atuais limitam a 600 pedidos de documentos online por minuto e até 5 pedidos offline (em lote) em simultâneo, cada um processando até 50 documentos. Espera-se que processe 36 000 pedidos online/hora e até 15 000 pedidos de documentos offline (em lote)/hora [uma vez que cada lote processa até 50 documentos]. Se precisar de volumes mais elevados, contacte o apoio técnico.
  • Gerir os custos e o tempo da validação humana: a validação humana pode ser dispendiosa, quer use os seus próprios etiquetadores ou os etiquetadores da Google. O tempo gasto por página é proporcional ao número de campos revistos. O Google Workforce (em pré-visualização privada) é faturado por etiqueta revista. Pode controlar o esforço e o custo da HITL limitando-a aos campos importantes que precisam de ser validados e corrigidos. Para o fazer, use os filtros de validação ao nível da etiqueta no ecrã de configuração da revisão humana.
  • Acesso de início de sessão único com credenciais empresariais: o Labeler Workbench e a consola do Labeling Manager suportam credenciais do Google Workforce ou do Gmail. Se for necessário o início de sessão único com credenciais empresariais, crie contas básicas do Google Workforce para os seus etiquetadores. O Google Workforce suporta SAML e pode configurar o seu fornecedor de SSO para iniciar sessão no Labeler Workbench ou na consola do Gestor de etiquetagem com credenciais empresariais.

Limitações conhecidas e soluções alternativas

Seguem-se algumas limitações conhecidas e possíveis soluções alternativas. Estamos atualmente a resolver as limitações.

  • A caixa delimitadora tem de capturar algum texto: se o HITL for usado para anotar documentos para preparação, qualquer caixa delimitadora desenhada tem de detetar algum OCR. O valor não deve estar vazio. A introdução manual de um valor não resolve este problema.
  • Novo conjunto de etiquetadores
  • VPC-SC: os clientes com o VPC-SC ativado no respetivo projeto de HITL podem não conseguir usar os etiquetadores da Google para a revisão de HITL.
  • Latência pós-revisão: depois de um documento ser revisto, pode demorar até 30 minutos para ser depositado na pasta do Cloud Storage pré-configurada.
  • Limite de 10 páginas: a revisão HITL está limitada a 10 páginas para faturas. As faturas com mais de 10 páginas não são enviadas para revisão HITL.
  • Fluxo de trabalho de etiquetador único: as tarefas do fluxo de trabalho atual estão limitadas a uma revisão de etiquetador único. Se o documento tiver de ser revisto por vários revisores (para controlo de qualidade, prevenção de fraudes, etc.), carregue os documentos revistos para um segundo processador no modo "Ignorar processador, enviar todos os documentos para revisão HITL", para que sejam revistos.
  • Editar gestores de etiquetagem do conjunto de etiquetagem: nas tarefas BYOL, não é possível adicionar nem remover gestores de etiquetagem de um conjunto de etiquetagem depois de este ser criado. Solução alternativa: quando criar um novo conjunto de etiquetagem,
    • Atribua mais de 1 gestor de etiquetagem para que, se um sair antes da conclusão da tarefa, os outros possam gerir o conjunto e as atribuições de tarefas.
    • Os indivíduos que precisam de ver os painéis de controlo de estatísticas do etiquetador ou da tarefa na IU do Gestor de etiquetagem devem ser adicionados como gestores do conjunto quando criam o conjunto.
  • Cancelar uma tarefa: depois de iniciada, não é possível cancelar uma tarefa. A solução alternativa consiste em o gestor de etiquetagem pausar a tarefa ou remover a atribuição de etiquetadores da tarefa na consola do gestor de etiquetagem.
  • Atribuir uma tarefa a um conjunto de etiquetadores inteiro com um único clique: atualmente, não é suportado, mas vai ser suportado em breve. A solução alternativa consiste em selecionar todos os etiquetadores e atribuir-lhes a tarefa.
  • Novo conjunto de etiquetadores
  • Etiquetadores BYOL com contas do Google Workspace: se os gestores de etiquetagem e os etiquetadores BYOL tiverem contas do Google Workspace, o administrador do Google Workspace pode ter de ativar "Outros serviços" na parte inferior da página Serviços Google (capturas de ecrã abaixo) para ativar o acesso à consola do gestor de etiquetagem e à bancada de trabalho do etiquetador. Google Workspace