Conceitos

Confira alguns conceitos e recursos usados neste produto:

Conceito Definição
Revisão O processo de comparar visualmente os valores de campo extraídos com os valores reais no documento e corrigir extrações incorretas ou adicionar campos extraídos que não foram identificados pelos processadores da DocAI.
Rotulador O humano que revisa o documento extraído. O cliente pode usar a própria força de trabalho (traga seu próprio rotulador ou BYOL, na sigla em inglês) ou os rotuladores do Google para a revisão humana no loop (HITL, na sigla em inglês).
Tarefa Uma fila de documentos extraídos que os rotuladores revisam. Um processador gera uma única tarefa quando configurado para revisão de HITL.
Bancada de trabalho do rotulador A interface usada por um rotulador para revisar documentos. A interface mostra os documentos da fila para que o rotulador possa revisar, corrigir e enviar ou rejeitar.
  • Os rotuladores BYOL precisam ter uma conta do Google Workforce ou do Gmail para acessar a UI de rotulagem.
  • Os rotuladores podem acessar o Workbench usando um link enviado por e-mail pelo Gerente de rotulagem após a atribuição da tarefa.
Tempo de resposta É o tempo que um rotulador leva para processar um documento. O Labeler Workbench rastreia o tempo de envio de documentos e apresenta análises de eficiência (por exemplo, para cada revisão de documento do rotulador).
Gerente de rotulagem Um ou mais gerentes de rotulagem são atribuídos a um pool de rotuladores para que possam:
  • Adicione ou remova rotuladores dos pools de rotuladores.
  • Atribuir ou cancelar a atribuição de tarefas a um rotulador. Todas as tarefas do projeto podem ser acessadas por um gerente de rotuladores. Eles podem mudar as atribuições de tarefas para rotuladores com base nas prioridades das tarefas.
  • Pause as tarefas para que os rotuladores possam trabalhar nas próximas tarefas atribuídas a eles.
No cenário BYOL, os gerentes de rotulagem são fornecidos pelo cliente. Quando os rotuladores do Google são usados, o Google fornece o Gerenciador de rotulagem.
Console do Gerenciador de marcadores UI usada por um Gerenciador de marcadores para gerenciar pools de rotuladores e atribuições de tarefas. Abra o console.
Colocar na fila, responder, concluir e rejeitar documentos em uma tarefa Uma tarefa é um fluxo de trabalho contínuo. Um documento passa pelos seguintes estados:
  • Na fila: à medida que os documentos são processados, eles são enqueued (adicionados) à tarefa de HITL.
  • Respondido: quando um documento é revisado, corrigido e enviado por um rotulador, ele é concluído e salvo no bucket do Cloud Storage configurado pelo cliente.
  • Concluída: quando um documento é respondido por todos os rotuladores se a tarefa tiver a replicação ativada (vários rotuladores trabalhando em cada documento da tarefa). Quando a tarefa não tem replicação ( revisada por um único rotulador), Respondida é o mesmo que Concluída.
  • Rejeitado: um documento pode ser rejeitado se for inválido (tipo diferente, falsificado etc.) ou de baixa qualidade (reflexo, corte na borda etc.).
Uma tarefa por processador Não é possível usar várias tarefas por processador. Se os clientes precisarem processar um único tipo de documento (faturas, por exemplo) em diferentes tarefas, eles poderão configurar vários processadores com a revisão humana no loop.
Atribuição de tarefas x pools de rotuladores O Labeling Manager adiciona rotuladores a um pool. Depois de adicionados, qualquer rotulador do pool pode ser atribuído a uma tarefa. "Pool de rotuladores" não deve ser confundido com o "grupo" de rotuladores atribuídos a uma tarefa. Um pool é gerenciado no nível do projeto e usado para determinar o acesso do rotulador às análises e às tarefas. Qualquer rotulador do pool pode ser atribuído a uma ou mais tarefas no projeto.
Pool de rotuladores Um pool de rotuladores é criado no nível do projeto e não deve ser confundido com atribuições de tarefas. O Gerenciador de rotulagem pode atribuir qualquer rotulador a uma tarefa, para que vários rotuladores possam revisar documentos em paralelo e concluir a tarefa mais rapidamente. Um pool de rotuladores pode ser atribuído a qualquer tarefa no projeto pelo cliente.
Filtros e limites de validação Os campos extraídos têm uma pontuação de confiança (0 a 100) que representa a confiança de que a extração do DocAI é precisa. Os clientes podem configurar o limite de validação para cada campo. Assim, apenas as páginas com campos abaixo desse limite são colocadas na fila para revisão. Os campos acima do limite não são colocados na fila. Há três tipos de filtros de validação que os clientes podem configurar:
  • Filtro no nível do campo: selecione os campos importantes que precisam ser revisados e especifique um limite de confiança para cada um deles. Se esse limite for definido como 100% para qualquer campo, todas as páginas que contêm esse campo serão enviadas para revisão.
  • Filtro no nível do documento: selecione um limite de confiança geral no nível do documento. Se algum campo estiver abaixo do limite, toda a página será enviada para análise. Se esse limite for definido como 100%, todos os documentos previstos serão enviados para revisão.
  • Nenhum filtro: todos os documentos postados no endpoint HITL são enviados para revisão.
Análise do Gerenciador de rotuladores O Gerenciador de identificação recebe análises de cada tarefa e rotulador, incluindo tempo médio de processamento/documento e tempo total de resposta. As análises são acessadas na guia "Analytics" do console do Gerenciador de marcadores.