Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Confira alguns conceitos e recursos usados neste produto:
Conceito
Definição
Revisão
O processo de comparar visualmente os valores de campo extraídos com os valores reais no documento e corrigir extrações incorretas ou adicionar campos extraídos que não foram identificados pelos processadores da DocAI.
Rotulador
O humano que revisa o documento extraído. O cliente pode usar a própria força de trabalho (traga seu próprio rotulador ou BYOL, na sigla em inglês) ou os rotuladores do Google para a revisão humana no loop (HITL, na sigla em inglês).
Tarefa
Uma fila de documentos extraídos que os rotuladores revisam. Um processador gera uma única tarefa quando configurado para revisão de HITL.
Bancada de trabalho do rotulador
A interface usada por um rotulador para revisar documentos. A interface mostra os documentos da fila para que o rotulador possa revisar, corrigir e enviar ou rejeitar.
Os rotuladores BYOL precisam ter uma conta do Google Workforce ou do Gmail para acessar a UI de rotulagem.
Os rotuladores podem acessar o Workbench usando um link enviado por e-mail pelo Gerente de rotulagem após a atribuição da tarefa.
Tempo de resposta
É o tempo que um rotulador leva para processar um documento. O Labeler Workbench rastreia o tempo de envio de documentos e apresenta análises de eficiência (por exemplo, para cada revisão de documento do rotulador).
Gerente de rotulagem
Um ou mais gerentes de rotulagem são atribuídos a um pool de rotuladores para que possam:
Adicione ou remova rotuladores dos pools de rotuladores.
Atribuir ou cancelar a atribuição de tarefas a um rotulador. Todas as tarefas do projeto podem ser acessadas por um gerente de rotuladores. Eles podem mudar as atribuições de tarefas para rotuladores com base nas prioridades das tarefas.
Pause as tarefas para que os rotuladores possam trabalhar nas próximas tarefas atribuídas a eles.
No cenário BYOL, os gerentes de rotulagem são fornecidos pelo cliente.
Quando os rotuladores do Google são usados, o Google fornece o Gerenciador de rotulagem.
UI usada por um Gerenciador de marcadores para gerenciar pools de rotuladores e atribuições de tarefas. Abra o console.
Colocar na fila, responder, concluir e rejeitar documentos em uma tarefa
Uma tarefa é um fluxo de trabalho contínuo. Um documento passa pelos seguintes estados:
Na fila: à medida que os documentos são processados, eles são enqueued (adicionados) à tarefa de HITL.
Respondido: quando um documento é revisado, corrigido e enviado por um rotulador, ele é concluído e salvo no bucket do Cloud Storage configurado pelo cliente.
Concluída: quando um documento é respondido por todos os rotuladores se a tarefa tiver a replicação ativada (vários rotuladores trabalhando em cada documento da tarefa). Quando a tarefa não tem replicação ( revisada por um único rotulador), Respondida é o mesmo que Concluída.
Rejeitado: um documento pode ser rejeitado se for inválido (tipo diferente, falsificado etc.) ou de baixa qualidade (reflexo, corte na borda etc.).
Uma tarefa por processador
Não é possível usar várias tarefas por processador. Se os clientes precisarem processar um único tipo de documento (faturas, por exemplo) em diferentes tarefas, eles poderão configurar vários processadores com a revisão humana no loop.
Atribuição de tarefas x pools de rotuladores
O Labeling Manager adiciona rotuladores a um pool. Depois de adicionados, qualquer rotulador do pool pode ser atribuído a uma tarefa.
"Pool de rotuladores" não deve ser confundido com o "grupo" de rotuladores atribuídos a uma tarefa. Um pool é gerenciado no nível do projeto e usado para determinar o acesso do rotulador às análises e às tarefas. Qualquer rotulador do pool pode ser atribuído a uma ou mais tarefas no projeto.
Pool de rotuladores
Um pool de rotuladores é criado no nível do projeto e não deve ser confundido com atribuições de tarefas. O Gerenciador de rotulagem pode atribuir qualquer rotulador a uma tarefa, para que vários rotuladores possam revisar documentos em paralelo e concluir a tarefa mais rapidamente. Um pool de rotuladores pode ser atribuído a qualquer tarefa no projeto pelo cliente.
Filtros e limites de validação
Os campos extraídos têm uma pontuação de confiança (0 a 100) que representa a confiança de que a extração do DocAI é precisa. Os clientes podem configurar o limite de validação para cada campo. Assim, apenas as páginas com campos abaixo desse limite são colocadas na fila para revisão. Os campos acima do limite não são colocados na fila.
Há três tipos de filtros de validação que os clientes podem configurar:
Filtro no nível do campo: selecione os campos importantes que precisam ser revisados e especifique um limite de confiança para cada um deles. Se esse limite for definido como 100% para qualquer campo, todas as páginas que contêm esse campo serão enviadas para revisão.
Filtro no nível do documento: selecione um limite de confiança geral no nível do documento. Se algum campo estiver abaixo do limite, toda a página será enviada para análise. Se esse limite for definido como 100%, todos os documentos previstos serão enviados para revisão.
Nenhum filtro: todos os documentos postados no endpoint HITL são enviados para revisão.
O Gerenciador de identificação recebe análises de cada tarefa e rotulador, incluindo tempo médio de processamento/documento e tempo total de resposta.
As análises são acessadas na guia "Analytics" do console do Gerenciador de marcadores.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-04 UTC."],[[["\u003cp\u003eDocument AI Human-in-the-Loop (HITL) is being deprecated and will no longer be available on Google Cloud after January 16, 2025, with new customers not being allowlisted.\u003c/p\u003e\n"],["\u003cp\u003eReview is the process of comparing extracted field values against actual document values, correcting errors, or adding missing extractions.\u003c/p\u003e\n"],["\u003cp\u003eA Labeler is the individual responsible for reviewing the extracted document data, and can be either part of the customer's workforce (BYOL) or provided by Google.\u003c/p\u003e\n"],["\u003cp\u003eA Labeling Manager is responsible for adding or removing labelers, assigning or unassigning tasks to labelers, and pausing tasks as needed, utilizing the Labeling Manager Console to do so.\u003c/p\u003e\n"],["\u003cp\u003eTasks are a queue of documents for labelers to review, and each document goes through states such as Enqueued, Answered, Completed, or Rejected, depending on the labeler's actions and the document's validity.\u003c/p\u003e\n"]]],[],null,["# Concepts\n========\n\n\n| **Caution** : Document AI Human-in-the-Loop is deprecated and will no longer be available on Google Cloud after January 16, 2025. New customers are not allowlisted. If you want to use (HITL) but don't see the option available, contact your Google Account team. \n|\n| To implement a human review and correction solution that meets your requirements, we recommend working with a Google Cloud certified partner like Devoteam, Searce, or Quantiphi. See [Deprecations](/document-ai/docs/deprecation) for details.\n\n\u003cbr /\u003e\n\nFollowing are some concepts and features used in this product:"]]