Versão de dezembro de 2022
HITL Configuration Stepper
O separador "Configuração" em "Intervenção humana" está agora formatado como um par ordenado de passos para permitir uma experiência de configuração mais fácil e estruturada.
O utilizador pode agora ver passos separados para configurar definições relacionadas com o conjunto de especialistas e filtros para acionar a HITL, bem como selecionar instruções e a localização dos resultados para os especialistas.
Versão de outubro de 2022
Painel de controlo de estatísticas do HITL Requester
A funcionalidade Human in the Loop tem agora um separador dedicado, denominado Analytics, que fornece ao utilizador métricas e gráficos para analisar o estado das tarefas HITL por processador e fazer alterações conforme necessário.
Atualmente, existem três métricas diferentes que o utilizador pode ver. Os dados podem ser agregados por um seletor de intervalo de tempo que oferece ao utilizador as seguintes opções:
Para cada intervalo de tempo selecionado, o utilizador pode ver o seguinte:
- Estatísticas agregadas: uma vista instantânea do número total de documentos que foram carregados com êxito para a fila, o número total de documentos concluídos (o que significa enviados e rejeitados) por especialistas e o tempo desde que o documento mais antigo foi adicionado à fila para o intervalo de tempo selecionado.
- Gráfico de atividade humana no circuito: um gráfico que mostra os dados de intervalos temporais
para quando os documentos foram adicionados à fila (
enqueuedDocumentCount
) e quando os documentos foram concluídos por especialistas (completedDocumentCount
). - Taxa de acionamento da revisão humana: um gráfico que mostra os dados de intervalos temporais da percentagem de documentos carregados que acionaram a revisão humana no período selecionado.
- Estatísticas agregadas: uma vista instantânea do número total de documentos que foram carregados com êxito para a fila, o número total de documentos concluídos (o que significa enviados e rejeitados) por especialistas e o tempo desde que o documento mais antigo foi adicionado à fila para o intervalo de tempo selecionado.
Versão de setembro de 2022
Nota: os clientes que usam o Document AI Workbench, os processadores de ordens de compra (OC), faturas e despesas têm acesso a um novo esquema que lhes permite etiquetar caixas de verificação (se definidas no esquema) e representar com precisão entidades aninhadas, ou seja, a relação principal/secundária na IU de anotação e revisão de HITL. À medida que mais processadores adaptarem o novo esquema, estas notas de lançamento vão ser atualizadas para refletir essa situação
Entidade aninhada
- A IU de anotação suporta agora a etiquetagem de entidades aninhadas. O painel esquerdo é atualizado com um novo aspeto para as linhas aninhadas representarem entidades aninhadas. O valor de "parent" é a concatenação de todos os seus "children".
- A seleção de entidades no painel esquerdo apresenta etiquetas principais e secundárias.
- O menu de etiquetas de entidades no documento também é atualizado para suportar a etiquetagem de entidades aninhadas.
- Quando clica numa etiqueta aninhada, é apresentado um pop-up de uma caixa de diálogo para atribuir a entidade principal correta à entidade secundária aninhada.
Caixa de verificação
- A IU de anotação suporta caixas de verificação de etiquetagem. No painel esquerdo, a caixa de verificação pode ser editada na linha.
- A edição de caixas de verificação também está disponível na caixa de diálogo de edição de entidades.
Versão de agosto de 2022
Selecionar etiqueta de entidade
- A entrada de etiqueta de entidade é substituída por uma lista pendente. Esta lista pendente contém as opções de etiquetas disponíveis quando adiciona uma nova entidade. Esta alteração ajuda a evitar que os etiquetadores cometam erros ortográficos e criem etiquetas de entidades indesejadas.
Formato de data ISO
- As datas normalizadas são apresentadas no formato de data ISO 8601(aaaa-mm-dd).
Versão de julho de 2022
Botão de confirmação rápida
- Está disponível um botão Confirmar nas sugestões rápidas de entidades para rever e confirmar rapidamente um valor de entidade/etiqueta. O botão Editar é removido, uma vez que os utilizadores podem clicar diretamente na sugestão flutuante da entidade para editar.
Versão de janeiro de 2022
Opções de etiquetas de entidades
- As opções de seleção de etiquetas de entidades estão agora limitadas à lista de campos filtrados(definidos na configuração do filtro de HITL).
Campos em falta
- Agora, apresentamos os campos em falta (ou seja, os campos marcados como "Obrigatório" na configuração do filtro HITL, mas para os quais o processador não previu valores) numa cor vermelha distinta, o que facilita a atualização do valor do campo por parte do revisor.
Amostras aleatórias completas
- Agora, suportamos a revisão completa (ou seja, todas as entidades no documento e não apenas os campos filtrados) de uma amostra aleatória (por exemplo, 2% do volume diário) de documentos. Isto é útil para monitorizar a variação do modelo e as estatísticas sobre a precisão do processador em cada campo. Recolhemos estas estatísticas, que são usadas para saber quando é necessária uma nova preparação. Isto também serve como um conjunto de dados com dados reais etiquetados para modelos de preparação.
- Os clientes podem ativar e definir a amostra aleatória [1 a 10%] com base no respetivo volume. A segmentação de 100 a 500 amostras/semana seria útil. Assim, se o cliente processar 10 000 documentos/semana, este valor pode ser definido como 500/10 000 = 5%
Configuração da HITL simplificada para novos utilizadores
- Simplificámos a configuração HITL BYOL para clientes HITL pela primeira vez, para que possam configurar rapidamente uma tarefa, atribuir especialistas e iniciá-la a partir de um único ecrã. Desta forma, podem experimentá-la rapidamente antes de aumentar o volume de produção ou externalizar a operação.
- Conforme mostrado na captura de ecrã abaixo, o utilizador é o gestor predefinido do conjunto e pode adicionar mais especialistas, que são todos atribuídos automaticamente à tarefa no mesmo ecrã.
- Anteriormente, o gestor atribuído recebia um email com um link para a consola do gestor, onde adicionava especialistas e atribuía a tarefa a estes especialistas.
- Após o envio da tarefa, o especialista (e outros especialistas atribuídos) pode aceder à app HITL para rever documentos.
- O utilizador também pode carregar um documento de teste (um de cada vez) para a fila de tarefas.
Remova o separador de linhas à direita
- Os separadores de linhas finais("\n") são removidos em entity.mentionText.
Versão de dezembro de 2021
Ordene as entidades com pontuação de confiança baixa para o início da lista
- As entidades com uma pontuação de confiança baixa (ou seja, entidades abaixo do limite de confiança) são agora ordenadas na parte superior da página, o que permite ao especialista focar-se nestas entidades. Isto gera mais eficiências na etiquetagem.
Instruções opcionais para tarefas BYOL
- As instruções em PDF a carregar para configurar uma tarefa HITL são agora opcionais. Isto simplifica os testes e os lançamentos internos rápidos em que os especialistas não precisam de um guia de instruções.
Opção de ajuste à largura e ajuste à altura da página
- Botão para ajustar a página à largura ou à altura. Isto é útil quando os especialistas têm documentos de tamanho variável (por exemplo, recibos) numa tarefa.
Nome da tarefa apresentado na IU do especialista
- O nome da tarefa é agora apresentado na IU do especialista para lhe dar contexto adicional sobre a tarefa e o tipo de documento, o que é muito útil quando o especialista está atribuído a várias tarefas.
- Tenha em atenção que esta opção é apresentada em novos processadores ativados após este lançamento.
Caixa de pesquisa de especialistas
- Os especialistas podem pesquisar entidades/texto em documentos. Isto é especialmente útil para documentos grandes com várias páginas e torna os especialistas mais produtivos.
Versão de setembro de 2021
Ative/desative para mostrar todos os campos
- Os etiquetadores podem ter de rever e atualizar campos que não estão no conjunto filtrado de entidades para documentos específicos na fila.
Pode ativar/desativar a opção Mostrar todas as previsões para permitir que os etiquetadores revejam campos não filtrados.
HITL para o analisador de formulários
- A HITL suporta agora o analisador de formulários, para que os utilizadores possam rever e corrigir os pares de chave-valor extraídos pelo analisador de formulários. O cliente pode ativar a HITL no processador Form Parser na plataforma DocAI e configurar os nomes das chaves (conforme mostrado na captura de ecrã abaixo) que quer filtrar para revisão da HITL. O resultado da HITL é colocado como ficheiros JSON no contentor do Google Cloud Storage especificado pelo cliente após a conclusão da revisão da HITL.
- Podem especificar nomes de chaves alternativos separados por vírgulas, por exemplo, "cliente, nome do cliente, cliente, conta n.º, número da conta", para que o filtro HITL detete documentos com todas as variações de nomes de chaves e os envie para revisão HITL.
Versão de agosto de 2021
Pipeline de auditoria/CQ
- A HITL permite agora uma fase de CQ ou auditoria de 2.ª fase e comunica a precisão das tarefas de revisão (e dos etiquetadores). Uma equipa de CQ ou um auditor pode ser atribuído como "etiquetador especialista" a uma tarefa. A equipa de CQ/o auditor recebe X por cento (por exemplo, 1% a 100%, este valor é configurável pelo cliente) dos documentos revistos. O auditor pode corrigir o resultado do revisor. O sistema acompanha as correções e atribui uma classificação de precisão (por exemplo, 90%) a cada documento auditado. A pontuação de precisão agregada de uma tarefa ou de um etiquetador é comunicada nos painéis de controlo de estatísticas da tarefa e do etiquetador, respetivamente.
- Seguem-se instruções detalhadas sobre como configurar um pipeline de auditoria.
- Designar um auditor
- Precisão dos relatórios
Analizadores de IA de empréstimos (15 de agosto)
- O HITL é agora suportado em alguns analisadores de IA de empréstimos, incluindo 1040, 1040 Schedule E, 1040 schedule C, 1099 DIV, 1099 G, 1099 INT, 1099 MISC, Paystubs, Banks Statements, W2, W9, 1120, 1120S, 1065, SSA-1099, 1099 NEC e 1099-R.
Versão de julho de 2021
Filas padrão vs. urgentes (2 de julho)
- Agora, suportamos 2 filas prioritárias (em vez de 1 fila) para cada processador, com base na urgência de cada documento.
- Envio: após a previsão, os documentos extraídos podem ser avaliados quanto à urgência e enviados para 2 filas (padrão vs. urgente/via rápida) com base na urgência do documento. Por exemplo, as faturas com datas de vencimento urgentes podem ser enviadas para a fila de processamento rápido. A lógica que avalia a urgência está atualmente fora da HITL e pode ser uma função personalizada.
- Atribuição de tarefas: o gestor de etiquetagem vê 2 filas diferentes com prioridades diferentes, conforme mostrado na captura de ecrã abaixo, e pode atribuir o mesmo grupo de etiquetadores a ambas as filas.
- Priorização de tarefas: os etiquetadores atribuídos a ambas as tarefas processam sempre primeiro os documentos pendentes na fila de processamento rápido antes de processarem a fila padrão (ou seja, a priorização da fila é processada automaticamente pelo sistema)
- Chamada API: defina o campo priority no ReviewDocument
- Captura de ecrã da IU (de tarefas na IU do Gestor de etiquetagem) -
Versão de junho de 2021
Filtros de validação para o ponto final HITL (24 de junho)
- Os filtros de validação (configurados no processador) que filtram os campos por classificação de confiança para determinar os documentos a serem colocados em fila para revisão humana, são agora também aplicados aos documentos enviados para o ponto final HITL.
- Quando chamar a API ReviewDocument, defina o campo enable_schema_validation como verdadeiro.
- Tenha em atenção que, se esta opção estiver definida e a validação determinar que o documento não tem de acionar a revisão humana, é devolvido um erro CANCELLED.
API Cancel
O cliente pode cancelar um documento colocado em fila para processamento HITL invocando a API Cancel para um determinado ID de operação. É devolvido um ID da operação para cada documento enviado para a HITL.
`POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
Tipo de fatura (revisão da classificação)
- A bancada de trabalho do etiquetador suporta a revisão da classificação do tipo de fatura.
Relatório de tempo na fila (SLO de latência de HITL)
- Um relatório mostra quantos documentos estão em fila durante mais de 18 horas e mais de 24 horas. Isto é útil para os utilizadores que precisam de gerir uma expetativa de SLO na latência HITL.
URL conhecido para o Labeler Workbench
- Os etiquetadores atribuídos a um único conjunto podem agora aceder à bancada de trabalho através de um URL conhecido e não precisam de procurar URLs enigmáticos enviados em notificações por email (pelo sistema ou pelo gestor de etiquetagem). Este URL não funciona para etiquetadores atribuídos a vários conjuntos.
Definição de zoom persistente
- O plug-in agora lembra-se da definição de zoom do etiquetador (largura total vs. página inteira) para as revisões de documentos seguintes na fila, para que não tenha de aumentar o zoom para cada documento.
HITL para o analisador de formulários
- O HITL suporta agora o analisador de formulários. Os utilizadores podem rever e corrigir os pares de chave-valor extraídos pelo analisador de formulários, e ativar o HITL no processador do analisador de formulários na plataforma DocAI e configurar os nomes das chaves (conforme mostrado na captura de ecrã abaixo) que querem filtrar para revisão do HITL. O resultado da HITL é guardado em ficheiros JSON no contentor do Google Cloud Storage especificado pelo cliente após a conclusão da revisão da HITL.
- Capturas de ecrã da IU para configurar a HITL em analisadores de formulários
- IU para configurar a validação ao nível da chave
- IU do etiquetador
Pipeline de auditoria/CQ
- A HITL permite agora uma fase de CQ ou auditoria de 2.ª fase e comunica a precisão das tarefas de revisão (e dos etiquetadores). Uma equipa de CQ ou um auditor pode ser atribuído como "etiquetador especialista" a uma tarefa. A equipa de CQ/o auditor recebe X por cento (por exemplo, 1% a 100%, este valor é configurável pelo cliente) dos documentos revistos. O auditor pode corrigir o resultado do revisor. O sistema acompanha as correções e atribui uma classificação de precisão (por exemplo, 90%) a cada documento auditado. A pontuação de precisão agregada de uma tarefa ou de um etiquetador é comunicada nos painéis de controlo de estatísticas da tarefa e do etiquetador, respetivamente. Seguem-se instruções detalhadas sobre a configuração de um pipeline de auditoria.
Designar um auditor
Precisão dos relatórios
Análise de IA de empréstimos (31 de julho)
- O HITL é agora suportado em alguns analisadores de IA de empréstimos, incluindo 1040, 1040 Schedule E, 1040 schedule C, 1099 DIV, 1099 G, 1099 INT, 1099 MISC, Paystubs, Banks Statements, W2, W9, 1120, 1120S, 1065, SSA-1099, 1099 NEC e 1099-R
Filas padrão vs. de acesso rápido (2 de julho)
- Agora, suportamos 2 filas prioritárias (em vez de 1 fila) para cada processador, com base na urgência de cada documento.
- Envio: após a previsão, os documentos extraídos podem ser avaliados quanto à urgência e enviados para 2 filas (padrão vs. urgente/via rápida) com base na urgência do documento. Por exemplo, as faturas com datas de vencimento urgentes podem ser enviadas para a fila de processamento rápido. A lógica que avalia a urgência pode ser introduzida através de uma função personalizada.
- Atribuição de tarefas: o gestor de etiquetagem vê 2 filas diferentes com prioridades diferentes, conforme mostrado na captura de ecrã abaixo, e pode atribuir o mesmo grupo de etiquetadores a ambas as filas.
- Priorização de tarefas: os etiquetadores atribuídos a ambas as tarefas processam sempre primeiro os documentos pendentes na fila de processamento rápido antes de processarem a fila padrão (ou seja, a priorização da fila é processada automaticamente pelo sistema)
- Chamada API: defina o campo priority no ReviewDocument
- Captura de ecrã da IU (das tarefas na IU do Gestor de etiquetagem)
Filtros de validação para o ponto final HITL (24 de junho)
- Os filtros de validação (configurados no processador) que filtram os campos por classificação de confiança para determinar os documentos a serem colocados em fila para revisão humana, são agora também aplicados aos documentos enviados para o ponto final HITL.
- Quando chamar a API
ReviewDocument
, defina o campo enable_schema_validation como verdadeiro. Tenha em atenção que, se esta opção estiver definida e a validação determinar que o documento não tem de acionar a revisão humana, é devolvido um erro CANCELLED.
API Cancel
Pode cancelar um documento colocado em fila para processamento HITL invocando a API Cancel para um determinado ID de operação. [É devolvido um ID de operação para cada documento enviado para a HITL]
`POST https://[us|eu]-documentai.googleapis.com/{api_version}/{name=projects/*/operations/*}:cancel`
Tipo de fatura (revisão da classificação)
- A bancada de trabalho do etiquetador suporta a revisão da classificação do tipo de fatura.
Relatório de tempo na fila (SLO de latência de HITL)
- Um relatório mostra quantos documentos estão em fila durante mais de 18 horas e mais de 24 horas. Isto é útil para os utilizadores que precisam de gerir uma expetativa de SLO na latência HITL.
URL conhecido para o Labeler Workbench
- Os etiquetadores atribuídos a um único conjunto podem agora aceder à bancada de trabalho num URL conhecido: https://datacompute.corp.google.com/w/. Isto é útil caso perca o email com o URL enviado pelo sistema ou pelo Gestor de etiquetagem. Este URL não funciona para etiquetadores atribuídos a vários conjuntos.
Definição de zoom persistente
- O plug-in agora lembra-se da definição de zoom de um etiquetador (largura total vs. página inteira) para as revisões de documentos seguintes na fila, para que não tenha de aumentar o zoom para cada documento.