O extrator personalizado extrai entidades de documentos de um tipo específico. Por exemplo, pode extrair os itens de um menu ou o nome e as informações de contacto de um currículo.
Vista geral
O objetivo do extrator personalizado é permitir que os utilizadores da IA Documentos criem soluções de extração de entidades personalizadas para novos tipos de documentos para os quais não estão disponíveis processadores pré-formados. O extrator personalizado inclui uma combinação de modelos de aprendizagem avançada com reconhecimento do esquema (para IA generativa e modelos personalizados) e modelos baseados em modelos.
Que método de preparação devo usar?
O extrator personalizado suporta uma vasta gama de exemplos de utilização com três modos diferentes.
Método de preparação | Exemplos de documentos | Variação do esquema do documento | Texto ou parágrafos de forma livre | Número de documentos de preparação para uma qualidade pronta para produção, consoante a variabilidade | |
---|---|---|---|---|---|
Ajuste preciso e modelo base (IA generativa). | Contrato, Termos de Utilização, fatura, extrato bancário, conhecimento de embarque, recibos de vencimento. | Do mais alto para o mais baixo (preferido). | Alto. | Médio: 0 a mais de 50 documentos. | |
Modelo personalizado. | Modelo. | Formulários semelhantes com variação de esquema ao longo dos anos ou fornecedores (por exemplo, W9). | Baixa a média. | Baixa. | Elevado: 10 a mais de 100 documentos. |
Modelo. | Formulários fiscais com um esquema fixo (por exemplo, os formulários 941 e 709). | Nenhum. | Baixa. | Baixo (3 documentos). |
Como os modelos de base requerem normalmente menos documentos de preparação, são recomendados como a primeira opção para todos os esquemas variáveis.
Pontuação de confiança
A pontuação de confiança comunica a intensidade com que o seu modelo associa cada entidade ao valor previsto. O valor está entre zero e um. Quanto mais próximo estiver de um, maior é a confiança do modelo de que o valor corresponde à entidade. Isto permite aos utilizadores definir acionadores para a revisão manual de entidades individuais quando o valor é baixo. Por exemplo, determinar se o texto numa entidade é "Olá, mundo!" ou "HeIIo vvorld!"
As vantagens desta abordagem permitem detetar entidades individuais com baixa confiança, definir limites para as previsões usadas, selecionar o limite de confiança ideal e desenvolver novas estratégias para preparar modelos com maior precisão e pontuações de confiança.
Para mais informações sobre conceitos e métricas de avaliação, consulte o artigo Avalie o desempenho