Vista geral do extrator personalizado

O extrator personalizado extrai entidades de documentos de um tipo específico. Por exemplo, pode extrair os itens de um menu ou o nome e as informações de contacto de um currículo.

Vista geral

O objetivo do extrator personalizado é permitir que os utilizadores da IA Documentos criem soluções de extração de entidades personalizadas para novos tipos de documentos para os quais não estão disponíveis processadores pré-formados. O extrator personalizado inclui uma combinação de modelos de aprendizagem avançada com reconhecimento do esquema (para IA generativa e modelos personalizados) e modelos baseados em modelos.

Que método de preparação devo usar?

O extrator personalizado suporta uma vasta gama de exemplos de utilização com três modos diferentes.

Método de preparação Exemplos de documentos Variação do esquema do documento Texto ou parágrafos de forma livre Número de documentos de preparação para uma qualidade pronta para produção, consoante a variabilidade
Ajuste preciso e modelo base (IA generativa). Contrato, Termos de Utilização, fatura, extrato bancário, conhecimento de embarque, recibos de vencimento. Do mais alto para o mais baixo (preferido). Alto. Médio: 0 a mais de 50 documentos.
Modelo personalizado. Modelo. Formulários semelhantes com variação de esquema ao longo dos anos ou fornecedores (por exemplo, W9). Baixa a média. Baixa. Elevado: 10 a mais de 100 documentos.
Modelo. Formulários fiscais com um esquema fixo (por exemplo, os formulários 941 e 709). Nenhum. Baixa. Baixo (3 documentos).

Como os modelos de base requerem normalmente menos documentos de preparação, são recomendados como a primeira opção para todos os esquemas variáveis.

Pontuação de confiança

A pontuação de confiança comunica a intensidade com que o seu modelo associa cada entidade ao valor previsto. O valor está entre zero e um. Quanto mais próximo estiver de um, maior é a confiança do modelo de que o valor corresponde à entidade. Isto permite aos utilizadores definir acionadores para a revisão manual de entidades individuais quando o valor é baixo. Por exemplo, determinar se o texto numa entidade é "Olá, mundo!" ou "HeIIo vvorld!"

As vantagens desta abordagem permitem detetar entidades individuais com baixa confiança, definir limites para as previsões usadas, selecionar o limite de confiança ideal e desenvolver novas estratégias para preparar modelos com maior precisão e pontuações de confiança.

Para mais informações sobre conceitos e métricas de avaliação, consulte o artigo Avalie o desempenho