A Document AI oferece vários produtos para extrair informações de documentos para diferentes casos de uso:
- Analisador de formulários
Extrator personalizado, que oferece três tipos diferentes de modelagem:
- Modelo de fundação
- Com base em modelo personalizado
- Com base em modelo personalizado
Analisador de formulários
O analisador de formulários extrai pares de chave-valor (KVP), tabelas, marcas de seleção (caixas de seleção) e campos genéricos para aumentar e automatizar a extração. Ele pode extrair até 11 entidades genéricas e caixas de seleção sem precisar de configuração. Você não especifica os campos (esquema) que quer extrair com o analisador de formulários. O modelo detecta e retorna entidades de interesse de cada página dos documentos.
Extrator personalizado
O extrator personalizado extrai entidades definidas no esquema e oferece três opções de modelagem: modelo de fundação, modelo personalizado e modelo personalizado com base em um modelo. Considerando os resultados promissores dos modelos de fundação com poucos ou nenhum dado de treinamento, recomendamos começar com o modelo de fundação como a primeira opção e testar outras opções conforme necessário. Os modelos de base fazem previsão de zero a poucos disparos com base em até cinco documentos rotulados no conjunto de dados e previsão refinada com mais de 10 documentos rotulados no conjunto de dados.
Método de treinamento | Exemplos de documentos | Variação de layout do documento | Texto livre ou parágrafos | Número de documentos de treinamento para qualidade pronta para produção, dependendo da variabilidade | |
---|---|---|---|---|---|
Ajuste e modelo de fundação (IA generativa). | Contrato, termos de serviço, fatura, extrato bancário, conhecimento de embarque e comprovantes de pagamento. | Da maior para a menor (preferencial). | Alto. | Média: de 0 a mais de 50 documentos. | |
Modelo personalizado. | Modelo. | Formulários semelhantes com variação de layout ao longo dos anos ou entre fornecedores (por exemplo, W9). | Baixa a média. | Baixa. | Alta: 10 a mais de 100 documentos. |
Modelo. | Formulários fiscais com um layout fixo (por exemplo, formulários 941 e 709). | Nenhuma. | Baixa. | Baixa (3 documentos). |
Como os modelos de fundação geralmente exigem menos documentos de treinamento, eles são recomendados como a primeira opção para todos os layouts variáveis.
Analisador de layout
O analisador de layout transforma documentos em vários formatos em representações estruturadas, tornando acessíveis conteúdos como parágrafos, tabelas, listas e elementos estruturais, como títulos, cabeçalhos e rodapés de página. Ele também cria blocos com reconhecimento de contexto que facilitam a recuperação de informações em uma variedade de apps de IA generativa e descoberta.