Visão geral da extração

A Document AI oferece vários produtos para extrair informações de documentos para diferentes casos de uso:

Analisador de formulários

O analisador de formulários extrai pares de chave-valor (KVP), tabelas, marcas de seleção (caixas de seleção) e campos genéricos para aumentar e automatizar a extração. Ele pode extrair até 11 entidades genéricas e caixas de seleção sem precisar de configuração. Você não especifica os campos (esquema) que quer extrair com o analisador de formulários. O modelo detecta e retorna entidades de interesse de cada página dos documentos.

Extrator personalizado

O extrator personalizado extrai entidades definidas no esquema e oferece três opções de modelagem: modelo de fundação, modelo personalizado e modelo personalizado com base em um modelo. Considerando os resultados promissores dos modelos de fundação com poucos ou nenhum dado de treinamento, recomendamos começar com o modelo de fundação como a primeira opção e testar outras opções conforme necessário. Os modelos de base fazem previsão de zero a poucos disparos com base em até cinco documentos rotulados no conjunto de dados e previsão refinada com mais de 10 documentos rotulados no conjunto de dados.

Método de treinamento Exemplos de documentos Variação de layout do documento Texto livre ou parágrafos Número de documentos de treinamento para qualidade pronta para produção, dependendo da variabilidade
Ajuste e modelo de fundação (IA generativa). Contrato, termos de serviço, fatura, extrato bancário, conhecimento de embarque e comprovantes de pagamento. Da maior para a menor (preferencial). Alto. Média: de 0 a mais de 50 documentos.
Modelo personalizado. Modelo. Formulários semelhantes com variação de layout ao longo dos anos ou entre fornecedores (por exemplo, W9). Baixa a média. Baixa. Alta: 10 a mais de 100 documentos.
Modelo. Formulários fiscais com um layout fixo (por exemplo, formulários 941 e 709). Nenhuma. Baixa. Baixa (3 documentos).

Como os modelos de fundação geralmente exigem menos documentos de treinamento, eles são recomendados como a primeira opção para todos os layouts variáveis.

Analisador de layout

O analisador de layout transforma documentos em vários formatos em representações estruturadas, tornando acessíveis conteúdos como parágrafos, tabelas, listas e elementos estruturais, como títulos, cabeçalhos e rodapés de página. Ele também cria blocos com reconhecimento de contexto que facilitam a recuperação de informações em uma variedade de apps de IA generativa e descoberta.