O analisador de formulários extrai pares de chave-valor (KVPs, na sigla em inglês), tabelas, marcas de seleção (como caixas de seleção), campos genéricos e texto para aumentar e automatizar o processamento de documentos.
O Form Parser pode ser considerado em vez dos outros analisadores quando o caso de uso envolve:
- Trabalhar com formulários estruturados: ele é excelente para extrair KVPs de formulários bem definidos que se parecem com formulários convencionais com espaços em branco rotulados para preencher, como name: __. O modelo pré-treinado do Analisador de formulários oferece alta precisão para campos comuns, como nomes, datas e endereços.
- É necessária uma extração flexível de tabelas: o analisador de formulários extrai de tabelas simples (sem células que abrangem linhas ou colunas) que parecem tabelas. Não é necessário (nem possível) fazer treinamento. Para a extração de tabelas treinadas, o extrator personalizado pode ser usado com um campo principal que contém campos filhos de coluna (célula).
- Necessidade de eficiência: evite criar e manter analisadores de extração, principalmente para tarefas de extração de alto volume e variadas.
Recursos de extração de dados
Os recursos do analisador de formulários incluem:
- KVP: são conjuntos de dois itens em um documento: um rótulo ou uma chave e os dados correspondentes (um valor). Você pode usar KVPs diretamente (se as chaves forem consistentes) ou criar uma lógica personalizada para resolver chaves variadas em informações estruturadas consistentes. 
- Entidades genéricas:analise 11 campos diferentes de documentos sem precisar de configuração. São eles: - email
- phone
- url
- date_time
- address
- person
- organization
- quantity
- price
- id
- page_number
 
- Texto e layout:use nosso mecanismo de OCR mais recente para extrair informações de texto e layout. Isso inclui texto incorporado de PDFs digitais (somente v2.1) ou texto de imagens. 
- Tabelas:detecta e extrai tabelas de imagens e PDFs. 
- Caixas de seleção:um detector de marca de seleção de alta qualidade, que extrai caixas de seleção de imagens e saída em PDF como KVP, usando o texto mais próximo da caixa de seleção, com um - valueTypeindicando se ela está marcada ou não.
Idiomas e regiões
- O Form Parser 2.0 oferece suporte a mais de 200 idiomas. Saiba mais.
- Oferecemos suporte a recursos em oito regiões. Saiba mais.
Versões do modelo
As seguintes versões de processador são compatíveis com esse recurso. Para mais informações, consulte Como gerenciar versões de processadores.
Limitações
- Compressões JPEG anteriores para TIFF não são compatíveis. Tipo de encapsulamento JPEG definido pela especificação da versão 6.0 do TIFF. 
- O modelo de caixa de seleção não oferece suporte à análise de botões de opção. Algumas caixas de seleção detectadas podem não ter chaves correspondentes. 
- O modelo não analisa de forma confiável um KVP com um valor não preenchido, como um formulário em branco. 
- A análise de KVP em documentos em determinados idiomas pode ter qualidade inferior aos idiomas latinos. 
Processar documentos com o Analisador de formulários
Neste guia de início rápido, apresentamos o recurso Analisador de formulários na Document AI. Neste guia de início rápido, você vai usar o console Google Cloud para configurar o projeto e a autorização do Google Cloud , criar um Analisador de formulários e, em seguida, fazer uma solicitação para que a Document AI processe um formulário em PDF.
Saiba como realizar as seguintes ações:
- Ative o Document AI em um projeto do Google Cloud . 
- Crie um processador do analisador de formulários, que pode identificar e extrair texto, pares de chave-valor, tabelas e entidades genéricas de vários tipos de documentos. 
- Use o processador para anotar um documento de amostra. 
Para seguir as instruções detalhadas desta tarefa diretamente no console do Google Cloud , clique em Orientação:
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
- 
    
    
      In the Google Cloud console, on the project selector page, select or create a Google Cloud project. Roles required to select or create a project - Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
- 
      Create a project: To create a project, you need the Project Creator
      (roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
 
- 
  
    Verify that billing is enabled for your Google Cloud project. 
- 
  
  
    
      Enable the Document AI API. Roles required to enable APIs To enable APIs, you need the Service Usage Admin IAM role ( roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
- 
    
    
      In the Google Cloud console, on the project selector page, select or create a Google Cloud project. Roles required to select or create a project - Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
- 
      Create a project: To create a project, you need the Project Creator
      (roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
 
- 
  
    Verify that billing is enabled for your Google Cloud project. 
- 
  
  
    
      Enable the Document AI API. Roles required to enable APIs To enable APIs, you need the Service Usage Admin IAM role ( roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
- No menu de navegação do console Google Cloud , clique em Document AI e selecione Processor Gallery. 
- Na Galeria de processadores, - procure Analisador de formulários e selecione Criar.  
- Na janela lateral, digite um Nome de processador, como - quickstart-form-processor.
- Selecione a região mais próxima de você. 
- Clique no botão Criar. 
- Fazer o download do documento de amostra. - Trata-se de um arquivo PDF com um exemplo de formulário de admissão médica escrito à mão. Este documento é armazenado em um bucket do Cloud Storage acessível publicamente. 
- Clique no botão - Fazer upload do documento de teste e selecione o documento que você acabou de salvar.
- Agora você está na página Análise do analisador de formulários. É possível conferir o texto detectado pelo OCR, os pares de chave-valor, as tabelas e as entidades genéricas extraídas do documento.     
- Consulte a lista de processadores.
Criar um processador do analisador de formulários
Use o console Google Cloud para criar um processador do analisador de formulários. Veja como criar e gerenciar processadores para saber mais.
Você será direcionado para a página Detalhes do processador do novo processador do analisador de formulários.
Processador de testes
Depois de criar o processador, você pode enviar solicitações de anotação para ele.
Limpar
Para evitar cobranças desnecessárias do Google Cloud , use o Google Cloud console para excluir o processador e o projeto se você não precisar deles.