Analisador de formulários

O analisador de formulários extrai pares de chaves-valores (KVPs), tabelas, marcas de seleção (como caixas de verificação), campos genéricos e texto para aumentar e automatizar o processamento de documentos.

O analisador de formulários pode ser considerado em relação aos outros analisadores quando o exemplo de utilização envolve:

  • Tratar de formulários estruturados: destaca-se na extração de KVPs de formulários bem definidos que se assemelham a formulários convencionais com espaços em branco etiquetados para preencher, como name: __. O modelo pré-preparado do analisador de formulários oferece uma elevada precisão para campos comuns, como nomes, datas e moradas.
  • É necessária uma extração de tabelas flexível: o analisador de formulários extrai dados de tabelas simples (sem células que abranjam linhas ou colunas) que se parecem com tabelas. Não é necessária (nem possível) preparação. Para a extração de tabelas preparada, o extrator personalizado pode ser usado com um campo principal que contenha campos secundários de colunas (células).
  • Necessidade de eficiência: evite criar e manter analisadores de extração, especialmente para tarefas de extração de grande volume e variadas.

Funcionalidades de extração de dados

As funcionalidades do analisador de formulários incluem:

  • Pares de chave/valor: são conjuntos de dois itens num documento: uma etiqueta ou uma chave e os respetivos dados (um valor). Pode usar diretamente os PNVs (se as chaves forem consistentes) ou criar uma lógica personalizada para resolver chaves variáveis em informações estruturadas consistentes.

  • Entidades genéricas: analise 11 campos diferentes de documentos de imediato. Por exemplo:

    • email
    • phone
    • url
    • date_time
    • address
    • person
    • organization
    • quantity
    • price
    • id
    • page_number
  • Texto e esquema: use o nosso motor de OCR mais recente para extrair texto e informações de esquema. Isto inclui texto incorporado de PDFs digitais (apenas v2.1) ou texto de imagens.

  • Tabelas: detete e extraia tabelas de imagens e PDFs.

  • Caixas de verificação: um detetor de marcas de seleção de alta qualidade que extrai caixas de verificação de imagens e resultados em PDF como KVP, usando o texto mais próximo da caixa de verificação, com um valueType a indicar se está preenchida ou não.

Idiomas e regiões

  • O analisador de formulários 2.0 suporta mais de 200 idiomas. Saiba mais.
  • Oferecemos suporte de funcionalidades em oito regiões. Saiba mais.

Versões do modelo

As seguintes versões de processador são compatíveis com esta funcionalidade. Para mais informações, consulte o artigo Gerir versões do processador.

Limitações

  • As compressões JPEG anteriores para TIFF não são suportadas. Tipo de encapsulamento JPEG definido pela especificação da versão 6.0 do TIFF.

  • O modelo de caixa de verificação não suporta a análise de botões de opção. Algumas caixas de verificação detetadas podem não ter chaves correspondentes.

  • O modelo não analisa de forma fiável um KVP com um valor não preenchido, como um formulário em branco.

  • A análise de KVPs em documentos em determinados idiomas pode ter uma qualidade inferior à dos idiomas latinos.

Processe documentos com o analisador de formulários

Este início rápido apresenta a funcionalidade Form Parser na IA Documental. Neste início rápido, usa a Google Cloud consola para configurar o seu projeto Google Cloud e autorização, criar um analisador de formulários e, em seguida, fazer um pedido ao Document AI para processar um formulário PDF.

Saiba como:

  1. Ative o Document AI num Google Cloud projeto.

  2. Crie um processador Form Parser, que pode identificar e extrair texto, pares de chave/valor, tabelas e entidades genéricas de muitos tipos de documentos.

  3. Use o processador para anotar um documento de exemplo.


Para seguir orientações passo a passo para esta tarefa diretamente na Google Cloud consola, clique em Orientar-me:

Visita guiada


  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Document AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Document AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  8. Crie um processador Form Parser

    Use a Google Cloud consola para criar um processador Form Parser. Consulte o artigo sobre como criar e gerir processadores para mais informações.

    1. No Google Cloud menu de navegação da consola, clique em Document AI e selecione Galeria de processadores.

      Processador Galeria

    2. Na galeria de processadores, pesquise Form Parser e selecione Criar.

      Opção do analisador de formulários na IU

    3. Na janela lateral, introduza um nome do processador, como quickstart-form-processor.

    4. Selecione a região mais próxima de si.

    5. Clique no botão Criar.

    Acede à página Detalhes do processador do novo processador de análise de formulários.

    Processador de testes

    Depois de criar o processador, pode enviar-lhe pedidos de anotação.

    1. Transfira o documento de exemplo.

      É um ficheiro PDF que contém um exemplo de formulário de admissão médica escrito à mão. Este documento está armazenado num contentor do Cloud Storage acessível publicamente.

    2. Clique no botão Carregar documento de teste e selecione o documento que acabou de transferir.

    3. Agora, deve estar na página Análise do analisador de formulários. Pode ver o texto detetado pela OCR, os pares de chave-valor, as tabelas e as entidades genéricas extraídas do documento.

      Exemplo de pares de chave-valor de formulário na IU Exemplo de entidades genéricas de formulários na IU

    Limpar

    Para evitar custos Google Cloud desnecessários, use o Google Cloud console para eliminar o processador e o projeto se não precisar deles.

    O que se segue?