Este documento é um guia para os conceitos fundamentais da utilização da Document AI. Deve ler esta página antes de avançar para qualquer outra documentação ou início rápido.
Automatize os fluxos de trabalho de processamento de documentos
As empresas de todo o mundo dependem fortemente de documentos para armazenar e transmitir informações. Estas informações têm frequentemente de ser digitalizadas para se tornarem úteis. No entanto, isto é normalmente conseguido através de processos manuais que exigem muito tempo.
Por exemplo:
- Digitalizar livros para leitores de livros eletrónicos.
- Processamento de formulários de admissão médica em consultórios médicos.
- Análise de recibos e faturas para validação de relatórios de despesas.
- Autenticação da identidade com base em cartões de identificação.
- Extrair informações de rendimentos de formulários fiscais para aprovar empréstimos.
- Compreender os contratos para os termos principais dos acordos empresariais.
Cada um destes fluxos de trabalho envolve a obtenção do texto não processado de documentos e, em seguida, a extração de texto específico que corresponde aos dados necessários (os campos ou as entidades). No entanto, cada tipo de documento tem uma estrutura e um esquema diferentes, e o padrão dos campos varia consoante o exemplo de utilização específico.
Componentes do Document AI
A Document AI é uma plataforma de processamento e compreensão de documentos que extrai dados não estruturados de documentos e os transforma em dados estruturados (campos específicos, adequados para uma base de dados), o que facilita a compreensão, a análise e o consumo.
A Document AI é criada com base em produtos no Vertex AI com IA generativa para ajudar a criar aplicações de processamento de documentos escaláveis, abrangentes e baseadas na nuvem sem conhecimentos especializados de aprendizagem automática.
Com a Document AI, pode:
- Digitalize documentos através de OCR para obter texto, esquema e vários suplementos, como a deteção da qualidade da imagem (para legibilidade) e a correção da distorção (totalmente automática).
- Extraia informações de texto e esquema de ficheiros de documentos e normalize entidades.
- Identifique pares de chaves-valores (kvp) em formulários estruturados e tabelas normais. Por exemplo:
Name: Jill Smith
é um KVP. - Classifique os tipos de documentos para impulsionar processos posteriores, como a extração e o armazenamento.
- Dividir e classificar documentos por tipo. Por exemplo, um ficheiro PDF com vários documentos reais.
- Prepare conjuntos de dados para serem usados na otimização e nas avaliações de modelos através da etiquetagem automática, da gestão de esquemas e das funcionalidades de gestão de conjuntos de dados, como a revisão de documentos e previsões.
- Integre-o com produtos como o Cloud Storage, o BigQuery e a pesquisa do Vertex AI para ajudar a armazenar, pesquisar, organizar, governar e analisar documentos e metadados.
Este diagrama ilustra todos os passos principais de processamento de documentos suportados pela IA Documentos e como podem ser ligados entre si.
Processador
Um processador do Document AI encontra-se entre o ficheiro de documento e um modelo de aprendizagem automática que executa ações de processamento e compreensão de documentos. Podem ser usadas para classificar, dividir, analisar ou analisar um documento.
Cada Google Cloud projeto tem de criar as suas próprias instâncias do processador.
Os processadores enquadram-se numa das seguintes categorias:
- Digitalizar: OCR.
- Extrair: extrator personalizado, analisador de formulários, analisador de esquemas e analisadores pré-formados.
- Classificar: classificador personalizado e separador personalizado.
Consulte a lista completa de processadores e detalhes para ver informações sobre todos os tipos de processadores disponíveis para o Document AI.
Que processador devo usar?
Para decidir que tipo de processador usar para uma aplicação específica, seguem-se algumas diretrizes gerais:
Categoria | Exemplo de utilização | Tipo de processador |
---|---|---|
Digitalize | Extrair texto e informações de esquema de documentos. | Enterprise Document OCR |
Analise a qualidade da imagem digitalizada (legibilidade) de um documento. | Enterprise Document OCR com a análise da qualidade da imagem ativada | |
Extrair entidades de um documento personalizado que não cumpre os critérios do processador personalizado. | ||
Extrair | Extraia tabelas ou kvp de um formulário estruturado num documento. | Analisador de formulários |
Extrair elementos como texto, tabelas e listas num documento e devolver fragmentos com reconhecimento do contexto. | Layout Parser | |
Extraia entidades de um documento personalizado que cumpra os critérios do processador personalizado. | Crie um extrator personalizado | |
Extraia entidades de um tipo de documento especializado. | Um processador pré-formado (atualize a formação para melhorar a qualidade). | |
Classifique | Classificar documentos. | Crie um classificador personalizado |
Dividir documentos. | Crie um divisor personalizado |
Este diagrama ajuda a determinar que processador funciona melhor para cada exemplo de utilização.
Use processadores do Document AI
Seguem-se os principais passos para usar a Document AI para começar a processar documentos:
Escolha um processador adequado ao seu exemplo de utilização.
- Para ver informações completas sobre cada processador, consulte a lista completa de processadores e detalhes.
Crie um processador através da Google Cloud consola ou da API Document AI.
O Document AI cria um ponto final de previsão onde pode enviar os seus documentos.
Para instruções detalhadas, consulte o artigo Criar um processador.
Prepare um processador com dados de preparação e teste desde o início ou atualize uma nova versão do processador (pré-preparada) com base numa versão existente.
- Para ver instruções detalhadas, consulte o artigo Treinar processador.
Envie os seus documentos para processamento.
O Document AI processa os documentos e devolve um ou mais objetos
Document
, que contêm as informações estruturadas extraídas.Para obter instruções detalhadas, consulte os artigos Enviar um pedido de processamento e Processar a resposta.