Este documento é um guia dos conceitos fundamentais do uso da Document AI. Leia esta página antes de prosseguir para qualquer outra documentação ou guia de início rápido.
Automatizar fluxos de trabalho de processamento de documentos
Empresas em todo o mundo dependem muito de documentos para armazenar e transmitir informações. Essas informações geralmente precisam ser digitalizadas para serem úteis. No entanto, isso geralmente é feito por processos manuais que exigem muito tempo.
Exemplo:
- Digitalização de livros para e-readers.
- Processamento de formulários de admissão médica em consultórios.
- Analisar recibos e faturas para validação de relatórios de despesas.
- Autenticação de identidade com base em documentos de ID.
- Extrair informações de renda de formulários fiscais para aprovar empréstimos.
- Entender os contratos para os principais termos de acordo comercial.
Cada um desses fluxos de trabalho envolve a obtenção do texto bruto dos documentos e a extração de texto específico que corresponde aos dados necessários (campos ou entidades). No entanto, cada tipo de documento tem uma estrutura e um layout diferentes, e o padrão de campos varia dependendo do caso de uso específico.
Componentes da Document AI
A Document AI é uma plataforma de processamento e compreensão de documentos que pega dados não estruturados de documentos e os transforma em dados estruturados (campos específicos, adequados para um banco de dados), facilitando o entendimento, a análise e o consumo.
A Document AI é criada com base em produtos da Vertex AI com IA generativa para ajudar você a criar aplicativos de processamento de documentos escalonáveis, de ponta a ponta e baseados na nuvem sem experiência especializada em machine learning.
Com a Document AI, é possível:
- Digitalize documentos usando OCR para extrair texto, layout e vários complementos, como detecção de qualidade de imagem (para legibilidade) e correção de distorção (totalmente automática).
- Extrair texto e informações de layout de arquivos de documentos e normalizar entidades.
- Identificar pares de chave-valor (kvp) em formulários estruturados e tabelas comuns. Por exemplo:
Name: Jill Smith
é um KVP. - Classifique tipos de documentos para impulsionar processos downstream, como extração e armazenamento.
- Divida e classifique os documentos por tipo. Por exemplo, um arquivo PDF com vários documentos reais.
- Prepare conjuntos de dados para usar no ajuste fino e nas avaliações de modelos com recursos de rotulagem automática, gerenciamento de esquemas e gerenciamento de conjuntos de dados, como revisão de documentos e previsões.
- Integre-o a produtos como Cloud Storage, BigQuery e Pesquisa da Vertex AI para ajudar você a armazenar, pesquisar, organizar, controlar e analisar documentos e metadados.
Este diagrama ilustra todas as principais etapas de processamento de documentos compatíveis com a Document AI e como elas podem se conectar.
Processador
Um processador da Document AI fica entre o arquivo de documento e um modelo de aprendizado de máquina que executa ações de processamento e compreensão de documentos. Eles podem ser usados para classificar, dividir, analisar ou analisar um documento.
Cada projeto Google Cloud precisa criar as próprias instâncias de processador.
Os processadores se enquadram em uma das seguintes categorias:
- Digitalizar: OCR.
- Extração: extrator personalizado, analisador de formulários, analisador de layout e analisadores pré-treinados.
- Classificar: classificador e separador personalizados.
Consulte a lista completa de processadores e detalhes para informações sobre todos os tipos de processadores disponíveis para a Document AI.
Qual processador devo usar?
Para decidir qual tipo de processador usar em um aplicativo específico, confira algumas diretrizes gerais:
Categoria | Caso de uso | Tipo de processador |
---|---|---|
Digitalizar | Extrair texto e informações de layout de documentos. | OCR de documentos corporativos |
Analise a qualidade da imagem digitalizada (legibilidade) de um documento. | Enterprise Document OCR com a análise de qualidade da imagem ativada | |
Extrair entidades de um documento personalizado que não atende aos critérios do processador personalizado. | ||
Extrair | Extraia tabelas ou pares de valores-chave de um formulário estruturado em um documento. | Analisador de formulários |
Extraia elementos como texto, tabelas e listas em um documento e retorne blocos com reconhecimento de contexto. | Analisador de layout | |
Extrair entidades de um documento personalizado que atenda aos critérios do processador personalizado. | Criar um extrator personalizado | |
Extrair entidades de um tipo de documento especializado. | Um processador pré-treinado (Aprimore o treinamento para melhorar a qualidade). | |
Classificar | Classificar documentos. | Criar um classificador personalizado |
Dividir documentos. | Criar um divisor personalizado |
Esse diagrama ajuda a determinar qual processador funciona melhor para cada caso de uso.
Usar processadores da Document AI
Estas são as principais etapas para usar a Document AI e começar a processar documentos:
Escolha um processador adequado ao seu caso de uso.
- Para informações completas sobre cada processador, consulte a Lista completa de processadores e detalhes.
Crie um processador usando o console Google Cloud ou a API Document AI.
A Document AI cria um endpoint de previsão em que você pode enviar seus documentos.
Para instruções detalhadas, consulte Como criar um processador.
Treine um processador com dados de treinamento e teste do zero ou aprimore o treinamento de uma nova versão (pré-treinada) de um processador com base em uma versão atual.
- Para instruções detalhadas, consulte Treinar processador.
Envie seus documentos para processamento.
A Document AI processa os documentos e retorna um ou mais objetos
Document
, que contêm as informações extraídas e estruturadas.Para instruções detalhadas, consulte Enviar uma solicitação de processamento e Processar a resposta.