Visão geral da Document AI
Este documento é um guia dos conceitos fundamentais do uso da Document AI. Leia esta página antes de prosseguir para qualquer outra documentação ou guia de início rápido.
Automatizar fluxos de trabalho de processamento de documentos
Empresas em todo o mundo dependem muito de documentos para armazenar e transmitir informações. Muitas vezes, essas informações precisam ser digitalizadas para serem úteis. No entanto, isso geralmente é feito por processos manuais que consomem muito tempo.
Exemplo:
- Digitalizar livros para e-readers.
- Processamento de formulários de admissão médica em consultórios médicos.
- Analisar recibos e faturas para validar o relatório de despesas.
- Autenticação de identidade com base em documentos de ID.
- Extrair informações de renda de formulários fiscais para aprovar empréstimos.
- Entender os contratos para os principais termos de contrato de negócios.
Cada um desses fluxos de trabalho envolve a extração do texto bruto dos documentos e, em seguida, extrai o texto específico que corresponde aos dados necessários (os campos ou entidades). No entanto, cada tipo de documento tem uma estrutura e um layout diferentes, e o padrão de campos varia de acordo com o caso de uso específico.
Componentes da Document AI
A Document AI é uma plataforma de processamento e compreensão de documentos que transforma dados não estruturados de documentos em dados estruturados (campos específicos, adequados para um banco de dados), facilitando a compreensão, a análise e o consumo.
A Document AI foi criada com base em produtos da Vertex AI com IA generativa para ajudar você a criar aplicativos de processamento de documentos escalonáveis, completos e baseados na nuvem sem experiência especializada em machine learning.
Com a Document AI, você pode:
- Digitalize documentos usando o OCR para receber texto, layout e vários complementos, como detecção de qualidade de imagem (para legibilidade) e correção de distorção (totalmente automática).
- Extraia informações de texto e layout de arquivos de documentos e normalize entidades.
- Identifique pares de chave-valor (kvp) em formulários estruturados e tabelas comuns. Por exemplo:
Name: Jill Smith
é um kvp. - Classifique os tipos de documentos para impulsionar processos downstream, como extração e armazenamento.
- Divida e classifique os documentos por tipo. Por exemplo, um arquivo PDF com vários documentos reais).
- Prepare conjuntos de dados para uso em ajustes finos e avaliações de modelos usando recursos de rotulação automática, gerenciamento de esquemas e gerenciamento de conjuntos de dados, como revisão de documentos e previsões.
- Integre-o a produtos, como o Cloud Storage, o BigQuery e a Pesquisa da Vertex AI, para armazenar, pesquisar, organizar, gerenciar e analisar documentos e metadados.
Este diagrama ilustra todas as principais etapas de processamento de documentos que são compatíveis com a Document AI e como elas podem se conectar.
Processador
Um processador da Document AI fica entre o arquivo do documento e um modelo de aprendizado de máquina que executa ações de processamento e compreensão de documentos. Eles podem ser usados para classificar, dividir, analisar ou analisar um documento.
Cada projeto do Google Cloud precisa criar as próprias instâncias de processador.
Os processadores se encaixam em uma das seguintes categorias:
- Digitalizar: OCR.
- Extrair: extrator personalizado, analisador de formulários, analisador de layout e analisadores pré-treinados.
- Classificar: classificador e divisor personalizados.
Consulte a lista completa de processadores e detalhes para saber mais sobre todos os tipos de processadores disponíveis para a Document AI.
Qual processador devo usar?
Para decidir que tipo de processador usar em um aplicativo específico, confira estas diretrizes gerais:
Categoria | Caso de uso | Tipo de processador |
---|---|---|
Digitalizar | Extraia informações de texto e layout de documentos. | OCR de documentos corporativos |
Analisar a qualidade da imagem digitalizada (legibilidade) de um documento. | OCR de documentos corporativos com análise de qualidade de imagem ativada | |
Extraia entidades de um documento personalizado que não atenda aos critérios do processador personalizado. | ||
Extrair | Extrair tabelas ou kvp de um formulário estruturado em um documento. | Analisador de formulários |
Extraia elementos como texto, tabelas e listas em um documento e retorne blocos com reconhecimento de contexto. | Analisador de layout | |
Extraia entidades de um documento personalizado que atenda aos critérios do processador personalizado. | Criar um extrator personalizado | |
Extrair entidades de um tipo de documento especializado. | Um processador pré-treinado (aprimore o treinamento para melhorar a qualidade). | |
Classificar | Classificar documentos. | Criar um classificador personalizado |
Dividir documentos. | Criar um divisor personalizado |
Este diagrama ajuda a determinar qual processador funciona melhor para cada caso de uso.
Usar processadores da Document AI
Estas são as principais etapas para usar a Document AI para começar a processar documentos:
Escolha um processador adequado para seu caso de uso.
- Para informações completas sobre cada processador, consulte a lista completa de processadores e detalhes.
Crie um processador usando o console do Google Cloud ou a API Document AI.
A Document AI cria um endpoint de previsão para você enviar seus documentos.
Para instruções detalhadas, consulte Como criar um processador.
Treine um processador com dados de treinamento e teste do zero ou aprimore o treinamento de uma nova versão (pré-treinada) do processador em cima de uma versão atual.
- Para instruções detalhadas, consulte Treinar processador.
Envie seus documentos para processamento.
A Document AI processa os documentos e retorna um ou mais objetos
Document
, que contêm as informações extraídas e estruturadas.Para instruções detalhadas, consulte Enviar uma solicitação de processamento e Processar a resposta.