Panoramica di Document AI

Questo documento è una guida ai concetti fondamentali dell'utilizzo di Document AI. Ti consigliamo di leggere questa pagina prima di procedere con altre guide o documentazione.

Automatizzare i flussi di lavoro di elaborazione dei documenti

Le attività in tutto il mondo si basano molto sui documenti per archiviare e trasmettere informazioni. Spesso queste informazioni devono essere digitalizzate per essere utili. Tuttavia, solitamente questo viene fatto tramite procedure manuali che richiedono molto tempo.

Ad esempio:

  • Digitalizzazione di libri per e-reader.
  • Elaborazione di moduli di accettazione medica negli studi medici.
  • Analisi di ricevute e fatture per la convalida dei report di spesa.
  • Autenticazione dell'identità in base alle carte di identità.
  • Estrazione delle informazioni sul reddito dai moduli fiscali per l'approvazione dei prestiti.
  • Informazioni sui contratti per i termini chiave del contratto commerciale.

Ciascuno di questi flussi di lavoro prevede l'estrazione del testo non elaborato dai documenti, quindi del testo specifico che corrisponde ai dati necessari (i campi o le entità). Tuttavia, ogni tipo di documento ha una struttura e un layout diversi e la sequenza dei campi varia a seconda del caso d'uso specifico.

Componenti di Document AI

Document AI è una piattaforma di elaborazione e comprensione dei documenti che acquisisce i dati non strutturati dai documenti e li trasforma in dati strutturati (campi specifici, adatti a un database), semplificandone la comprensione, l'analisi e l'utilizzo.

Document AI è basato sui prodotti di Vertex AI con IA generativa per aiutarti a creare applicazioni di elaborazione di documenti scalabili, end-to-end e basate su cloud senza competenze di machine learning specializzate.

Con Document AI puoi:

  • Digitalizza i documenti utilizzando l'OCR per ottenere testo, layout e vari componenti aggiuntivi come il rilevamento della qualità delle immagini (per la leggibilità) e la correzione della distorsione (completamente automatica).
  • Estrai informazioni su testo e layout dai file di documenti e normalizza le entità.
  • Identifica le coppie chiave-valore (kvp) in moduli strutturati e tabelle regolari. Ad esempio: Name: Jill Smith è un kVp.
  • Classifica i tipi di documenti per gestire i processi downstream, come l'estrazione e l'archiviazione.
  • Suddividi e classifica i documenti in base al tipo. Ad esempio, un file PDF con più documenti reali).
  • Prepara i set di dati da utilizzare per la messa a punto e le valutazioni dei modelli utilizzando l'etichettatura automatica, la gestione dello schema e le funzionalità di gestione dei set di dati come la revisione di documenti e previsioni.
  • Integralo con prodotti come Cloud Storage, BigQuery e Vertex AI Search per archiviare, cercare, organizzare, gestire e analizzare documenti e metadati.

Questo diagramma illustra tutti i passaggi chiave di elaborazione dei documenti supportati da Document AI e come possono essere collegati tra loro.

docai-overview-1

Processore

Un elaboratore Document AI si trova tra il file del documento e un modello di machine learning che esegue azioni di elaborazione e comprensione dei documenti. Possono essere utilizzati per classificare, suddividere, analizzare o analizzare un documento.

Ogni progetto Google Cloud deve creare le proprie istanze di processori.

I processori rientrano in una delle seguenti categorie:

  • Digitalizza: OCR.
  • Estrazione: estrattore personalizzato, analisi dei moduli, analisi del layout e analizzatori preaddestrati.
  • Classifica: classificatore personalizzato e strumento per la divisione personalizzato.

Consulta l'elenco completo dei processori e dei dettagli per informazioni su tutti i tipi di processori disponibili per Document AI.

Quale processore devo utilizzare?

Per decidere quale tipo di processore utilizzare per un'applicazione specifica, ecco alcune linee guida generali:

Category Caso d'uso Tipo di processore
Digitalizzare Estrae informazioni di testo e layout dai documenti. Enterprise Document OCR
Analizza la qualità dell'immagine (leggibilità) di un documento scansionato. Enterprise Document OCR con analisi della qualità delle immagini abilitata
Estrai entità da un documento personalizzato che non soddisfa i criteri del processore personalizzato.
Estrazione Estrai tabelle o kvp da un modulo strutturato in un documento. Analizzatore sintattico di moduli
Estrae elementi come testo, tabelle ed elenchi in un documento e restituisce blocchi sensibili al contesto. Parser del layout
Estrai le entità da un documento personalizzato che soddisfa i criteri del processore personalizzato. Creare un estrattore personalizzato
Estrae entità da un tipo di documento specializzato. Un processore preaddestrato (addestramento avanzato per migliorare la qualità).
Classificazione Classificare i documenti. Creare un classificatore personalizzato
Suddividere i documenti. Creare un separatore personalizzato

Questo diagramma aiuta a determinare quale processore è il migliore per ogni caso d'uso.

docai-overview-2

Utilizzare i processori Document AI

Di seguito sono riportati i passaggi principali per utilizzare Document AI per iniziare a elaborare i documenti:

  1. Scegli un processore adatto al tuo caso d'uso.

  2. Crea un elaboratore utilizzando la console Google Cloud o l'API Document AI.

    • Document AI crea un endpoint di previsione a cui puoi inviare i tuoi documenti.

    • Per istruzioni dettagliate, consulta Creare un processore.

  3. Addestra un processore con dati di addestramento e test da zero oppure esegui l'uptraining di una nuova versione del processore (preaddestrata) su una esistente.

  4. Invia i documenti per l'elaborazione.