Panoramica di Document AI
Questo documento è una guida ai concetti fondamentali dell'utilizzo di Document AI. Ti consigliamo di leggere questa pagina prima di procedere con altre guide o documentazione.
Automatizzare i flussi di lavoro di elaborazione dei documenti
Le attività in tutto il mondo si basano molto sui documenti per archiviare e trasmettere informazioni. Spesso queste informazioni devono essere digitalizzate per essere utili. Tuttavia, solitamente questo viene fatto tramite procedure manuali che richiedono molto tempo.
Ad esempio:
- Digitalizzazione di libri per e-reader.
- Elaborazione di moduli di accettazione medica negli studi medici.
- Analisi di ricevute e fatture per la convalida dei report di spesa.
- Autenticazione dell'identità in base alle carte di identità.
- Estrazione delle informazioni sul reddito dai moduli fiscali per l'approvazione dei prestiti.
- Informazioni sui contratti per i termini chiave del contratto commerciale.
Ciascuno di questi flussi di lavoro prevede l'estrazione del testo non elaborato dai documenti, quindi del testo specifico che corrisponde ai dati necessari (i campi o le entità). Tuttavia, ogni tipo di documento ha una struttura e un layout diversi e la sequenza dei campi varia a seconda del caso d'uso specifico.
Componenti di Document AI
Document AI è una piattaforma di elaborazione e comprensione dei documenti che acquisisce i dati non strutturati dai documenti e li trasforma in dati strutturati (campi specifici, adatti a un database), semplificandone la comprensione, l'analisi e l'utilizzo.
Document AI è basato sui prodotti di Vertex AI con IA generativa per aiutarti a creare applicazioni di elaborazione di documenti scalabili, end-to-end e basate su cloud senza competenze di machine learning specializzate.
Con Document AI puoi:
- Digitalizza i documenti utilizzando l'OCR per ottenere testo, layout e vari componenti aggiuntivi come il rilevamento della qualità delle immagini (per la leggibilità) e la correzione della distorsione (completamente automatica).
- Estrai informazioni su testo e layout dai file di documenti e normalizza le entità.
- Identifica le coppie chiave-valore (kvp) in moduli strutturati e tabelle regolari. Ad esempio:
Name: Jill Smith
è un kVp. - Classifica i tipi di documenti per gestire i processi downstream, come l'estrazione e l'archiviazione.
- Suddividi e classifica i documenti in base al tipo. Ad esempio, un file PDF con più documenti reali).
- Prepara i set di dati da utilizzare per la messa a punto e le valutazioni dei modelli utilizzando l'etichettatura automatica, la gestione dello schema e le funzionalità di gestione dei set di dati come la revisione di documenti e previsioni.
- Integralo con prodotti come Cloud Storage, BigQuery e Vertex AI Search per archiviare, cercare, organizzare, gestire e analizzare documenti e metadati.
Questo diagramma illustra tutti i passaggi chiave di elaborazione dei documenti supportati da Document AI e come possono essere collegati tra loro.
Processore
Un elaboratore Document AI si trova tra il file del documento e un modello di machine learning che esegue azioni di elaborazione e comprensione dei documenti. Possono essere utilizzati per classificare, suddividere, analizzare o analizzare un documento.
Ogni progetto Google Cloud deve creare le proprie istanze di processori.
I processori rientrano in una delle seguenti categorie:
- Digitalizza: OCR.
- Estrazione: estrattore personalizzato, analisi dei moduli, analisi del layout e analizzatori preaddestrati.
- Classifica: classificatore personalizzato e strumento per la divisione personalizzato.
Consulta l'elenco completo dei processori e dei dettagli per informazioni su tutti i tipi di processori disponibili per Document AI.
Quale processore devo utilizzare?
Per decidere quale tipo di processore utilizzare per un'applicazione specifica, ecco alcune linee guida generali:
Category | Caso d'uso | Tipo di processore |
---|---|---|
Digitalizzare | Estrae informazioni di testo e layout dai documenti. | Enterprise Document OCR |
Analizza la qualità dell'immagine (leggibilità) di un documento scansionato. | Enterprise Document OCR con analisi della qualità delle immagini abilitata | |
Estrai entità da un documento personalizzato che non soddisfa i criteri del processore personalizzato. | ||
Estrazione | Estrai tabelle o kvp da un modulo strutturato in un documento. | Analizzatore sintattico di moduli |
Estrae elementi come testo, tabelle ed elenchi in un documento e restituisce blocchi sensibili al contesto. | Parser del layout | |
Estrai le entità da un documento personalizzato che soddisfa i criteri del processore personalizzato. | Creare un estrattore personalizzato | |
Estrae entità da un tipo di documento specializzato. | Un processore preaddestrato (addestramento avanzato per migliorare la qualità). | |
Classificazione | Classificare i documenti. | Creare un classificatore personalizzato |
Suddividere i documenti. | Creare un separatore personalizzato |
Questo diagramma aiuta a determinare quale processore è il migliore per ogni caso d'uso.
Utilizzare i processori Document AI
Di seguito sono riportati i passaggi principali per utilizzare Document AI per iniziare a elaborare i documenti:
Scegli un processore adatto al tuo caso d'uso.
- Per informazioni complete su ciascun elaboratore, consulta l'elenco completo di processori e dettagli.
Crea un elaboratore utilizzando la console Google Cloud o l'API Document AI.
Document AI crea un endpoint di previsione a cui puoi inviare i tuoi documenti.
Per istruzioni dettagliate, consulta Creare un processore.
Addestra un processore con dati di addestramento e test da zero oppure esegui l'uptraining di una nuova versione del processore (preaddestrata) su una esistente.
- Per istruzioni dettagliate, consulta Addestrare il processore.
Invia i documenti per l'elaborazione.
Document AI elabora i documenti e restituisce uno o più oggetti
Document
contenenti le informazioni strutturate estratte.Per istruzioni dettagliate, consulta Invio di una richiesta di elaborazione e Gestire la risposta di elaborazione.