Questa pagina mostra come iniziare a utilizzare le librerie client di Cloud per l'API Document AI Toolbox. Le librerie client semplificano l'accesso alleGoogle Cloud API da un linguaggio supportato. Sebbene sia possibile utilizzare Google Cloud API direttamente inviando richieste non elaborate al server, le librerie client offrono semplificazioni che riducono notevolmente la quantità di codice da scrivere.
Scopri di più sulle librerie client di Cloud e sulle librerie client delle API di Google precedenti in Descrizione delle librerie client.
installa la libreria client
Python
pip install --upgrade google-cloud-documentai-toolbox
Per ulteriori informazioni, consulta Configurare un ambiente di sviluppo Python.
Configura l'autenticazione
Per autenticare le chiamate alle Google Cloud API, le librerie client supportano le credenziali predefinite dell'applicazione (ADC). Le librerie cercano le credenziali in un insieme di posizioni definite e le utilizzano per autenticare le richieste all'API. Con ADC, puoi mettere a disposizione della tua applicazione le credenziali in una serie di ambienti, come lo sviluppo locale o la produzione, senza dover modificare il codice dell'applicazione.Per gli ambienti di produzione, il modo in cui configuri l'ADC dipende dal servizio e dal contesto. Per ulteriori informazioni, vedi Configurare le credenziali predefinite dell'applicazione.
Per un ambiente di sviluppo locale, puoi configurare l'ADC con le credenziali associate al tuo Account Google:
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
Viene visualizzata una schermata di accesso. Dopo l'accesso, le credenziali vengono memorizzate nel file delle credenziali locali utilizzato da ADC.
Utilizzare la libreria client
Document AI Toolbox è un SDK per Python che fornisce funzioni di utilità per gestire, manipolare ed estrarre informazioni dalla risposta del documento.
Crea un oggetto documento "con wrapping" da una risposta del documento elaborata da file JSON in Cloud Storage, file JSON locali o output direttamente dal metodo process_document()
.
Può eseguire le seguenti azioni:
- Combina i file JSON
Document
frammentati dell'elaborazione collettiva in un unico documento "con wrapping". - Esportare i frammenti come
Document
unificato. -
Ottieni l'output
Document
da: - Accedi al testo di
Pages
,Lines
,Paragraphs
,FormFields
eTables
senza gestire le informazioniLayout
. - Cerca un
Pages
contenente una stringa target o che corrisponde a un'espressione regolare. - Cerca
FormFields
per nome. - Cerca
Entities
per tipo. - Converti
Tables
in un DataFrame Pandas o in un file CSV. - Inserisci
Entities
eFormFields
in una tabella BigQuery. - Dividi un file PDF in base all'output di un'elaborazione di un separatore/classificatore.
- Estrai l'immagine
Entities
dai riquadri di delimitazioneDocument
. -
Converti
Documents
in e da formati di uso comune:- API Cloud Vision
AnnotateFileResponse
- hOCR
- Formati di elaborazione di documenti di terze parti
- API Cloud Vision
- Crea batch di documenti da elaborare da una cartella Cloud Storage.
Esempi di codice
I seguenti esempi di codice mostrano come utilizzare Document AI Toolbox.
Guida rapida
Tabelle
Esportazione in BigQuery
Suddivisione PDF
Estrazione di immagini
Conversione visiva
Conversione in hOCR
Conversione di terze parti
Batch di documenti
Unisci frammenti di documento
Risorse aggiuntive
Python
Il seguente elenco contiene link ad altre risorse correlate alla libreria client per Python: