Auf dieser Seite werden die ersten Schritte mit den Cloud-Clientbibliotheken für die Document AI Toolbox API beschrieben. Clientbibliotheken erleichtern den Zugriff aufGoogle Cloud APIs mit einer unterstützten Sprache. Sie könnenGoogle Cloud APIs zwar direkt verwenden, indem Sie Rohanfragen an den Server senden, aber Clientbibliotheken bieten Vereinfachungen, die den zu schreibenden Code erheblich reduzieren.
Weitere Informationen zu den Cloud-Clientbibliotheken und den älteren Google API-Clientbibliotheken finden Sie unter Erläuterung zu Clientbibliotheken.
Clientbibliothek installieren
Python
pip install --upgrade google-cloud-documentai-toolbox
Weitere Informationen finden Sie unter Python-Entwicklungsumgebung einrichten.
Authentifizierung einrichten
Zur Authentifizierung von Aufrufen an Google Cloud APIs unterstützen Clientbibliotheken Standardanmeldedaten für Anwendungen (Application Default Credentials, ADC). Die Bibliotheken suchen nach Anmeldedaten an einer Reihe von definierten Standorten und verwenden diese Anmeldedaten, um Anfragen an die API zu authentifizieren. Mit ADC können Sie Anmeldedaten für Ihre Anwendung in verschiedenen Umgebungen bereitstellen, z. B. in der lokalen Entwicklung oder Produktion, ohne den Anwendungscode ändern zu müssen.In Produktionsumgebungen hängt die Art der Einrichtung von ADC vom Dienst und Kontext ab. Weitere Informationen finden Sie unter Standardanmeldedaten für Anwendungen einrichten.
Für eine lokale Entwicklungsumgebung können Sie ADC mit den Anmeldedaten einrichten, die Ihrem Google-Konto zugeordnet sind:
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
Ein Anmeldebildschirm wird angezeigt. Nach der Anmeldung werden Ihre Anmeldedaten in der lokalen Anmeldedatendatei für ADC gespeichert.
Clientbibliothek verwenden
Die Document AI Toolbox ist ein SDK für Python, das Dienstfunktionen zum Verwalten, Manipulieren und Extrahieren von Informationen aus der Dokumentantwort bietet.
Es erstellt ein „verpacktes“ Dokumentobjekt aus einer verarbeiteten Antwort auf eine Dokumentanfrage aus JSON-Dateien in Cloud Storage, lokalen JSON-Dateien oder direkt aus der process_document()
-Methode.
Sie kann die folgenden Aktionen ausführen:
- Fragmentierte
Document
JSON-Dateien aus der Batchverarbeitung in einem einzigen „verpackten“ Dokument kombinieren. - Shards als einheitliche
Document
exportieren -
Document
-Ausgabe von folgenden Quellen abrufen: - Zugriff auf Text von
Pages
,Lines
,Paragraphs
,FormFields
undTables
, ohneLayout
-Informationen zu verarbeiten. - Nach einem
Pages
suchen, das einen Zielstring enthält oder mit einem regulären Ausdruck übereinstimmt. - Suchen Sie nach
FormFields
. - Suche nach
Entities
nach Typ. - Konvertieren Sie
Tables
in einen Pandas-DataFrame oder eine CSV-Datei. - Fügen Sie
Entities
undFormFields
in eine BigQuery-Tabelle ein. - Eine PDF-Datei anhand der Ausgabe eines Splitters/Klassifikators teilen
- Extrahieren Sie das Bild
Entities
aus den Begrenzungsrahmen vonDocument
. -
Documents
in und aus gängigen Formaten konvertieren:- Cloud Vision API
AnnotateFileResponse
- hOCR
- Formate für die Dokumentverarbeitung von Drittanbietern
- Cloud Vision API
- Sie können aus einem Cloud Storage-Ordner Stapel von Dokumenten zur Verarbeitung erstellen.
Codebeispiele
Die folgenden Codebeispiele zeigen, wie die Document AI Toolbox verwendet wird.
Kurzanleitung
Tabellen
BigQuery Export
PDF-Datei teilen
Bildextraktion
Vision-Conversion
hOCR-Konvertierung
Drittanbieter-Conversion
Dokument-Batches
Dokument-Shards zusammenführen
Zusätzliche Ressourcen
Python
Die folgende Liste enthält Links zu weiteren Ressourcen im Zusammenhang mit der Clientbibliothek für Python: