Verarbeitungsanfrage senden
Nachdem Sie Ihr Google Cloud -Konto eingerichtet und einen Prozessor erstellt haben, können Sie eine Anfrage an Ihren Document AI-Prozessor senden.
Der Code, mit dem die Anfrage gesendet wird, ist für alle Abwickler gleich. Sie sehen Unterschiede in der Funktionsweise der Prozessoren an den Informationen, die die einzelnen Prozessoren ausgeben.
Wenn Sie die v1
API-Version von Document AI oder die Google Cloud Console verwenden, können Sie Verarbeitungsanfragen an diese bestimmte Prozessorversion senden. Wenn Sie keine Prozessorversion angeben, wird die Standardversion verwendet.
Weitere Informationen finden Sie unter Prozessorversionen verwalten.
Onlineverarbeitung
Mit Onlineanfragen (synchron) können Sie ein einzelnes Dokument zur Verarbeitung senden.
Document AI verarbeitet die Anfrage sofort und gibt eine document
zurück.
Anfrage an einen Auftragsverarbeiter senden
In den folgenden Codebeispielen wird gezeigt, wie Sie eine Anfrage an einen Prozessor senden.
REST
In diesem Beispiel wird gezeigt, wie Sie Dokumentinhalte (rohe Dokumentinhalte in Bytes über einen base64-codierten String) im Objekt rawDocument
angeben.
Alternativ können Sie auch inlineDocument
angeben. Das ist dasselbe JSON-Format Document
, das von Document AI zurückgegeben wird. So können Sie Anfragen verketten, indem Sie dasselbe Format hin und her übergeben, z. B. wenn Sie ein Dokument klassifizieren und dann seinen Inhalt extrahieren.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- LOCATION: Standort des Prozessors, z. B.:
us
– USAeu
– Europäische Union
- PROJECT_ID: Ihre Google Cloud Projekt-ID.
- PROCESSOR_ID: Die ID des benutzerdefinierten Prozessors.
- skipHumanReview: Boolescher Wert, um die manuelle Überprüfung zu deaktivieren. Wird nur von Human-in-the-Loop-Prozessoren unterstützt.
true
– manuelle Überprüfung wird übersprungenfalse
– Aktiviert die manuelle Überprüfung (Standard)
- MIME_TYPE†: Eine der gültigen Optionen für den MIME-Typ.
- IMAGE_CONTENT†: Einer der gültigen Inline-Dokumentinhalte, dargestellt als Bytestream. Bei JSON-Darstellungen die Base64-Codierung (ASCII-String) Ihrer Binärbilddaten. Dieser String sollte in etwa so aussehen:
/9j/4QAYRXhpZgAA...9tAVx/zDQDlGxn//2Q==
- FIELD_MASK: Gibt an, welche Felder in die
Document
-Ausgabe eingeschlossen werden sollen. Dies ist eine durch Kommas getrennte Liste vollständig qualifizierter Feldnamen imFieldMask
-Format.- Beispiel:
text,entities,pages.pageNumber
- Beispiel:
- INDIVIDUAL_PAGES: Eine Liste der einzelnen Seiten, die verarbeitet werden sollen.
† Dieser Inhalt kann auch im inlineDocument
-Objekt als Base64-codierter Inhalt angegeben werden.
HTTP-Methode und URL:
POST https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID:process
JSON-Text der Anfrage:
{ "skipHumanReview": skipHumanReview, "rawDocument": { "mimeType": "MIME_TYPE", "content": "IMAGE_CONTENT" }, "fieldMask": "FIELD_MASK", "processOptions": { "individualPageSelector" { "pages": [INDIVIDUAL_PAGES] } } }
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID:process"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID:process" | Select-Object -Expand Content
Wenn die Anfrage erfolgreich ist, gibt der Server den HTTP-Statuscode 200 OK
und die Antwort im JSON-Format zurück. Der Antworttext enthält eine Instanz von Document
.
Anfrage an eine Prozessorversion senden
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- LOCATION: Standort des Prozessors, z. B.:
us
– USAeu
– Europäische Union
- PROJECT_ID: Ihre Google Cloud Projekt-ID.
- PROCESSOR_ID: Die ID des benutzerdefinierten Prozessors.
- PROCESSOR_VERSION: die Prozessorversion. Weitere Informationen finden Sie unter Prozessorversion auswählen. Beispiel:
pretrained-TYPE-vX.X-YYYY-MM-DD
stable
rc
- skipHumanReview: Boolescher Wert, um die manuelle Überprüfung zu deaktivieren. Wird nur von Human-in-the-Loop-Prozessoren unterstützt.
true
– manuelle Überprüfung wird übersprungenfalse
– Aktiviert die manuelle Überprüfung (Standard)
- MIME_TYPE†: Eine der gültigen Optionen für den MIME-Typ.
- IMAGE_CONTENT†: Einer der gültigen Inline-Dokumentinhalte, dargestellt als Bytestream. Bei JSON-Darstellungen die Base64-Codierung (ASCII-String) Ihrer Binärbilddaten. Dieser String sollte in etwa so aussehen:
/9j/4QAYRXhpZgAA...9tAVx/zDQDlGxn//2Q==
- FIELD_MASK: Gibt an, welche Felder in die
Document
-Ausgabe eingeschlossen werden sollen. Dies ist eine durch Kommas getrennte Liste vollständig qualifizierter Feldnamen imFieldMask
-Format.- Beispiel:
text,entities,pages.pageNumber
- Beispiel:
† Dieser Inhalt kann auch im inlineDocument
-Objekt als Base64-codierter Inhalt angegeben werden.
HTTP-Methode und URL:
POST https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:process
JSON-Text der Anfrage:
{ "skipHumanReview": skipHumanReview, "rawDocument": { "mimeType": "MIME_TYPE", "content": "IMAGE_CONTENT" }, "fieldMask": "FIELD_MASK" }
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:process"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:process" | Select-Object -Expand Content
Wenn die Anfrage erfolgreich ist, gibt der Server den HTTP-Statuscode 200 OK
und die Antwort im JSON-Format zurück. Der Antworttext enthält eine Instanz von Document
.
C#
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI C# API.
Richten Sie zur Authentifizierung bei Document AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Java
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Java API.
Richten Sie zur Authentifizierung bei Document AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Node.js API.
Richten Sie zur Authentifizierung bei Document AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Python API.
Richten Sie zur Authentifizierung bei Document AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Batchverarbeitung
Mit Batchanfragen (asynchron) können Sie mehrere Dokumente in einer einzigen Anfrage senden. Document AI antwortet mit einem operation
, mit dem Sie den Status der Anfrage abfragen können. Nach Abschluss dieses Vorgangs enthält er einen BatchProcessMetadata
, der auf den Cloud Storage-Bucket verweist, in dem die verarbeiteten Ergebnisse gespeichert werden.
Wenn sich die Eingabedateien, auf die Sie zugreifen möchten, in einem Bucket in einem anderen Projekt befinden, müssen Sie Zugriff auf diesen Bucket gewähren, bevor Sie auf die Dateien zugreifen können. Weitere Informationen finden Sie unter Dateizugriff einrichten.
Anfrage an einen Auftragsverarbeiter senden
In den folgenden Codebeispielen wird gezeigt, wie Sie eine Batchverarbeitungsanfrage an einen Prozessor senden.
REST
In diesem Beispiel wird gezeigt, wie Sie eine POST
-Anfrage an die Methode
batchProcess
für die asynchrone Verarbeitung großer Dokumente senden.
Im Beispiel wird das Zugriffstoken für ein Dienstkonto verwendet, das mit der Google Cloud CLI für das Projekt eingerichtet wurde. Eine Anleitung zum Installieren der Google Cloud CLI, zum Einrichten eines Projekts mit einem Dienstkonto und zum Abrufen eines Zugriffstokens finden Sie unter Vorbereitung.
Eine batchProcess
-Anfrage startet einen lang andauernden Vorgang und speichert die Ergebnisse in einem Cloud Storage-Bucket. In diesem Beispiel wird auch gezeigt, wie der Status dieses lang andauernden Vorgangs nach dem Start abgerufen wird.
Prozessanfrage senden
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- LOCATION: Standort des Prozessors, z. B.:
us
– USAeu
– Europäische Union
- PROJECT_ID: Ihre Google Cloud Projekt-ID.
- PROCESSOR_ID: Die ID des benutzerdefinierten Prozessors.
- INPUT_BUCKET_FOLDER†: Ein Cloud Storage-Bucket/-Verzeichnis, aus dem Eingabedateien gelesen werden. Dies wird in folgender Form angegeben:
gs://bucket/directory/
- MIME_TYPE: Einer der gültigen MIME-Typ-Optionen.
- OUTPUT_BUCKET_FOLDER: ein Google Cloud Storage-Bucket/-Verzeichnis, in dem Ausgabedateien gespeichert werden. Dies wird in folgender Form angegeben:
gs://bucket/directory/
- skipHumanReview: Boolescher Wert, um die manuelle Überprüfung zu deaktivieren. Wird nur von Human-in-the-Loop-Prozessoren unterstützt.
true
– manuelle Überprüfung wird übersprungenfalse
– Aktiviert die manuelle Überprüfung (Standard)
- FIELD_MASK: Gibt an, welche Felder in die
Document
-Ausgabe eingeschlossen werden sollen. Dies ist eine durch Kommas getrennte Liste vollständig qualifizierter Feldnamen imFieldMask
-Format.- Beispiel:
text,entities,pages.pageNumber
- Beispiel:
† Anstatt alle Dateien in einem GCS-Ordner mit gcsPrefix
anzugeben, können Sie auch documents
verwenden, um jede Datei einzeln aufzulisten:
"inputDocuments": { "gcsDocuments": { "documents": [ { "gcsUri": "gs://BUCKET/PATH/TO/DOCUMENT1.ext", "mimeType": "MIME_TYPE" }, { "gcsUri": "gs://BUCKET/PATH/TO/DOCUMENT2.ext", "mimeType": "MIME_TYPE" } ] } }
HTTP-Methode und URL:
POST https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID:batchProcess
JSON-Text der Anfrage:
{ "inputDocuments": { "gcsPrefix": { "gcsUriPrefix": "INPUT_BUCKET_FOLDER" } }, "documentOutputConfig": { "gcsOutputConfig": { "gcsUri": "OUTPUT_BUCKET_FOLDER", "fieldMask": "FIELD_MASK" } }, "skipHumanReview": BOOLEAN }
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID:batchProcess"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID:batchProcess" | Select-Object -Expand Content
Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:
{ "name": "projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID" }
Anfrage an eine Prozessorversion senden
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- LOCATION: Standort des Prozessors, z. B.:
us
– USAeu
– Europäische Union
- PROJECT_ID: Ihre Google Cloud Projekt-ID.
- PROCESSOR_ID: Die ID des benutzerdefinierten Prozessors.
- PROCESSOR_VERSION: die Prozessorversion. Weitere Informationen finden Sie unter Prozessorversion auswählen. Beispiel:
pretrained-TYPE-vX.X-YYYY-MM-DD
stable
rc
- INPUT_BUCKET_FOLDER†: Ein Cloud Storage-Bucket/-Verzeichnis, aus dem Eingabedateien gelesen werden. Dies wird in folgender Form angegeben:
gs://bucket/directory/
- MIME_TYPE: Einer der gültigen MIME-Typ-Optionen.
- OUTPUT_BUCKET_FOLDER: ein Google Cloud Storage-Bucket/-Verzeichnis, in dem Ausgabedateien gespeichert werden. Dies wird in folgender Form angegeben:
gs://bucket/directory/
- skipHumanReview: Boolescher Wert, um die manuelle Überprüfung zu deaktivieren. Wird nur von Human-in-the-Loop-Prozessoren unterstützt.
true
– manuelle Überprüfung wird übersprungenfalse
– Aktiviert die manuelle Überprüfung (Standard)
- FIELD_MASK: Gibt an, welche Felder in die
Document
-Ausgabe eingeschlossen werden sollen. Dies ist eine durch Kommas getrennte Liste vollständig qualifizierter Feldnamen imFieldMask
-Format.- Beispiel:
text,entities,pages.pageNumber
- Beispiel:
† Anstatt alle Dateien in einem GCS-Ordner mit gcsPrefix
anzugeben, können Sie auch documents
verwenden, um jede Datei einzeln aufzulisten:
"inputDocuments": { "gcsDocuments": { "documents": [ { "gcsUri": "gs://BUCKET/PATH/TO/DOCUMENT1.ext", "mimeType": "MIME_TYPE" }, { "gcsUri": "gs://BUCKET/PATH/TO/DOCUMENT2.ext", "mimeType": "MIME_TYPE" } ] } }
HTTP-Methode und URL:
POST https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:batchProcess
JSON-Text der Anfrage:
{ "inputDocuments": { "gcsPrefix": { "gcsUriPrefix": "INPUT_BUCKET_FOLDER" } }, "documentOutputConfig": { "gcsOutputConfig": { "gcsUri": "OUTPUT_BUCKET_FOLDER", "fieldMask": "FIELD_MASK" } }, "skipHumanReview": BOOLEAN }
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:batchProcess"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION:batchProcess" | Select-Object -Expand Content
Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:
{ "name": "projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID" }
Wenn die Anfrage erfolgreich ist, gibt die Document AI API den Namen für Ihren Vorgang zurück.
Ergebnisse abrufen
Damit Sie die Ergebnisse Ihrer Anfrage erhalten, müssen Sie eine GET
-Anfrage an die Ressource operations
senden. Im Folgenden wird gezeigt, wie eine solche Anfrage gesendet wird.
Weitere Informationen finden Sie in der Dokumentation zu Vorgängen mit langer Laufzeit.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- PROJECT_ID: Ihre Google Cloud Projekt-ID.
- LOCATION: der Speicherort, an dem der LRO ausgeführt wird, z. B.:
us
– USAeu
– Europäische Union
- OPERATION_ID: Die ID des Vorgangs. Die ID ist das letzte Element des Vorgangsnamens. Beispiel:
- Name des Vorgangs:
projects/PROJECT_ID/locations/LOCATION/operations/bc4e1d412863e626
- Vorgangs-ID:
bc4e1d412863e626
- Name des Vorgangs:
HTTP-Methode und URL:
GET https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID
Senden Sie die Anfrage mithilfe einer der folgenden Optionen:
curl
Führen Sie folgenden Befehl aus:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID"
PowerShell
Führen Sie folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-documentai.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID" | Select-Object -Expand Content
Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:
{ "name": "projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.documentai.v1.BatchProcessMetadata", "state": "SUCCEEDED", "stateMessage": "Processed 1 document(s) successfully", "createTime": "TIMESTAMP", "updateTime": "TIMESTAMP", "individualProcessStatuses": [ { "inputGcsSource": "INPUT_BUCKET_FOLDER/DOCUMENT1.ext", "status": {}, "outputGcsDestination": "OUTPUT_BUCKET_FOLDER/OPERATION_ID/0", "humanReviewStatus": { "state": "ERROR", "stateMessage": "Sharded document protos are not supported for human review." } } ] }, "done": true, "response": { "@type": "type.googleapis.com/google.cloud.documentai.v1.BatchProcessResponse" } }
Der Antworttext enthält eine Instanz von Operation
mit Informationen zum Status des Vorgangs.
Wenn der Vorgang erfolgreich abgeschlossen wurde, wird das Feld metadata
mit einer Instanz von BatchProcessMetadata
ausgefüllt, die Informationen zu den verarbeiteten Dokumenten enthält.
C#
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI C# API.
Richten Sie zur Authentifizierung bei Document AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Go
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Go API.
Richten Sie zur Authentifizierung bei Document AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Java
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Java API.
Richten Sie zur Authentifizierung bei Document AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Node.js API.
Richten Sie zur Authentifizierung bei Document AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Python API.
Richten Sie zur Authentifizierung bei Document AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Go
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Go API.
Richten Sie zur Authentifizierung bei Document AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Ruby
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Ruby API.
Richten Sie zur Authentifizierung bei Document AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Dokumentbatches mit dem Python SDK erstellen
Bei der Batchverarbeitung sind maximal 1.000 Dateien pro Anfrage zulässig. Wenn Sie mehr Dokumente verarbeiten möchten, müssen Sie sie zur Verarbeitung in mehrere Batches aufteilen.
Die Document AI Toolbox ist ein SDK für Python, das Dienstprogrammfunktionen für Document AI bietet. Eine der Funktionen besteht darin, aus einem Cloud Storage-Ordner Stapel von Dokumenten zur Verarbeitung zu erstellen.
Weitere Informationen dazu, wie die Document AI Toolbox bei der Nachbearbeitung unterstützt, finden Sie unter Verarbeitungsantworten verarbeiten.
Codebeispiele
Die folgenden Codebeispiele zeigen, wie die Document AI Toolbox verwendet wird.