Base64-Codierung

Wenn Sie Dokumentdateien an die Document AI API senden, können Sie die Daten nur mit Onlineverarbeitung direkt im Feld RawDocument.content senden, wenn Ihre Datei 20 MB oder weniger groß ist. Die Eingabedatei ist im Binärformat, das vor dem Senden an Document AI codiert werden muss.

Wenn Ihre Eingabedatei die Limits für die Onlineverarbeitung überschreitet, muss sie in einem Cloud Storage-Bucket gespeichert werden, damit sie zur Verarbeitung gesendet werden kann. Eine Codierung ist dafür nicht erforderlich. Weitere Informationen finden Sie in der Dokumentation zur Batchverarbeitung.

Befehlszeile verwenden

Innerhalb einer gRPC-Anfrage können Sie die Binärdaten einfach direkt ausschreiben. Bei einer REST-Anfrage müssen Sie jedoch JSON verwenden. JSON ist ein Textformat, das Binärdaten nicht direkt unterstützt, weshalb diese mit der base64-Codierung in Text umgewandelt werden müssen.

Die meisten Entwicklungsumgebungen enthalten ein natives base64-Dienstprogramm, um ein Binärbild als ASCII-Textdaten zu codieren. So codieren Sie eine Datei:

Linux

Codieren Sie die Datei mithilfe des base64-Befehlszeilentools und achten Sie darauf, Zeilenumbrüche mithilfe des Flags -w 0 zu verhindern:

base64 INPUT_FILE -w 0 > OUTPUT_FILE

macOS

Codieren Sie die Datei mit dem base64-Befehlszeilentool:

base64 -i INPUT_FILE -o OUTPUT_FILE

Windows

Codieren Sie die Datei mit dem Tool Base64.exe:

Base64.exe -e INPUT_FILE > OUTPUT_FILE

PowerShell

Codieren Sie die Datei mit der Methode Convert.ToBase64String:

[Convert]::ToBase64String([IO.File]::ReadAllBytes("./INPUT_FILE")) > OUTPUT_FILE

Erstellen Sie eine JSON-Anfragedatei, die die base64-codierten Daten enthält:

JSON

{
  "skipHumanReview": skipHumanReview,
  "rawDocument": {
    "mimeType": "MIME_TYPE",
    "content": "BASE64_ENCODED_DATA"
  },
  "fieldMask": "FIELD_MASK"
}

Clientbibliotheken verwenden

Binäre Daten mit Texteditoren in Anfragen einzubetten, ist weder wünschenswert noch praktisch. In der Praxis betten Sie base64-codierte Dateien in den Clientcode ein. Alle unterstützten Programmiersprachen haben integrierte Mechanismen für die base64-codierte Inhalte:

Python

# Import the base64 encoding library.
import base64

# Pass the image data to an encoding function.
def encode_image(image):
    with open(image, "rb") as image_file:
        encoded_string = base64.b64encode(image_file.read())
    return encoded_string

Node.js

// Read the file into memory.
var fs = require('fs');
var imageFile = fs.readFileSync('/path/to/file');

// Convert the image data to a Buffer and base64 encode it.
var encoded = Buffer.from(imageFile).toString('base64');

Java

// Import the Base64 encoding library.
import org.apache.commons.codec.binary.Base64;

// Encode the image.
String encodedString = Base64.getEncoder().encodeToString(imageFile.getBytes());

Go

import (
    "bufio"
    "encoding/base64"
    "io"
    "os"
)

// Open image file.
f, _ := os.Open("image.jpg")

// Read entire image into byte slice.
reader := bufio.NewReader(f)
content, _ := io.ReadAll(reader)

// Encode image as base64.
base64.StdEncoding.EncodeToString(content)