Encoding base64
Saat mengirim file dokumen ke Document AI API, Anda dapat mengirim data secara langsung di kolom RawDocument.content
dengan pemrosesan online saja jika file Anda berukuran 20 MB atau kurang.
File input akan dalam format biner, yang harus dienkode
sebelum dikirim ke Document AI.
Jika file input Anda melebihi batas pemrosesan online, file tersebut harus disimpan di bucket Cloud Storage agar dapat dikirim untuk pemrosesan, yang tidak memerlukan encoding. Lihat dokumentasi pemrosesan batch untuk mengetahui detailnya.
Menggunakan command line
Dalam permintaan gRPC, Anda cukup menulis data biner secara langsung; tetapi JSON digunakan saat membuat permintaan REST. JSON adalah format teks yang tidak mendukung data biner secara langsung, sehingga Anda harus mengonversi data biner tersebut menjadi teks menggunakan encoding Base64.
Sebagian besar lingkungan pengembangan berisi utilitas base64
native untuk
mengenkode biner ke dalam data teks ASCII. Untuk mengenkode file:
Linux
Enkode file menggunakan alat command line base64
, yang memastikan untuk
mencegah penggabungan baris menggunakan flag -w 0
:
base64 INPUT_FILE -w 0 > OUTPUT_FILE
macOS
Enkode file menggunakan alat command line base64
:
base64 -i INPUT_FILE -o OUTPUT_FILE
Windows
Enkode file menggunakan alat Base64.exe
:
Base64.exe -e INPUT_FILE > OUTPUT_FILE
PowerShell
Enkode file menggunakan metode Convert.ToBase64String
:
[Convert]::ToBase64String([IO.File]::ReadAllBytes("./INPUT_FILE")) > OUTPUT_FILE
Buat file permintaan JSON, dengan menyisipkan data berenkode base64:
JSON
{ "skipHumanReview": skipHumanReview, "rawDocument": { "mimeType": "MIME_TYPE", "content": "BASE64_ENCODED_DATA" }, "fieldMask": "FIELD_MASK" }
Menggunakan library klien
Menyematkan data biner ke dalam permintaan melalui editor teks bukanlah hal yang diinginkan atau praktis. Dalam praktiknya, Anda akan menyematkan file berenkode base64 dalam kode klien. Semua bahasa pemrograman yang didukung memiliki mekanisme bawaan untuk konten encoding base64.
Python
# Import the base64 encoding library.
import base64
# Pass the image data to an encoding function.
def encode_image(image):
with open(image, "rb") as image_file:
encoded_string = base64.b64encode(image_file.read())
return encoded_string
Node.js
// Read the file into memory.
var fs = require('fs');
var imageFile = fs.readFileSync('/path/to/file');
// Convert the image data to a Buffer and base64 encode it.
var encoded = Buffer.from(imageFile).toString('base64');
Java
// Import the Base64 encoding library.
import org.apache.commons.codec.binary.Base64;
// Encode the image.
String encodedString = Base64.getEncoder().encodeToString(imageFile.getBytes());
Go
import (
"bufio"
"encoding/base64"
"io"
"os"
)
// Open image file.
f, _ := os.Open("image.jpg")
// Read entire image into byte slice.
reader := bufio.NewReader(f)
content, _ := io.ReadAll(reader)
// Encode image as base64.
base64.StdEncoding.EncodeToString(content)