Encoding base64

Saat mengirim file dokumen ke Document AI API, Anda dapat mengirim data secara langsung di kolom RawDocument.content dengan pemrosesan online saja jika file Anda berukuran 20 MB atau kurang. File input akan dalam format biner, yang harus dienkode sebelum dikirim ke Document AI.

Jika file input Anda melebihi batas pemrosesan online, file tersebut harus disimpan di bucket Cloud Storage agar dapat dikirim untuk pemrosesan, yang tidak memerlukan encoding. Lihat dokumentasi pemrosesan batch untuk mengetahui detailnya.

Menggunakan command line

Dalam permintaan gRPC, Anda cukup menulis data biner secara langsung; tetapi JSON digunakan saat membuat permintaan REST. JSON adalah format teks yang tidak mendukung data biner secara langsung, sehingga Anda harus mengonversi data biner tersebut menjadi teks menggunakan encoding Base64.

Sebagian besar lingkungan pengembangan berisi utilitas base64 native untuk mengenkode biner ke dalam data teks ASCII. Untuk mengenkode file:

Linux

Enkode file menggunakan alat command line base64, yang memastikan untuk mencegah penggabungan baris menggunakan flag -w 0:

base64 INPUT_FILE -w 0 > OUTPUT_FILE

macOS

Enkode file menggunakan alat command line base64:

base64 -i INPUT_FILE -o OUTPUT_FILE

Windows

Enkode file menggunakan alat Base64.exe:

Base64.exe -e INPUT_FILE > OUTPUT_FILE

PowerShell

Enkode file menggunakan metode Convert.ToBase64String:

[Convert]::ToBase64String([IO.File]::ReadAllBytes("./INPUT_FILE")) > OUTPUT_FILE

Buat file permintaan JSON, dengan menyisipkan data berenkode base64:

JSON

{
  "skipHumanReview": skipHumanReview,
  "rawDocument": {
    "mimeType": "MIME_TYPE",
    "content": "BASE64_ENCODED_DATA"
  },
  "fieldMask": "FIELD_MASK"
}

Menggunakan library klien

Menyematkan data biner ke dalam permintaan melalui editor teks bukanlah hal yang diinginkan atau praktis. Dalam praktiknya, Anda akan menyematkan file berenkode base64 dalam kode klien. Semua bahasa pemrograman yang didukung memiliki mekanisme bawaan untuk konten encoding base64.

Python

# Import the base64 encoding library.
import base64

# Pass the image data to an encoding function.
def encode_image(image):
    with open(image, "rb") as image_file:
        encoded_string = base64.b64encode(image_file.read())
    return encoded_string

Node.js

// Read the file into memory.
var fs = require('fs');
var imageFile = fs.readFileSync('/path/to/file');

// Convert the image data to a Buffer and base64 encode it.
var encoded = Buffer.from(imageFile).toString('base64');

Java

// Import the Base64 encoding library.
import org.apache.commons.codec.binary.Base64;

// Encode the image.
String encodedString = Base64.getEncoder().encodeToString(imageFile.getBytes());

Go

import (
    "bufio"
    "encoding/base64"
    "io"
    "os"
)

// Open image file.
f, _ := os.Open("image.jpg")

// Read entire image into byte slice.
reader := bufio.NewReader(f)
content, _ := io.ReadAll(reader)

// Encode image as base64.
base64.StdEncoding.EncodeToString(content)