Saat mengirim data audio ke Speech-to-Text API, Anda dapat mengirim data secara langsung (dalam kolom content
permintaan) atau meminta API melakukan pengenalan dari jarak jauh pada data yang disimpan di bucket Cloud Storage dengan menentukan objek penyimpanan di kolom uri
permintaan.
Setiap data audio di kolom content
pada permintaan HTTP harus dalam format base64.
Halaman ini menjelaskan cara mengonversi audio dari file biner ke data berenkode base64.
Menggunakan command line
Dalam permintaan gRPC, Anda cukup menulis data biner secara langsung; tetapi JSON digunakan saat membuat permintaan REST. JSON adalah format teks yang tidak mendukung data biner secara langsung, sehingga Anda harus mengonversi data biner tersebut menjadi teks menggunakan encoding Base64.
Sebagian besar lingkungan pengembangan berisi utilitas base64
native untuk
mengenkode biner ke dalam data teks ASCII. Untuk mengenkode file:
Linux
Enkode file menggunakan alat command line base64
, yang memastikan untuk
mencegah penggabungan baris menggunakan flag -w 0
:
base64 INPUT_FILE -w 0 > OUTPUT_FILE
macOS
Enkode file menggunakan alat command line base64
:
base64 -i INPUT_FILE -o OUTPUT_FILE
Windows
Enkode file menggunakan alat Base64.exe
:
Base64.exe -e INPUT_FILE > OUTPUT_FILE
PowerShell
Enkode file menggunakan metode Convert.ToBase64String
:
[Convert]::ToBase64String([IO.File]::ReadAllBytes("./INPUT_FILE")) > OUTPUT_FILE
Buat file permintaan JSON, dengan menyisipkan data berenkode base64:
JSON
{
"recognizer": "projects/PROJECT_ID/locations/global/recognizers/_",
"content": "ZkxhQwAAACIQABAAAAUJABtAA+gA8AB+W8FZndQvQAyjv..."
}
Menggunakan library klien
Menyematkan data biner ke dalam permintaan melalui editor teks bukanlah hal yang diinginkan atau praktis. Dalam praktiknya, Anda akan menyematkan file berenkode base64 dalam kode klien. Semua bahasa pemrograman yang didukung memiliki mekanisme bawaan untuk konten encoding base64.
Python
Di Python, base64 mengenkode file audio sebagai berikut:
# Import the base64 encoding library.
import base64
# Pass the audio data to an encoding function.
def encode_audio(audio_file):
with open(audio_file, "rb") as f:
encoded_content = base64.b64encode(f.read())
return encoded_content
Node.js
// Read the file into memory.
var fs = require('fs');
var audioFile = fs.readFileSync('/full/path/to/audio/file.wav');
// Convert the audio data to a Buffer and base64 encode it.
var encoded = Buffer.from(audioFile).toString('base64');
Java
// Import the Base64 encoding library.
import org.apache.commons.codec.binary.Base64;
// Encode the audio.
byte[] audioData = Base64.encodeBase64(audioFile.getBytes());
String encodedString = Base64.getEncoder().encodeToString(audioData);
Go
import (
"bufio"
"encoding/base64"
"io"
"os"
)
// Open audio file.
f, _ := os.Open("/full/path/to/audio/file.wav")
// Read entire audio into byte slice.
reader := bufio.NewReader(f)
content, _ := io.ReadAll(reader)
// Encode audio as base64.
base64.StdEncoding.EncodeToString(content)