Membuat audio dari teks menggunakan command line

Dokumen ini akan memandu Anda melalui proses pengajuan permintaan ke Text-to-Speech menggunakan command line. Untuk mempelajari lebih lanjut konsep dasar dalam Text-to-Speech, baca Dasar-Dasar Text-to-Speech.

Sebelum memulai

Sebelum dapat mengirim permintaan ke Text-to-Speech API, Anda harus sudah menyelesaikan tindakan berikut. Lihat halaman sebelum memulai untuk mengetahui detailnya.

Aktifkan Text-to-Speech di project GCP.
Pastikan penagihan diaktifkan untuk Text-to-Speech.
Instal Google Cloud CLI, lalu login ke gcloud CLI dengan identitas terpadu Anda. Setelah login, lakukan inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:
```
gcloud init
```

Menyintesis audio dari teks

Anda dapat mengonversi teks menjadi audio dengan mengajukan permintaan POST HTTP ke endpoint https://texttospeech.googleapis.com/v1/text:synthesize. Dalam isi perintah POST, tentukan jenis suara yang akan disintesis di bagian konfigurasi voice, tentukan teks yang akan disintesis di kolom text dari bagian input, lalu tentukan jenis audio yang akan dibuat di bagian audioConfig.

Jalankan permintaan REST di bawah ini pada command line untuk melakukan sintesis pada audio dari teks menggunakan Text-to-Speech. Perintah ini menggunakan perintah gcloud auth application-default print-access-token guna mengambil token otorisasi untuk permintaan tersebut.

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: ID alfanumerik project Google Cloud Anda.
Metode HTTP dan URL:
```
POST https://texttospeech.googleapis.com/v1/text:synthesize
```
Meminta isi JSON:
```
{
  "input": {
    "text": "Android is a mobile operating system developed by Google, based on the Linux kernel and designed primarily for touchscreen mobile devices such as smartphones and tablets."
  },
  "voice": {
    "languageCode": "en-gb",
    "name": "en-GB-Standard-A",
    "ssmlGender": "FEMALE"
  },
  "audioConfig": {
    "audioEncoding": "MP3"
  }
}
```
Untuk mengirim permintaan Anda, luaskan salah satu opsi berikut:
curl (Linux, macOS, atau Cloud Shell)

Catatan: Perintah berikut mengasumsikan bahwa Anda telah login ke gcloud CLI menggunakan akun pengguna Anda dengan menjalankan gcloud init atau gcloud auth login , atau dengan menggunakan Cloud Shell, yang secara otomatis membuat Anda login ke gcloud CLI . Anda dapat memeriksa akun yang saat ini aktif dengan menjalankan gcloud auth list.

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:
```
curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "x-goog-user-project: PROJECT_ID" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://texttospeech.googleapis.com/v1/text:synthesize"
```
PowerShell (Windows)

Catatan: Perintah berikut mengasumsikan bahwa Anda telah login ke gcloud CLI menggunakan akun pengguna Anda dengan menjalankan gcloud init atau gcloud auth login . Anda dapat memeriksa akun yang saat ini aktif dengan menjalankan gcloud auth list.

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:
```
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred"; "x-goog-user-project" = "PROJECT_ID" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://texttospeech.googleapis.com/v1/text:synthesize" | Select-Object -Expand Content
```
Anda akan menerima respons JSON yang mirip dengan perintah berikut ini:
```
{
  "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.."
}
```
Output JSON untuk perintah REST berisi audio yang disintesis dalam format berenkode base64. Salin konten kolom audioContent ke file baru bernama synthesize-output-base64.txt. File baru Anda akan terlihat seperti berikut:
```
//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o
...
VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV
```
Dekode konten file synthesize-output-base64.txt menjadi file baru bernama synthesized-audio.mp3. Untuk mengetahui informasi tentang cara mendekode base64, lihat Mendekode Konten Audio berenkode Base64.
Linux
1. Hanya salin konten berenkode base-64 ke dalam file teks.
2. Dekode file teks sumber menggunakan alat command line base64 dengan menggunakan flag -d:
```
    $ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
```
Mac OSX
1. Hanya salin konten berenkode base-64 ke dalam file teks.
2. Dekode file teks sumber menggunakan alat command line base64:
```
    $ base64 --decode SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
```
Windows
1. Hanya salin konten berenkode base-64 ke dalam file teks.
2. Dekode file teks sumber menggunakan perintah certutil.
```
   certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE
```
Putar konten synthesized-audio.mp3 di aplikasi audio atau di perangkat audio. Anda juga dapat membuka synthesized-audio.mp3 di browser Chrome untuk memutar audio dengan membuka folder yang berisi file tersebut, misalnya file://my_file_path/synthesized-audio.mp3

Pembersihan

Untuk menghindari tagihan Google Cloud Platform yang tidak diinginkan, gunakan Google Cloud console untuk menghapus project Anda jika tidak lagi diperlukan.

Langkah berikutnya

Pelajari lebih lanjut Cloud Text-to-Speech dengan membaca dasar-dasarnya.
Tinjau daftar suara yang tersedia yang dapat Anda gunakan untuk ucapan sintetis.

Membuat audio dari teks menggunakan command line

Sebelum memulai

Menyintesis audio dari teks

curl (Linux, macOS, atau Cloud Shell)

PowerShell (Windows)

Linux

Mac OSX

Windows

Pembersihan

Langkah berikutnya