Coba Gemini 1.5 Pro, model multimodal kami yang paling canggih di Vertex AI, dan lihat apa yang dapat Anda bangun dengan jendela konteks token 1 juta. Coba Gemini 1.5 Pro, model multimodal kami yang paling canggih di Vertex AI, dan lihat apa yang dapat Anda bangun dengan jendela konteks token 1 juta.

Buat audio dari teks menggunakan command line

Dokumen ini akan memandu Anda melalui proses permintaan ke Text-to-Speech menggunakan command line. Untuk mempelajari selengkapnya tentang konsep dasar dalam Text-to-Speech, baca Dasar-Dasar Text-to-Speech.

Sebelum memulai

Sebelum dapat mengirim permintaan ke Text-to-Speech API, Anda harus sudah menyelesaikan tindakan berikut. Lihat halaman sebelum memulai untuk mengetahui detailnya.

Aktifkan Text-to-Speech di project GCP.
Pastikan penagihan diaktifkan untuk Text-to-Speech.
After installing the Google Cloud CLI, configure the gcloud CLI to use your federated identity and then initialize it by running the following command:
```
gcloud init
```

Sintesis audio dari teks

Anda dapat mengonversi teks menjadi audio dengan membuat permintaan HTTP POST ke endpoint https://texttospeech.googleapis.com/v1/text:synthesize. Dalam isi perintah POST, tentukan jenis suara yang akan disintesis di bagian konfigurasi, voice tentukan teks yang akan disintesis di kolom text dari input lalu tentukan jenis audio yang akan dibuat di bagian audioConfig.

Jalankan permintaan REST di bawah ini pada command line untuk melakukan sintesis pada audio dari teks menggunakan Text-to-Speech. Perintah tersebut menggunakan perintah gcloud auth application-default print-access-token untuk mengambil token otorisasi untuk permintaan tersebut.

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: ID alfanumerik project Google Cloud Anda.
Metode HTTP dan URL:
```
POST https://texttospeech.googleapis.com/v1/text:synthesize
```
Meminta isi JSON:
```
{
  "input": {
    "text": "Android is a mobile operating system developed by Google, based on the Linux kernel and designed primarily for touchscreen mobile devices such as smartphones and tablets."
  },
  "voice": {
    "languageCode": "en-gb",
    "name": "en-GB-Standard-A",
    "ssmlGender": "FEMALE"
  },
  "audioConfig": {
    "audioEncoding": "MP3"
  }
}
```
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
curl (Linux, macOS, atau Cloud Shell)

Catatan: Perintah berikut mengasumsikan bahwa Anda telah login ke CLI gcloud dengan akun pengguna Anda dengan menjalankan gcloud init atau gcloud auth login, atau menggunakan Cloud Shell, yang secara otomatis membuat Anda login ke CLI gcloud. Anda dapat memeriksa akun yang aktif saat ini dengan menjalankan gcloud auth list.

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:
```
curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "x-goog-user-project: PROJECT_ID" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://texttospeech.googleapis.com/v1/text:synthesize"
```
PowerShell (Windows)

Catatan: Perintah berikut mengasumsikan bahwa Anda telah login ke CLI gcloud dengan akun pengguna Anda dengan menjalankan gcloud init atau gcloud auth login. Anda dapat memeriksa akun yang aktif saat ini dengan menjalankan gcloud auth list.

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:
```
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred"; "x-goog-user-project" = "PROJECT_ID" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://texttospeech.googleapis.com/v1/text:synthesize" | Select-Object -Expand Content
```
Anda akan menerima respons JSON yang mirip dengan berikut ini:
```
{
  "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.."
}
```
Output JSON untuk perintah REST berisi audio yang disintesis dalam format yang dienkode base64. Salin konten kolom audioContent ke file baru bernama synthesize-output-base64.txt. File baru Anda akan terlihat seperti berikut:
```
//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o
...
VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV
```
Dekode konten file synthesize-output-base64.txt menjadi file baru bernama synthesized-audio.mp3. Untuk mengetahui informasi tentang mendekode base64, lihat Mendekode Konten Audio yang Dienkode Base64.
Linux
1. Hanya salin konten berenkode base-64 ke dalam file teks.
2. Dekode file teks sumber menggunakan alat command line base64 menggunakan flag -d:
```
    $ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
```
Mac OSX
1. Hanya salin konten berenkode base-64 ke dalam file teks.
2. Dekode file teks sumber menggunakan alat command line base64:
```
    $ base64 --decode SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
```
Windows
1. Hanya salin konten berenkode base-64 ke dalam file teks.
2. Dekode file teks sumber menggunakan perintah certutil.
```
   certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE
```
Memutar konten synthesized-audio.mp3 dalam aplikasi audio atau di perangkat audio. Anda juga dapat membuka synthesized-audio.mp3 di browser Chrome untuk memutar audio dengan membuka folder yang berisi file tersebut, misalnya file://my_file_path/synthesized-audio.mp3

Pembersihan

Untuk menghindari tagihan Google Cloud Platform yang tidak diperlukan, gunakan konsol Google Cloud untuk menghapus project jika Anda tidak membutuhkannya.

Langkah selanjutnya

Pelajari Cloud Text-to-Speech lebih lanjut dengan membaca dasar-dasarnya.
Tinjau daftar suara yang tersedia yang dapat Anda gunakan untuk ucapan sintetis.

Buat audio dari teks menggunakan command line

Sebelum memulai

Sintesis audio dari teks

curl (Linux, macOS, atau Cloud Shell)

PowerShell (Windows)

Linux

Mac OSX

Windows

Pembersihan

Langkah selanjutnya