Halaman ini menjelaskan cara memilih profil perangkat untuk audio yang dibuat oleh Text-to-Speech.
Anda dapat mengoptimalkan ucapan sintetis yang dihasilkan oleh Text-to-Speech untuk pemutaran di berbagai jenis hardware. Misalnya, jika aplikasi Anda berjalan terutama pada jenis perangkat yang lebih kecil dan 'wearable', Anda dapat membuat ucapan sintetis dari Text-to-Speech API yang dioptimalkan secara khusus untuk speaker yang lebih kecil.
Anda juga dapat menerapkan beberapa profil perangkat ke ucapan
sintetik yang sama. Text-to-Speech API menerapkan profil perangkat ke audio sesuai
urutan yang diberikan dalam permintaan ke endpoint
text:synthesize
. Hindari menentukan profil yang sama lebih dari sekali, karena Anda dapat
memiliki hasil yang tidak diinginkan dengan menerapkan profil yang sama beberapa kali.
Penggunaan profil audio bersifat opsional. Jika Anda memilih untuk menggunakan satu (atau beberapa) profil audio, Text-to-Speech akan menerapkan profil tersebut ke hasil ucapan pasca-sintesis Anda. Jika memilih untuk tidak menggunakan profil audio, Anda akan menerima hasil ucapan tanpa modifikasi pasca-sintesis.
Untuk mendengar perbedaan antara audio yang dihasilkan dari profil yang berbeda, bandingkan kedua klip di bawah ini.
Contoh 1. Audio dibuat dengan profil handset-class-device
Contoh 2. Audio dibuat dengan profil telephony-class-application
Catatan: Setiap profil audio telah dioptimalkan untuk perangkat tertentu dengan menyesuaikan rentang efek audio. Namun, merek dan model perangkat yang digunakan untuk menyesuaikan profil mungkin tidak sama persis dengan perangkat pemutaran pengguna. Anda mungkin perlu bereksperimen dengan profil yang berbeda untuk menemukan output suara terbaik untuk aplikasi Anda.
Profil audio yang tersedia
Tabel berikut memberikan ID dan contoh profil perangkat yang tersedia untuk digunakan oleh Text-to-Speech API.
ID profil audio | Dioptimalkan untuk |
---|---|
wearable-class-device |
Smartwatch dan perangkat wearable lainnya, seperti Apple Watch, smartwatch Wear OS |
handset-class-device |
Smartphone, seperti Google Pixel, Samsung Galaxy, Apple iPhone |
headphone-class-device |
Earbud atau headphone untuk pemutaran audio, seperti headphone Sennheiser |
small-bluetooth-speaker-class-device |
Speaker rumah kecil, seperti Google Home Mini |
medium-bluetooth-speaker-class-device |
Speaker smart home, seperti Google Home |
large-home-entertainment-class-device |
Sistem hiburan rumah atau smart TV, seperti Google Home Max, LG TV |
large-automotive-class-device |
Speaker mobil |
telephony-class-application |
Sistem Tanggapan Suara Interaktif (IVR) |
Menentukan profil audio yang akan digunakan
Untuk menentukan profil audio yang akan digunakan, tetapkan
kolom effectsProfileId
untuk permintaan sintesis ucapan.
Protocol
Untuk membuat file audio, buat permintaan POST
dan berikan
isi permintaan yang sesuai. Berikut ini contoh permintaan POST
yang menggunakan
curl
. Contoh ini menggunakan Google Cloud CLI untuk mengambil token akses untuk permintaan.
Untuk mengetahui petunjuk menginstal gcloud CLI, lihat
Melakukan Autentikasi ke Text-to-Speech.
Contoh berikut menunjukkan cara mengirim permintaan ke endpoint
text:synthesize
.
curl \ -H "Authorization: Bearer "$(gcloud auth print-access-token) \ -H "Content-Type: application/json; charset=utf-8" \ --data "{ 'input':{ 'text':'This is a sentence that helps test how audio profiles can change the way Cloud Text-to-Speech sounds.' }, 'voice':{ 'languageCode':'en-us', }, 'audioConfig':{ 'audioEncoding':'LINEAR16', 'effectsProfileId': ['telephony-class-application'] } }" "https://texttospeech.googleapis.com/v1beta1/text:synthesize" > audio-profile.txt
Jika permintaan berhasil, Text-to-Speech API akan menampilkan audio yang disintesis sebagai data berenkode base64 yang terdapat dalam output JSON. Output JSON
dalam file audio-profiles.txt
akan terlihat seperti berikut:
{ "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.." }
Untuk mendekode hasil dari Cloud Text-to-Speech API sebagai file audio MP3, jalankan perintah berikut dari direktori yang sama dengan file audio-profiles.txt
.
sed 's|audioContent| |' < audio-profile.txt > tmp-output.txt && \ tr -d '\n ":{}' < tmp-output.txt > tmp-output-2.txt && \ base64 tmp-output-2.txt --decode > audio-profile.wav && \ rm tmp-output*.txt
Go
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech Go API.
Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech Java API.
Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech Node.js API.
Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech Python API.
Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Bahasa tambahan
C#: Ikuti Petunjuk penyiapan C# di halaman library klien, lalu kunjungi dokumentasi referensi Text-to-Speech untuk .NET.
PHP: Ikuti Petunjuk penyiapan PHP di halaman library klien, lalu kunjungi dokumentasi referensi Text-to-Speech untuk PHP.
Ruby: Ikuti Petunjuk penyiapan Ruby di halaman library klien, lalu kunjungi dokumentasi referensi Text-to-Speech untuk Ruby.