Text-to-Speech menghasilkan audio dengan kualitas alami seperti manusia, yang menghasilkan ucapan yang terdengar seperti manusia sungguhan. Untuk memulai, tentukan suara saat mengirim permintaan sintesis.
Text-to-Speech menawarkan berbagai suara berdasarkan bahasa, gender, dan aksen. Beberapa bahasa memiliki beberapa opsi. Untuk mengetahui daftar lengkapnya, lihat halaman Suara yang Didukung. Untuk memilih suara, gunakan kolom VoiceSelectionParams
dalam permintaan API Anda. Lihat Panduan Memulai untuk mengetahui petunjuk tentang cara membuat permintaan synthesize
.
Ringkasan
Jenis Suara | Diperuntukkan bagi | Tahap peluncuran | Kemampuan Kontrol | Streaming | |
---|---|---|---|---|---|
Perjalanan |
Agen Percakapan
|
Pratinjau | - | Ya | |
Studio | Grup dua speaker |
Media - Diskusi dan Wawancara
|
Eksperimental | - | - |
Satu pembicara orang |
Media - Narasi
|
GA | SSML | - | |
Neural2 |
Tujuan umum
|
GA | SSML | - | |
Standar |
Hemat biaya
|
GA | SSML | - |
Suara perjalanan
Journey Voices, yang didukung oleh mesin AudioLM, memungkinkan Anda membuat ucapan yang lebih menarik dan berempati untuk aplikasi percakapan. Melalui streaming teks, Journey Voices menghasilkan komunikasi real-time dengan latensi rendah dan mendukung bahasa yang tercantum dalam tabel suara yang didukung.
Pengalaman chat
Suara: en-US-Journey-F
Contoh lainnya
Asisten virtual
en-US-Journey-D
Chatbot layanan pelanggan
en-US-Journey-F
Aplikasi pendidikan interaktif
en-US-Journey-O
Penjualan dan presentasi
en-US-Journey-D
Waktunya bercerita
en-US-Journey-F
Suara multi-pembicara studio
Buat diskusi dan wawancara dengan suara studio multi-pembicara baru, berdasarkan teknologi yang sama dengan suara Journey.
Suara studio
Suara studio dirancang untuk membaca berita dan konten siaran.
Contoh 1. Suara en-US-Studio-O
yang membaca Great Gatsby.
Suara Neural2
Text-to-Speech API menyediakan paket suara yang disebut Neural2. Suara Neural2 didasarkan pada teknologi yang sama dengan yang digunakan untuk membuat Suara Kustom. Neural2 memungkinkan siapa saja menggunakan teknologi Suara Kustom tanpa melatih suara kustom mereka. Ini tersedia di endpoint global dan satu region.
Contoh 1. Suara Neural2
Suara standar
Suara yang ditawarkan oleh Text-to-Speech berbeda dalam cara diproduksinya, yaitu teknologi ucapan sintetis yang digunakan untuk membuat model mesin suara. Satu teknologi ucapan yang umum, text-to-speech parametrik , biasanya menghasilkan data audio dengan meneruskan output melalui algoritma pemrosesan sinyal yang dikenal sebagaivocoder. Banyak suara standar yang tersedia di Text-to-Speech menggunakan variasi dari teknologi ini.