Jenis suara

Text-to-Speech menghasilkan audio dengan kualitas alami seperti manusia, yang menghasilkan ucapan yang terdengar seperti manusia sungguhan. Untuk memulai, tentukan suara saat mengirim permintaan sintesis.

Text-to-Speech menawarkan berbagai suara berdasarkan bahasa, gender, dan aksen. Beberapa bahasa memiliki beberapa opsi. Untuk mengetahui daftar lengkapnya, lihat halaman Suara yang Didukung. Untuk memilih suara, gunakan kolom VoiceSelectionParams dalam permintaan API Anda. Lihat Panduan Memulai untuk mengetahui petunjuk tentang cara membuat permintaan synthesize.

Ringkasan

Jenis Suara Diperuntukkan bagi Tahap peluncuran Kemampuan Kontrol Streaming
Perjalanan Agen Percakapan
Pratinjau - Ya
Studio Grup dua speaker Media - Diskusi dan Wawancara

Eksperimental - -
Satu pembicara orang Media - Narasi
GA SSML -
Neural2 Tujuan umum
GA SSML -
Standar Hemat biaya
GA SSML -

Detail Harga

Suara perjalanan

Journey Voices, yang didukung oleh mesin AudioLM, memungkinkan Anda membuat ucapan yang lebih menarik dan berempati untuk aplikasi percakapan. Melalui streaming teks, Journey Voices menghasilkan komunikasi real-time dengan latensi rendah dan mendukung bahasa yang tercantum dalam tabel suara yang didukung.

Pengalaman chat


Suara: en-US-Journey-F

Contoh lainnya

Asisten virtual


Suara: en-US-Journey-D

Chatbot layanan pelanggan


Suara: en-US-Journey-F

Aplikasi pendidikan interaktif


Suara: en-US-Journey-O

Penjualan dan presentasi


Suara: en-US-Journey-D

Waktunya bercerita


Suara: en-US-Journey-F

Suara multi-pembicara studio

Buat diskusi dan wawancara dengan suara studio multi-pembicara baru, berdasarkan teknologi yang sama dengan suara Journey.


Suara studio

Suara studio dirancang untuk membaca berita dan konten siaran.


Contoh 1. Suara en-US-Studio-O yang membaca Great Gatsby.

Suara Neural2

Text-to-Speech API menyediakan paket suara yang disebut Neural2. Suara Neural2 didasarkan pada teknologi yang sama dengan yang digunakan untuk membuat Suara Kustom. Neural2 memungkinkan siapa saja menggunakan teknologi Suara Kustom tanpa melatih suara kustom mereka. Ini tersedia di endpoint global dan satu region.


Contoh 1. Suara Neural2

Suara standar

Suara yang ditawarkan oleh Text-to-Speech berbeda dalam cara diproduksinya, yaitu teknologi ucapan sintetis yang digunakan untuk membuat model mesin suara. Satu teknologi ucapan yang umum, text-to-speech parametrik , biasanya menghasilkan data audio dengan meneruskan output melalui algoritma pemrosesan sinyal yang dikenal sebagaivocoder. Banyak suara standar yang tersedia di Text-to-Speech menggunakan variasi dari teknologi ini.