Suara yang didukung

Text-to-Speech menghasilkan audio dengan kualitas alami seperti manusia, yang menghasilkan ucapan yang terdengar seperti manusia sungguhan. Untuk memulai, tentukan suara saat mengirim permintaan sintesis.

Text-to-Speech menawarkan berbagai suara berdasarkan bahasa, gender, dan aksen. Beberapa bahasa memiliki beberapa opsi. Untuk mengetahui daftar lengkapnya, lihat halaman Suara yang Didukung. Untuk memilih suara, gunakan kolom VoiceSelectionParams dalam permintaan API Anda.

Ringkasan

Jenis suara Diperuntukkan bagi Tahap peluncuran Keterkontrolan Streaming
Chirp 3: Suara HD Agen Percakapan
Pratinjau - Ya
Suara bip HD Agen Percakapan
Pratinjau - Ya
Studio Grup dua speaker Media: Diskusi dan Wawancara

Eksperimental - -
Satu pembicara orang Media: Narasi
GA SSML -
Neural2 Tujuan umum
GA SSML -
Standar Hemat biaya
GA SSML -

Detail Harga

Chirp 3: Suara HD

Chirp 3: Suara HD didukung oleh teknologi yang menangkap nuansa intonasi manusia, sehingga percakapan menjadi lebih menarik. Suara ini tersedia dalam 8 gaya berbeda di banyak bahasa, yang cocok untuk aplikasi real-time dan standar.

Bunyi bip HD

Suara bip HD didukung oleh model AI generatif generasi terbaru kami. Suara Chirp HD memungkinkan Anda membuat ucapan yang lebih menarik dan berempati untuk aplikasi percakapan. Melalui streaming teks, suara Chirp HD menghasilkan komunikasi real-time dengan latensi rendah dan mendukung bahasa yang tercantum dalam tabel suara yang didukung.

Pengalaman chat


Suara: en-US-Chirp-HD-F

Contoh lainnya

Asisten virtual


Suara: en-US-Chirp-HD-D

Chatbot layanan pelanggan


Suara: en-US-Chirp-HD-F

Aplikasi pendidikan interaktif


Suara: en-US-Chirp-HD-O

Penjualan dan presentasi


Suara: en-US-Chirp-HD-D

Waktunya bercerita


Suara: en-US-Chirp-HD-F

Suara multi-pembicara studio

Buat diskusi dan wawancara dengan suara studio multi-pembicara baru, yang didasarkan pada teknologi yang sama dengan suara Chirp HD.


Contoh: Suara multi-pembicara studio

Suara studio

Suara studio dirancang untuk pembacaan berita dan konten siaran.


Contoh: Suara en-US-Studio-O yang membaca The Great Gatsby.

Suara Neural2

Text-to-Speech API menyediakan paket suara yang disebut Neural2. Suara Neural2 didasarkan pada teknologi yang sama dengan yang digunakan untuk membuat Suara Kustom. Neural2 memungkinkan siapa saja menggunakan teknologi Suara Kustom tanpa melatih suara kustom mereka. Ini tersedia di endpoint global dan satu region.


Contoh: Suara Neural2

Suara standar

Suara yang ditawarkan oleh Text-to-Speech berbeda dalam teknologi ucapan sintetis yang digunakan untuk membuat model mesin suara. Satu teknologi ucapan yang umum, text-to-speech parametrik , biasanya menghasilkan data audio dengan meneruskan output melalui algoritma pemrosesan sinyal yang dikenal sebagaivocoder. Banyak suara standar yang tersedia di Text-to-Speech menggunakan variasi dari teknologi ini.

Langkah berikutnya

Lihat Panduan Memulai untuk mengetahui petunjuk tentang cara membuat permintaan synthesize.