Cloud Text-to-Speech
Konversi text-to-speech yang didukung oleh machine learning.
Coba Gratis Lihat DokumentasiSintesis ucapan berakurasi tinggi
Google Cloud Text-to-Speech mengonversi teks menjadi ucapan mirip manusia dalam lebih dari 100 suara, dalam lebih dari 20 bahasa dan varian. Cloud Text-to-speech menerapkan riset inovatif dalam sintesis ucapan (WaveNet) dan jaringan neural canggih dari Google untuk menghadirkan audio dengan akurasi tinggi. Dengan API yang mudah digunakan ini, Anda dapat membuat interaksi yang terdengar nyata dengan pengguna, yang mentransformasi layanan pelanggan, interaksi perangkat, dan aplikasi lainnya.
Konversikan teks Anda menjadi ucapan sekarang
Ketik apa saja, pilih bahasa, lalu klik “Ucapkan” untuk mendengarnya.
Didukung oleh machine learning Google
Terapkan algoritme jaringan neural deep learning yang canggih untuk menyintesis teks ke dalam berbagai suara dan bahasa. Jaringan neural kami dibuat berdasarkan keahlian sintesis ucapan Google.
Pilih dari 100+ suara
Google Cloud Text-to-Speech menawarkan pilihan 100+ suara dalam 20+ bahasa dan varian, sehingga developer dapat memilih suara yang paling cocok untuk aplikasinya.
Mencakup akses eksklusif ke teknologi WaveNet
DeepMind telah melakukan riset inovatif pada model machine learning untuk membuat ucapan yang menyerupai suara manusia dan terdengar lebih natural, yang mengurangi kesenjangan dengan suara manusia hingga 70%. Cloud Text-to-Speech menawarkan akses eksklusif ke 50+ suara WaveNet dan akan terus bertambah seiring waktu.
Mudah diintegrasikan dengan aplikasi dan perangkat yang ada
Cloud Text-to-Speech mendukung semua aplikasi atau perangkat yang dapat mengirim permintaan REST atau gRPC, termasuk ponsel, PC, tablet, dan perangkat IoT (seperti mobil, TV, speaker).
Mendukung banyak kasus penggunaan umum
Sebagai API yang mudah digunakan, Google Cloud Text-to-Speech adalah solusi fleksibel untuk menciptakan pengalaman yang natural untuk berbagai kasus penggunaan. Kasus penggunaan yang umum mencakup otomatisasi pusat panggilan, respons interaktif dari perangkat IoT, atau mengubah teks menjadi audio.
Fitur Cloud Text-to-Speech
- Multibahasa
- Mendukung 100+ suara dalam 20+ bahasa dan varian, dan akan bertambah seiring waktu.
- Suara WaveNet
- Akses multibahasa eksklusif ke suara WaveNet DeepMind yang menyediakan ucapan yang terdengar paling natural.
- Dukungan Text dan SSML
- Sesuaikan ucapan Anda dengan tag SSML yang memungkinkan Anda menambahkan jeda, nomor, format tanggal dan waktu, dan petunjuk pengucapan lainnya.
- Penyesuaian Kecepatan Bicara
- Sesuaikan kecepatan bicara menjadi 4x lebih cepat atau lebih lambat dari kecepatan normal.
- Penyesuaian Pitch
- Sesuaikan pitch suara yang dipilih, hingga 20 semitone di atas atau di bawah output default.
- Kontrol Peningkatan Volume
- Tingkatkan volume output hingga 16 db atau kurangi volume hingga -96 db.
- Fleksibilitas Format Audio
- Pilih dari sejumlah format audio termasuk MP3, Linear16, dan Ogg Opus.
- Profil Audio
- Optimalkan untuk jenis speaker yang digunakan untuk memutar ucapan Anda, seperti headphone atau saluran telepon.
Harga Cloud Text-to-Speech
Sintesis Ucapan Berakurasi Tinggi
Cloud Text-to-Speech menerapkan skema biaya per 1 juta karakter teks yang diproses. Satu juta karakter pertama gratis. Untuk informasi selengkapnya, silakan lihat panduan harga kami.
| Fitur | Paket bulanan gratis | Penggunaan berbayar |
|---|---|---|
| Suara standar (non-WaveNet) | 0 hingga 4 juta karakter | $4,00 USD/1 juta karakter |
| Suara WaveNet | 0 hingga 1 juta karakter | $16,00 USD/1 juta karakter |