Lihat update terbaru dari Google Cloud Next Tonton sekarang
Langsung ke

Text-to-Speech

Ubah teks menjadi ucapan yang terdengar alami menggunakan API yang didukung oleh teknologi AI Google terbaik.

Pelanggan baru mendapatkan kredit gratis senilai $300 untuk dibelanjakan pada Text-to-Speech.

  • Tingkatkan interaksi pelanggan dengan respons yang cerdas dan terdengar nyata

  • Ciptakan interaksi pengguna dengan antarmuka pengguna suara di perangkat dan aplikasi Anda

  • Personalisasikan komunikasi Anda berdasarkan preferensi suara dan bahasa pengguna

Manfaat

Ucapan berakurasi tinggi

Deploy teknologi inovatif Google untuk menghasilkan ucapan dengan intonasi layaknya manusia. Dibangun berdasarkan keahlian sintesis ucapan DeepMind, API tersebut memberikan suara yang mendekati kualitas suara manusia.

Pilihan suara terluas

Pilih dari kumpulan file yang berisi lebih dari 380 suara dengan lebih dari 50 bahasa dan varian, termasuk Mandarin, Hindi, Spanyol, Arab, Rusia, dan banyak lagi. Pilih suara yang paling sesuai untuk pengguna dan aplikasi Anda.

Suara yang unik

Buat suara yang unik untuk mewakili brand Anda di semua poin kontak pelanggan Anda. Jangan menggunakan suara yang sama dengan yang dipakai organisasi lain.

Demo

Menerapkan Text-to-Speech

Ketik apa saja, pilih bahasa, lalu klik “Ucapkan” untuk mendengarnya.

Fitur utama

Fitur utama

Suara Neural2

Internasionalkan pengalaman suara Anda dengan suara yang siap digunakan, yang didukung oleh penelitian terbaru di balik fitur Suara Kustom.

Suara studio (Pratinjau)

Pikat pendengar Anda dengan konten bernarasi profesional yang direkam di lingkungan berkualitas studio. Jangan lupa memakai headphone!

Suara Kustom

Latih model suara kustom menggunakan rekaman audio Anda sendiri untuk menghasilkan suara yang unik dan terdengar lebih alami untuk organisasi Anda. Anda dapat menentukan dan memilih profil suara yang sesuai dengan organisasi Anda, dan dapat menyesuaikan diri dengan kebutuhan perubahan suara dengan cepat sesuai kebutuhan tanpa perlu merekam frasa baru.

Penyesuaian suara

Personalisasikan tinggi nada suara yang Anda pilih, hingga 20 semitone di atas atau di bawah dari setelan default. Sesuaikan kecepatan bicara menjadi 4x lebih cepat atau lebih lambat dari kecepatan normal.

Dukungan Teks dan SSML

Sesuaikan ucapan dengan tag SSML yang memungkinkan Anda untuk menambahkan jeda, nomor, format tanggal dan waktu, serta petunjuk pengucapan lainnya.

Lihat semua fitur

Yang baru

Yang baru

Daftaruntuk berlangganan newsletter Google Cloud guna menerima berita terbaru terkait produk, informasi acara, penawaran spesial, dan lainnya.

Dokumentasi

Dokumentasi

Dasar-Dasar Google Cloud
Dasar-dasar Text-to-Speech

Panduan konsep dasar penggunaan Text-to-Speech API.

Panduan Memulai
Panduan memulai: Menggunakan command line

Siapkan project dan otorisasi Google Cloud, lalu ajukan permintaan Text-to-Speech untuk membuat audio dari teks.

Dasar-Dasar Google Cloud
Suara dan bahasa yang didukung

Telusuri panduan dan resource untuk produk ini.

Dasar-Dasar Google Cloud
Ringkasan Suara Kustom (beta)

Pelajari cara membuat suara yang unik dan terdengar lebih alami dengan Suara Kustom menggunakan rekaman audio berkualitas studio milik Anda sendiri.

Tutorial
WaveNet dan suara sintetis lainnya

Pelajari berbagai suara sintetis yang tersedia untuk digunakan dalam Text-to-Speech, termasuk suara WaveNet premium.

Tutorial
Mengucapkan file teks alamat dengan SSML

Tutorial ini menunjukkan cara menggunakan Bahasa Markup Sintesis Ucapan (SSML) untuk mengucapkan file teks alamat.

Kasus penggunaan

Kasus penggunaan

Kasus penggunaan
Voicebot di pusat kontak

Berikan pengalaman suara yang lebih baik bagi layanan pelanggan menggunakan voicebot di Dialogflow yang dapat menghasilkan ucapan secara dinamis, bukan memutar audio statis hasil rekaman. Berinteraksilah dengan suara sintesis berkualitas tinggi yang memberi penelepon rasa familiar dan personalisasi.

Bot suara dalam arsitektur referensi pusat kontak
Kasus penggunaan
Pembuatan suara di perangkat

Aktifkan komunikasi natural dengan pengguna Anda dengan mendukung perangkat untuk mengucapkan suara layaknya manusia sebagai pembaca teks. Bangun antarmuka pengguna suara end-to-end menggunakan Speech-to-Text dan Natural Language, untuk meningkatkan kualitas pengalaman pengguna dengan interaksi yang mudah dan menarik.

Pembuatan suara dalam arsitektur referensi perangkat
Kasus penggunaan
EPG (Panduan Program Elektronik) ramah difabel

Buat EPG membacakan teks dengan lantang untuk memberikan pengalaman pengguna yang lebih baik kepada pelanggan Anda dan memenuhi persyaratan aksesibilitas untuk layanan dan aplikasi. Coba demo EPG.

Implementasikan fungsi text-to-speech dengan mudah di EPG untuk memberikan pengalaman pengguna yang lebih baik kepada pelanggan Anda dan memenuhi persyaratan aksesibilitas untuk layanan dan aplikasi. 

Arsitektur referensi yang menunjukkan bagaimana TTS API dapat membuat EPG ramah difabel

Semua fitur

Semua fitur

Suara Kustom (beta) Latih model sintesis ucapan kustom menggunakan rekaman audio Anda sendiri untuk menghasilkan suara yang unik dan terdengar lebih alami bagi organisasi Anda. Anda dapat menentukan dan memilih profil suara yang sesuai dengan organisasi Anda, dan dapat menyesuaikan diri dengan perubahan kebutuhan suara dengan cepat tanpa perlu merekam frasa baru. Pelajari lebih lanjut.
Pemilihan suara dan bahasa Pilih dari beragam pilihan yang berisi lebih dari 220 suara dengan lebih dari 40 bahasa dan varian, dan jumlahnya akan bertambah seiring waktu.
Suara WaveNet Manfaatkan 90+ suara WaveNet yang dibangun berdasarkan penelitian inovatif DeepMind untuk menghasilkan ucapan yang secara signifikan lebih mirip dengan suara manusia.
Dukungan Teks dan SSML Sesuaikan ucapan dengan tag SSML yang memungkinkan Anda menambahkan jeda, nomor, format tanggal dan waktu, serta petunjuk pengucapan lainnya.
Penyesuaian tinggi nada Personalisasikan tinggi nada suara yang Anda pilih, hingga 20 semitone di atas atau di bawah setelan default.
Penyesuaian kecepatan bicara Sesuaikan kecepatan bicara menjadi 4x lebih cepat atau lebih lambat dari kecepatan normal.
Kontrol peningkatan volume Tingkatkan volume output hingga 16 dB atau kurangi volume hingga -96 dB.
REST API dan gRPC API terintegrasi Mudah diintegrasikan dengan aplikasi atau perangkat apa pun yang memiliki kemampuan untuk mengirimkan permintaan REST atau gRPC, termasuk ponsel, PC, tablet, dan perangkat IoT (misalnya, mobil, TV, speaker).
Fleksibilitas format audio Mengonversi teks menjadi format MP3, Linear16, OGG Opus, dan sejumlah format audio lain.
Profil audio Optimalkan jenis speaker yang digunakan untuk memutar ucapan Anda, seperti headphone atau saluran telepon.

Harga

Harga

Text-to-Speech dikenakan biaya berdasarkan jumlah karakter yang dikirim ke layanan untuk disintesis menjadi audio setiap bulannya. 1 juta karakter pertama per bulan gratis untuk suara WaveNet. Untuk suara Standar (non-WaveNet), 4 juta karakter pertama per bulan gratis. Setelah batas paket gratis tercapai, Text-to-Speech akan dikenakan biaya per 1 juta karakter teks yang diproses.

Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Google Cloud.