Text-to-Speech AI

Ubah teks menjadi ucapan yang terdengar alami menggunakan API yang didukung oleh teknologi AI Google terbaik.

Pelanggan baru mendapatkan kredit gratis senilai hingga $300 untuk mencoba Text-to-Speech dan produk Google Cloud lainnya.

Tingkatkan interaksi pelanggan dengan respons yang cerdas dan terdengar nyata
Ciptakan interaksi pengguna dengan antarmuka pengguna suara di perangkat dan aplikasi Anda
Personalisasikan komunikasi Anda berdasarkan preferensi suara dan bahasa pengguna

Pelajari cara membuat ucapan sintetis menggunakan Text-to-Speech API

Mulai lab mandiri

Manfaat

Ucapan berakurasi tinggi

Deploy teknologi inovatif Google untuk menghasilkan ucapan dengan intonasi layaknya manusia. Dibangun berdasarkan keahlian sintesis ucapan DeepMind, API tersebut memberikan suara yang mendekati kualitas suara manusia.

Pilihan suara terluas

Pilih dari kumpulan file yang berisi lebih dari 380 suara dengan lebih dari 50 bahasa dan varian, termasuk Mandarin, Hindi, Spanyol, Arab, Rusia, dan banyak lagi. Pilih suara yang paling sesuai untuk pengguna dan aplikasi Anda.

Suara yang unik

Buat suara yang unik untuk mewakili brand Anda di semua poin kontak pelanggan Anda. Jangan menggunakan suara yang sama dengan yang dipakai organisasi lain.

Demo

Menerapkan Text-to-Speech

Ketik apa saja, pilih bahasa, lalu klik “Ucapkan” untuk mendengarnya.

Fitur utama

Chirp 3: Suara HD

Bangun agen yang menarik menggunakan suara percakapan spontan terbaru yang berbasis AudioLM. Suara ini menawarkan audio berkualitas tinggi, streaming berlatensi rendah, dan ucapan yang terdengar alami, dengan intonasi yang akurat serta menyertakan ketidaklancaran pengucapan manusia.

Suara studio

Pikat pendengar Anda dengan konten bernarasi profesional yang direkam di lingkungan berkualitas studio. Jangan lupa memakai headphone.

Anda kini dapat membuat dialog dengan banyak pembicara untuk membuat skenario yang paling interaktif.

Suara Neural2

Internasionalkan pengalaman suara Anda dengan suara yang siap digunakan, yang didukung oleh penelitian terbaru di balik fitur Suara Kustom.

Suara kustom instan

Buat model suara yang dipersonalisasi hanya dengan input audio berdurasi 10 detik. Pratinjau dengan akses awal.

Dukungan Teks dan SSML

Sesuaikan ucapan dengan tag SSML yang memungkinkan Anda untuk menambahkan jeda, nomor, format tanggal dan waktu, serta petunjuk pengucapan lainnya.

Yang baru

Daftar untuk berlangganan newsletter Google Cloud guna menerima berita terbaru terkait produk, informasi acara, penawaran spesial, dan lainnya.

Gambar vektor orang yang mengucapkan ‘Halo’ dalam berbagai bahasa

Blog post

Google Cloud Text-to-Speech API sekarang mendukung suara kustomBaca blog

Seseorang yang sedang memegang smartphone menunjukkan buku audio yang dibuat menggunakan fitur text to speech

Video

Cara mengonversi format PDF ke buku audio dengan machine learningTonton video

Sketsa yang mendemonstrasikan percakapan yang didukung teknologi AI menggunakan Contact CenterAI

Blog post

AI percakapan mendorong pengalaman pelanggan yang lebih baikBaca blog

Seorang perempuan memegang ponsel di depannya dan sedang berbicara melaluinya

Video

Membuat solusi untuk telepon ramah difabel dengan Speech-to-Text dan Text-to-SpeechTonton video

Teks Bahasa dan Suara Cloud Text-to-Speech di atas deretan ~25 bendera dunia

Blog post

Suara dan bahasa baru untuk Text-to-SpeechBaca blog

Dokumentasi

Google Cloud Basics

Dasar-dasar Text-to-Speech

Panduan konsep dasar penggunaan Text-to-Speech API.

Quickstart

Panduan memulai: Menggunakan command line

Siapkan project dan otorisasi Google Cloud, lalu ajukan permintaan Text-to-Speech untuk membuat audio dari teks.

Google Cloud Basics

Suara dan bahasa yang didukung

Telusuri panduan dan referensi untuk produk ini.

Google Cloud Basics

Ringkasan suara kustom instan

Pelajari cara membuat suara kustom menggunakan rekaman audio berdurasi 10 detik.

Tutorial

WaveNet dan suara sintetis lainnya

Pelajari berbagai suara sintetis yang tersedia untuk digunakan dalam Text-to-Speech, termasuk suara WaveNet premium.

Tutorial

Mengucapkan file teks alamat dengan SSML

Tutorial ini menunjukkan cara menggunakan Bahasa Markup Sintesis Ucapan (SSML) untuk mengucapkan file teks alamat.

Tidak menemukan yang Anda cari?

Catatan rilis

Baca rilis terbaru untuk Text-to-Speech

Kasus penggunaan

Voicebot di pusat kontak

Berikan pengalaman suara yang lebih baik bagi layanan pelanggan menggunakan voicebot di Dialogflow yang dapat menghasilkan ucapan secara dinamis, bukan memutar audio statis hasil rekaman. Berinteraksilah dengan suara sintesis berkualitas tinggi yang memberi penelepon rasa familiar dan personalisasi.

Kasus penggunaan

Pembuatan suara di perangkat

Aktifkan komunikasi alami bersama pengguna Anda dengan mendukung perangkat untuk mengucapkan suara layaknya manusia sebagai pembaca teks. Bangun antarmuka pengguna suara end-to-end menggunakan Speech-to-Text dan Natural Language untuk meningkatkan kualitas pengalaman pengguna dengan interaksi yang mudah dan menarik.

Kasus penggunaan

EPG (Panduan Program Elektronik) ramah difabel

Buat EPG membacakan teks dengan lantang untuk memberikan pengalaman pengguna yang lebih baik kepada pelanggan Anda dan memenuhi persyaratan aksesibilitas untuk layanan dan aplikasi. Coba demo EPG.

Implementasikan fungsi text-to-speech dengan mudah di EPG untuk memberikan pengalaman pengguna yang lebih baik kepada pelanggan Anda dan memenuhi persyaratan aksesibilitas untuk layanan dan aplikasi.

Membuat solusi

Masalah apa yang ingin Anda temukan solusinya?

What you'll get:

Panduan langkah demi langkah

Arsitektur referensi

Solusi siap pakai yang tersedia

Layanan ini dibangun dengan Vertex AI. Anda harus berusia 18 tahun ke atas untuk menggunakannya. Jangan memasukkan informasi sensitif, rahasia, atau pribadi.

Semua fitur

Suara kustom instan	Buat model suara yang dipersonalisasi menggunakan rekaman audio Anda sendiri untuk menghasilkan suara yang unik dan terdengar alami bagi organisasi Anda. Dengan fitur ini, Anda dapat membuat suara pribadi dengan cepat, yang kemudian dapat digunakan untuk menyintesis audio menggunakan Cloud TTS API, yang mendukung streaming dan teks panjang. Pelajari lebih lanjut
Sintesis audio panjang	Lakukan sintesis hingga 1 juta byte input secara asinkron dengan Sintesis Audio Panjang.
Pemilihan suara dan bahasa	Pilih dari beragam pilihan yang berisi lebih dari 220 suara dalam lebih dari 40 bahasa dan varian, dan jumlahnya akan bertambah seiring waktu.
Suara WaveNet	Manfaatkan lebih dari 90 suara WaveNet yang dibangun berdasarkan penelitian inovatif DeepMind untuk menghasilkan ucapan yang secara signifikan lebih mirip dengan suara manusia.
Dukungan Teks dan SSML	Sesuaikan ucapan dengan tag SSML yang memungkinkan Anda menambahkan jeda, nomor, format tanggal dan waktu, serta petunjuk pengucapan lainnya.
Penyesuaian tinggi nada	Personalisasikan tinggi nada suara yang Anda pilih, hingga 20 semitone di atas atau di bawah setelan default.
Penyesuaian kecepatan bicara	Sesuaikan kecepatan bicara menjadi 4x lebih cepat atau lebih lambat dari kecepatan normal.
Kontrol peningkatan volume	Tingkatkan volume output hingga 16 dB atau kurangi volume hingga -96 dB.
REST API dan gRPC API terintegrasi	Mudah diintegrasikan dengan aplikasi atau perangkat apa pun yang dapat mengirimkan permintaan REST atau gRPC, termasuk ponsel, PC, tablet, dan perangkat IoT (misalnya, mobil, TV, speaker).
Fleksibilitas format audio	Ubah teks menjadi format MP3, Linear16, OGG Opus, dan sejumlah format audio lain.
Profil audio	Optimalkan jenis speaker yang digunakan untuk memutar ucapan Anda, seperti headphone atau saluran telepon.

Harga

Text-to-Speech dikenakan biaya berdasarkan jumlah karakter yang dikirim ke layanan untuk disintesis menjadi audio setiap bulannya. 1 juta karakter pertama per bulan gratis untuk suara WaveNet. Untuk suara Standar (non-WaveNet), 4 juta karakter pertama per bulan gratis. Setelah batas paket gratis tercapai, Text-to-Speech akan dikenakan biaya per 1 juta karakter teks yang diproses.

Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Google Cloud.

Langkah selanjutnya

Pelanggan baru mendapatkan kredit gratis senilai $300 untuk mencoba Text-to-Speech dan produk Google Cloud lainnya.

Perlu bantuan untuk memulai?
Hubungi bagian penjualan
Bekerja sama dengan partner tepercaya
Temukan partner
Lanjutkan menjelajah
Lihat semua produk

Text-to-Speech AI

Ucapan berakurasi tinggi

Pilihan suara terluas

Suara yang unik

Menerapkan Text-to-Speech

Fitur utama

Chirp 3: Suara HD

Suara studio

Suara Neural2

Suara kustom instan

Dukungan Teks dan SSML

Yang baru

Dokumentasi

Dasar-dasar Text-to-Speech

Panduan memulai: Menggunakan command line

Suara dan bahasa yang didukung

Ringkasan suara kustom instan

WaveNet dan suara sintetis lainnya

Mengucapkan file teks alamat dengan SSML

Tidak menemukan yang Anda cari?

Pelajari dokumen lainnya

Kasus penggunaan

Voicebot di pusat kontak

Pembuatan suara di perangkat

EPG (Panduan Program Elektronik) ramah difabel

Semua fitur

Harga

Langkah selanjutnya

Perlu bantuan untuk memulai?

Bekerja sama dengan partner tepercaya

Lanjutkan menjelajah