Anda dapat membuat model suara kustom sendiri dalam UI Text-to-Speech.
Prasyarat
- Aktifkan Text-to-Speech API.
- Rekam audio Anda dengan mengikuti persyaratan data pelatihan.
- Membuat bucket Cloud Storage.
- Upload file audio ke bucket baru Anda dalam format yang ditentukan oleh Persyaratan data pelatihan (0001.wav, 0002.wav... 0200.wav, dll.).
Melatih model suara kustom baru
- Buka tab Suara Kustom di UI Text-to-Speech.
- Klik Buat di dekat bagian atas layar.
- Beri nama model suara Anda.
- Tentukan bahasa dari drop-down bahasa yang didukung.
- Pilih file CSV yang sesuai dari konfigurasi bucket di langkah 4 prasyarat.
- Upload pernyataan izin dari talenta suara. Contoh: "Saya adalah pemilik suara ini dan saya mengizinkan Google menggunakan suara ini untuk membuat model suara sintetis."
- Klik Create untuk memulai pembuatan model. Pembuatan model dapat memerlukan waktu hingga 3 hari.
- Untuk melihat status tugas pelatihan, lihat notifikasi konsol di header navigasi kanan atas.
Langkah selanjutnya
Setelah pelatihan model selesai, file audio output sampel akan tersedia di konsol. Anda dapat menggunakan file ini untuk melakukan evaluasi awal terhadap kualitas model. Jika memenuhi persyaratan Anda, hubungi tim penjualan untuk mendapatkan bantuan deployment model. Deployment memerlukan waktu dua hingga tiga minggu, jadi sebaiknya evaluasi dengan cepat dan komunikasikan lebih awal.