Membuat model suara kustom untuk aplikasi ucapan Anda

Anda dapat membuat model suara kustom sendiri dalam UI Text-to-Speech.

Prasyarat

  1. Aktifkan Text-to-Speech API.
  2. Rekam audio sesuai dengan persyaratan data pelatihan.
  3. Membuat bucket Cloud Storage.
  4. Upload file audio ke bucket baru dalam format yang ditentukan oleh Persyaratan data pelatihan (0001.wav, 0002.wav... 0200.wav, dll).

Latih model suara kustom baru

  1. Buka tab Suara Kustom di UI Text-to-Speech.
  2. Klik Buat di dekat bagian atas layar.
  3. Beri nama model suara Anda.
  4. Tentukan bahasa dari menu drop-down bahasa yang didukung.
  5. Pilih file CSV yang tepat dari konfigurasi bucket di langkah 4 prasyarat.
  6. Upload pernyataan izin dari pengisi suara. Contoh: "Saya, (nama) menyetujui bahwa suara saya akan digunakan untuk membuat suara kustom sintetis."
  7. Klik Create untuk memulai pembuatan model. Pembuatan model dapat memerlukan waktu hingga 3 hari.
  8. Untuk melihat status tugas pelatihan, lihat notifikasi konsol Anda di header navigasi kanan atas.

Langkah selanjutnya

Saat pelatihan model Anda selesai, contoh file audio output akan tersedia di konsol. Anda dapat menggunakan file ini untuk melakukan evaluasi awal terhadap kualitas model. Jika memenuhi persyaratan Anda, hubungi tim penjualan Anda untuk mendapatkan bantuan deployment model. Deployment memerlukan waktu dua hingga tiga minggu. Jadi, sebaiknya evaluasi dengan cepat dan komunikasikan lebih awal.