Melatih dan mengelola model

Dengan menggunakan API ini, tanpa kode apa pun, Anda dapat membuat dan melatih model Speech-to-Text Kustom untuk meningkatkan akurasi pengenalan dari model Speech-to-Text yang ada. Layanan yang terkelola sepenuhnya ini secara otomatis menyediakan resource komputasi, mengeksekusi kode aplikasi pelatihan, dan memastikan penghapusan resource komputasi setelah tugas pelatihan. Anda akan mendapatkan model transkripsi yang telah di-fine-tune sepenuhnya dan berguna untuk aplikasi downstream apa pun.

Serupa dengan model machine learning, pelatihan model Speech-to-Text Kustom biasanya bersifat iteratif dan melibatkan pemilihan model dasar sebagai titik awal, menyesuaikannya dengan set data teks dan audio Anda, lalu menguji kualitas pengenalan model. Jika hasilnya tidak seperti yang diharapkan, Anda dapat melatih kembali model baru dengan campuran data yang berbeda, mengujinya lagi, atau menggunakannya langsung untuk transkripsi dalam domain Anda.

Sebelum memulai

Pastikan Anda telah mendaftar untuk membuat akun Google Cloud, membuat project Google Cloud, dan mengaktifkan Speech-to-Text API: Go to Speech di Konsol Google Cloud, dan membuka Speech-to-Text API. Beroperasi di bagian Model Kustom pada menu navigasi di sebelah kiri.

Buat model kustom

Mulai dengan membuat model Speech-to-Text kustom dan menentukan parameternya, seperti model dasar dan bahasa transkripsi:

  1. Klik Create untuk membuat model kustom.
  2. Masukkan Nama model yang akan digunakan untuk tampilan dan dirujuk dalam permintaan API dan konsol Google Cloud Speech Anda.
  3. Masukkan Deskripsi untuk model.
  4. Pilih Model dasar yang paling sesuai untuk kasus penggunaan Anda.
  5. Pilih Bahasa transkripsi model.
  6. Pilih Wilayah tempat pelatihan akan berlangsung.
  7. Klik Lanjutkan.
Screenshot alur kerja pembuatan model Speech-to-Text Kustom, yang menampilkan kolom yang diperlukan untuk model kustom

Untuk menyelesaikan definisi tugas model Speech-to-Text Kustom dan memulai pelatihan, Anda perlu menentukan set data pelatihan dan validasi.

  1. Pilih set data pelatihan, dengan memberikan URI direktori Cloud Storage yang valid. Pastikan hanya ada file audio dan teks serta total durasi audio sesuai dengan persyaratan set data pelatihan.
  2. Pilih set data validasi, dengan memberikan URI direktori Cloud Storage yang valid. Pastikan hanya ada file audio dan teks serta total durasi audio sesuai dengan persyaratan set data validasi.
  3. Klik Create untuk memulai proses pelatihan.

Jika jam audio yang diindeks tidak mencukupi atau file tidak mengikuti panduan, tugas pelatihan akan gagal.

Screenshot alur kerja pembuatan model Speech-to-Text Kustom, yang menunjukkan kolom yang diperlukan untuk set data pelatihan dan validasi model kustom

Tugas pelatihan dapat diantrekan di belakang tugas lain di sistem kita, dan melatih model dapat memakan waktu beberapa jam hingga beberapa hari, bergantung pada ukuran set data. Setelah pelatihan model selesai, statusnya akan ditandai sebagai Aktif.

Menghapus model kustom

Sebelum memulai, pastikan tidak ada traffic yang dirutekan ke model Speech-to-Text Kustom Anda melalui endpoint mana pun, karena menghapusnya akan menghentikan penayangan permintaan apa pun.

  1. Buka tab Models di bagian Model Kustom.
  2. Klik untuk meluaskan opsi, lalu klik Delete. Dalam beberapa saat, model Speech-to-Text Kustom akan dihapus, beserta semua endpoint-nya, dan tidak akan lagi menyalurkan traffic apa pun.

Mencantumkan model kustom

Dengan memilih Model di bagian Model Kustom, Anda juga dapat mencantumkan semua model Speech-to-Text Kustom Anda, termasuk model yang dilatih, aktif, dan dihapus.

Screenshot alur kerja daftar model Speech-to-Text Kustom, yang menampilkan tabel dengan semua model kustom yang telah dibuat

Langkah selanjutnya

Ikuti referensi untuk memanfaatkan model ucapan kustom di aplikasi Anda: