Set data percakapan berisi data transkrip percakapan, dan digunakan untuk melatih model kustom Smart Reply atau Ringkasan. Smart Reply menggunakan transkrip percakapan untuk merekomendasikan respons teks kepada agen manusia yang sedang bercakap-cakap dengan pengguna akhir. Model kustom perangkuman dilatih pada set data percakapan yang berisi transkrip dan data anotasi. Mereka menggunakan anotasi untuk membuat ringkasan percakapan bagi agen manusia setelah percakapan selesai.
Ada dua cara untuk membuat set data: Menggunakan alur kerja tutorial Konsol, atau membuat set data secara manual di Konsol menggunakan tab Data -> Set Data. Sebaiknya gunakan tutorial Konsol sebagai opsi pertama. Untuk menggunakan tutorial Konsol, buka Konsol Agent Assist dan klik tombol Mulai di bagian fitur yang ingin Anda uji.
Halaman ini menunjukkan cara membuat set data secara manual.
Sebelum memulai
Ikuti petunjuk penyiapan Dialogflow untuk mengaktifkan Dialogflow di project Google Cloud Platform.
Sebaiknya baca halaman dasar-dasar Agent Assist sebelum memulai tutorial ini.
Jika Anda menerapkan Smart Reply menggunakan data transkrip Anda sendiri, pastikan transkrip Anda dalam
JSON
dalam format yang ditentukan dan disimpan di bucket Google Cloud Storage. Set data percakapan harus berisi minimal 30.000 percakapan,jika tidak, pelatihan model akan gagal. Secara umum, makin banyak percakapan yang Anda lakukan, makin baik kualitas model Anda. Sebaiknya hapus percakapan yang berisi kurang dari 20 pesan atau 3 giliran percakapan (perubahan peserta yang mengucapkan sesuatu). Kami juga menyarankan agar Anda menghapus pesan bot atau pesan yang dibuat secara otomatis oleh sistem (misalnya, "Agen memasuki ruang chat"). Sebaiknya upload percakapan selama minimal 3 bulan untuk memastikan cakupan sebanyak mungkin kasus penggunaan. Jumlah maksimum percakapan dalam set data percakapan adalah 1.000.000.Jika Anda menerapkan Peringkasan menggunakan data transkrip dan anotasi Anda sendiri, pastikan transkrip Anda dalam format yang ditentukan dan disimpan di bucket Google Cloud Storage. Jumlah minimum anotasi pelatihan yang direkomendasikan adalah 1.000. Jumlah minimum yang diterapkan adalah 100.
Buka Konsol Agent Assist. Pilih project Google Cloud Platform Anda, lalu klik opsi menu Data di margin paling kiri halaman. Menu Data menampilkan semua data Anda. Ada dua tab, masing-masing untuk set data percakapan dan pusat informasi.
Klik tab set data percakapan, lalu klik tombol +Buat baru di kanan atas halaman set data percakapan.
Membuat set data percakapan
Masukkan Nama dan Deskripsi opsional untuk set data baru Anda. Di kolom Data percakapan, masukkan URI bucket penyimpanan yang berisi transkrip percakapan Anda. Agent Assist mendukung penggunaan simbol
*
untuk pencocokan karakter pengganti. URI harus memiliki format berikut:gs://<bucket name>/<object name>
Contoh:
gs://mydata/conversationjsons/conv0*.json gs://mydatabucket/test/conv.json
Klik Buat. Set data baru Anda kini muncul di daftar set data di halaman menu Data pada tab Set data percakapan.
Langkah berikutnya
Latih model Smart Reply atau Ringkasan pada satu atau beberapa set data percakapan menggunakan konsol Agent Assist.