Set data percakapan berisi data transkrip percakapan, dan digunakan untuk melatih model kustom Smart Reply atau Ringkasan. Smart Reply menggunakan transkrip percakapan untuk merekomendasikan respons teks kepada agen manusia yang berkomunikasi dengan pengguna akhir. Model kustom peringkasan dilatih pada set data percakapan yang berisi transkrip dan data anotasi. Model ini menggunakan anotasi untuk membuat ringkasan percakapan kepada agen manusia setelah percakapan selesai.
Ada dua cara untuk membuat set data: Menggunakan alur kerja tutorial Konsol, atau membuat set data secara manual di Konsol menggunakan tab Data -> Set Data. Sebaiknya gunakan tutorial Konsol sebagai opsi pertama. Untuk menggunakan tutorial Konsol, buka Konsol Agent Assist dan klik tombol Mulai di bagian fitur yang ingin Anda uji.
Halaman ini menunjukkan cara membuat set data secara manual.
Sebelum memulai
Ikuti petunjuk penyiapan Dialogflow untuk mengaktifkan Dialogflow di project Google Cloud Platform.
Sebaiknya baca halaman dasar-dasar Agent Assist sebelum memulai tutorial ini.
Jika Anda menerapkan Smart Reply menggunakan data transkrip Anda sendiri, pastikan transkrip Anda berada di
JSON
dalam format yang ditentukan dan disimpan di bucket Google Cloud Storage. Set data percakapan harus berisi minimal 30.000 percakapan. Jika tidak, pelatihan model akan gagal. Sebagai aturan umum, semakin banyak percakapan yang Anda miliki, makin baik kualitas model Anda. Sebaiknya hapus percakapan dengan kurang dari 20 pesan atau 3 giliran percakapan (perubahan saat peserta membuat ucapan). Sebaiknya Anda juga menghapus pesan bot atau pesan yang otomatis dibuat oleh sistem (misalnya, "Agen memasuki ruang chat"). Sebaiknya upload percakapan minimal 3 bulan untuk memastikan cakupan sebanyak mungkin kasus penggunaan. Jumlah maksimum percakapan dalam set data percakapan adalah 1.000.000.Jika Anda menerapkan Ringkasan menggunakan data transkripsi dan anotasi Anda sendiri, pastikan transkripsi Anda dalam format yang ditentukan dan disimpan di bucket Google Cloud Storage. Jumlah minimum anotasi pelatihan yang direkomendasikan adalah 1.000. Jumlah minimum yang diterapkan adalah 100.
Buka Konsol Agent Assist. Pilih project Google Cloud Platform Anda, lalu klik opsi menu Data di margin kiri halaman. Menu Data menampilkan semua data Anda. Ada dua tab, masing-masing untuk set data percakapan dan pusat informasi.
Klik tab set data percakapan, lalu klik tombol +Buat baru di kanan atas halaman set data percakapan.
Membuat set data percakapan
Masukkan Nama dan Deskripsi opsional untuk set data baru Anda. Di kolom Conversation data, masukkan URI bucket penyimpanan yang berisi transkrip percakapan Anda. Agent Assist mendukung penggunaan simbol
*
untuk pencocokan karakter pengganti. URI harus memiliki format berikut:gs://<bucket name>/<object name>
Contoh:
gs://mydata/conversationjsons/conv0*.json gs://mydatabucket/test/conv.json
Klik Create. Set data baru Anda kini muncul dalam daftar set data di halaman menu Data pada tab Set data percakapan.
Langkah selanjutnya
Latih model Smart Reply atau Ringkasan pada satu atau beberapa set data percakapan menggunakan konsol Agent Assist.