Data percakapan diterima sebagai transkrip (Smart Reply) dan transkrip plus data anotasi (Ringkasan). Atau, Anda dapat menggunakan data percakapan dan model demo yang disediakan Agent Assist untuk menguji fungsi atau integrasi tanpa harus memberikan data Anda sendiri. Untuk menggunakan Smart Reply dan Ringkasan selama runtime, Anda harus memberikan data percakapan Anda sendiri.
Halaman ini memandu Anda melalui langkah-langkah yang diperlukan untuk menggunakan set data publik serta memformat data Anda sendiri untuk diupload ke Cloud Storage. Anda harus memberikan data percakapan sebagai file teks berformat JSON.
Format data Smart Reply
Smart Reply dapat digunakan bersama dengan fitur Agent Assist apa pun, atau sebagai fitur mandiri. Untuk menerapkan Smart Reply, Anda harus memberikan data percakapan ke Agent Assist.
Agent Assist menyediakan contoh data percakapan yang dapat Anda gunakan untuk melatih model, serta model demo dan daftar yang diizinkan. Anda dapat menggunakan referensi ini untuk membuat profil percakapan dan menguji fungsi fitur tanpa perlu menyediakan data Anda sendiri. Jika Anda memberikan data sendiri, data tersebut harus dalam format yang ditentukan.
Menggunakan data percakapan contoh Smart Reply
Set data percakapan contoh berasal dari sumber eksternal dan disimpan di bucket Google Cloud Storage. Data ini berisi dialog berorientasi tugas
yang menyentuh enam domain: "Pemesanan", "restoran", "hotel", "atraksi",
"taksi", dan "kereta". Untuk melatih model Anda sendiri menggunakan set data ini, ikuti
langkah-langkah untuk
membuat set data percakapan
menggunakan Agent Assist Console. Di kolom Conversation data, masukkan
gs://smart_messaging_integration_test_data/*.json
untuk menggunakan set data pengujian. Jika
Anda melakukan panggilan API langsung, bukan menggunakan Konsol, Anda dapat membuat
set data percakapan dengan mengarahkan API ke bucket Cloud Storage di atas.
Menggunakan model Smart Reply dan daftar yang diizinkan untuk demo
Untuk menguji model Smart Reply dan daftar yang diizinkan demo menggunakan Konsol (tidak memerlukan set data), buka Konsol Agent Assist dan klik tombol Mulai di bagian fitur Smart Reply. Tutorial Konsol memberi Anda opsi untuk menggunakan data Anda sendiri, data yang disediakan, atau model demo.
Jika Anda melakukan panggilan ke API secara langsung, bukan menggunakan Konsol, model dan daftar yang diizinkan dapat ditemukan di lokasi berikut:
- Model:
projects/ccai-shared-external/conversationModels/c671dd72c5e4656f
- Daftar yang diizinkan:
projects/ccai-shared-external/knowledgeBases/smart_messaging_kb/documents/NzU1MDYzOTkxNzU0MjQwODE5Mg
Untuk menguji fungsi fitur, sebaiknya Anda mulai dengan menggunakan pesan pengguna akhir berikut untuk memicu respons:
- "Dapatkah Anda menemukan tempat menginap mahal yang terletak di timur?"
- "Saya mencari restoran mahal yang menyajikan makanan Thailand."
- "Halo, saya memerlukan hotel yang menyediakan Wi-Fi gratis di utara Cambridge."
Format data ringkasan
Ringkasan dapat digunakan bersama dengan fitur Agent Assist apa pun, atau sebagai fitur mandiri. Untuk menerapkan Ringkasan, Anda harus memberikan data percakapan yang menyertakan anotasi ke Agent Assist. Anotasi adalah ringkasan transkrip percakapan terkait. Anotasi digunakan untuk melatih model yang dapat Anda gunakan untuk membuat ringkasan bagi agen di akhir setiap percakapan dengan pengguna akhir.
Menggunakan contoh data percakapan dan model demo Peringkasan
Agent Assist juga menyediakan contoh data percakapan yang dianotasi yang dapat Anda
gunakan untuk melatih model. Sebaiknya pilih opsi ini jika Anda ingin
menguji fitur Ringkasan sebelum memformat set data Anda sendiri. Set data
pengujian terletak di bucket Cloud Storage berikut:
gs://summarization_integration_test_data/data
. Jika menggunakan data contoh,
Anda dapat melatih model Ringkasan menggunakan
Konsol atau
API. Masukkan
gs://summarization_integration_test_data/data/*
di kolom URI set data untuk
menggunakan set data sampel.
Untuk menguji model Ringkasan demo (tidak memerlukan set data), buka Konsol Agent Assist lalu klik tombol Mulai di bagian fitur Ringkasan. Tutorial Konsol memberi Anda opsi untuk menggunakan data Anda sendiri, data yang disediakan, atau model demo.
Memformat anotasi
Model kustom Ringkasan Agent Assist dilatih menggunakan set data percakapan. Set data percakapan berisi data transkrip dan anotasi yang Anda upload sendiri.
Sebelum dapat mulai mengupload data, Anda harus memastikan bahwa setiap
transkrip percakapan dalam
format JSON
,
memiliki anotasi terkait, dan disimpan di
bucket Google Cloud Storage.
Untuk membuat anotasi, tambahkan string key
dan value
yang diharapkan ke
kolom annotation
yang terkait dengan setiap percakapan dalam set data Anda. Untuk hasil terbaik, data pelatihan anotasi harus mematuhi panduan berikut:
- Jumlah minimum anotasi pelatihan yang direkomendasikan adalah 1.000. Jumlah minimum yang diterapkan adalah 100.
- Data pelatihan tidak boleh berisi PII.
- Anotasi tidak boleh menyertakan informasi apa pun tentang gender, ras, atau usia.
- Anotasi tidak boleh menggunakan bahasa yang beracun atau tidak sopan.
- Anotasi tidak boleh berisi informasi apa pun yang tidak dapat disimpulkan dari transkrip percakapan yang sesuai.
- Setiap anotasi dapat berisi hingga 3 bagian. Anda dapat memilih nama bagian Anda sendiri.
- Anotasi harus memiliki ejaan dan tata bahasa yang benar.
Berikut adalah contoh yang menunjukkan format transkrip percakapan dengan anotasi terkait:
{ "entries": [ { "text": "How can I help?", "role": "AGENT" }, { "text": "I cannot login", "role": "CUSTOMER" }, { "text": "Ok, let me confirm. Are you experiencing issues accessing your account", "role": "AGENT" }, { "text": "Yes", "role": "CUSTOMER" }, { "text": "Got it. Do you still have access to the registered email for the account", "role": "AGENT" }, { "text": "Yes", "role": "AGENT" }, { "text": "I have sent an email with reset steps. You can follow the instructions in the email to reset your login password", "role": "AGENT" }, { "text": "That's nice", "role": "CUSTOMER" }, { "text": "Is there anything else I can help", "role": "AGENT" }, { "text": "No that's all", "role": "CUSTOMER" }, { "text": "Thanks for calling. You have a nice day", "role": "AGENT" } ], "conversation_info": { "annotations": [ { "annotation": { "conversation_summarization_suggestion": { "text_sections": [ { "key": "Situation", "value": "Customer was unable to login to account" }, { "key": "Action", "value": "Agent sent an email with password reset instructions" }, { "key": "Outcome", "value": "Problem was resolved" } ] } } } ] } }
Data transkrip percakapan
Data percakapan teks harus disediakan dalam file berformat JSON, dengan setiap file berisi data untuk satu percakapan. Berikut ini penjelasan format JSON yang diperlukan.
Percakapan
Objek tingkat atas untuk data percakapan.
Kolom | Jenis | Deskripsi |
---|---|---|
conversation_info | ConversationInfo { } | Opsional. Metadata untuk percakapan. |
entries | Entri [ ] | Wajib. Pesan percakapan yang diurutkan secara kronologis. |
ConversationInfo
Metadata untuk percakapan.
Kolom | Jenis | Deskripsi |
---|---|---|
kategori | Kategori [ ] | Opsional. Kategori kustom untuk data percakapan. |
Kategori
Kategori data percakapan. Jika Anda memberikan kategori dengan data percakapan, kategori tersebut akan digunakan untuk mengidentifikasi topik dalam percakapan Anda. Jika Anda tidak memberikan kategori, sistem akan otomatis mengategorikan percakapan berdasarkan konten.
Kolom | Jenis | Deskripsi |
---|---|---|
display_name | string | Wajib. Nama tampilan untuk kategori. |
Entri
Data untuk satu pesan percakapan.
Kolom | Jenis | Deskripsi |
---|---|---|
teks biasa | string | Wajib. Teks untuk pesan percakapan ini. Semua teks harus ditulis dengan huruf besar dengan benar. Kualitas model dapat terpengaruh secara signifikan jika semua huruf dalam teks menggunakan huruf besar atau huruf kecil. Error akan ditampilkan jika kolom ini dibiarkan kosong. |
user_id | bilangan bulat | Opsional. Nomor yang mengidentifikasi peserta percakapan. Setiap peserta harus memiliki satu user_id , yang digunakan berulang kali jika mereka berpartisipasi dalam beberapa percakapan. |
peran | string | Wajib. Peran peserta percakapan. Salah satu dari: "AGENT", "CUSTOMER". |
start_timestamp_usec | bilangan bulat | Opsional jika percakapan hanya digunakan untuk bantuan FAQ, Saran Artikel, dan Ringkasan. Jika tidak, Wajib. Stempel waktu untuk awal giliran percakapan ini dalam mikrodetik. |
Contoh
Berikut adalah contoh file data percakapan.
{ "conversation_info":{ "categories":[ { "display_name":"Category 1" } ] }, "entries": [ { "start_timestamp_usec": 1000000, "text": "Hello, I'm calling in regards to ...", "role": "CUSTOMER", "user_id": 1 }, { "start_timestamp_usec": 5000000, "text": "Yes, I can answer your question ...", "role": "AGENT", "user_id": 2 }, ... ] }
Mengupload percakapan ke Cloud Storage
Anda harus memberikan data percakapan dalam bucket Cloud Storage yang terdapat dalam project Google Cloud Platform Anda. Saat membuat bucket:
- Pastikan Anda telah memilih project Google Cloud Platform yang digunakan untuk Dialogflow.
- Gunakan Kelas Standard Storage.
- Tetapkan lokasi bucket ke lokasi terdekat dengan lokasi Anda.
Anda memerlukan ID lokasi (misalnya,
us-west1
) saat memberikan data percakapan, jadi catat pilihan Anda. - Anda juga memerlukan nama bucket saat memberikan data percakapan.
Ikuti petunjuk Mulai cepat Cloud Storage untuk membuat bucket dan mengupload file.