Mengupload data percakapan

Data percakapan diterima sebagai transkrip (Smart Reply) dan transkrip plus data anotasi (Ringkasan). Atau, Anda dapat menggunakan data percakapan dan model demo yang disediakan Agent Assist untuk menguji fungsi atau integrasi tanpa harus memberikan data Anda sendiri. Untuk menggunakan Smart Reply dan Ringkasan selama runtime, Anda harus memberikan data percakapan Anda sendiri.

Halaman ini memandu Anda melalui langkah-langkah yang diperlukan untuk menggunakan set data publik serta memformat data Anda sendiri untuk diupload ke Cloud Storage. Anda harus memberikan data percakapan sebagai file teks berformat JSON.

Format data Smart Reply

Smart Reply dapat digunakan bersama dengan fitur Agent Assist apa pun, atau sebagai fitur mandiri. Untuk menerapkan Smart Reply, Anda harus memberikan data percakapan ke Agent Assist.

Agent Assist menyediakan contoh data percakapan yang dapat Anda gunakan untuk melatih model, serta model demo dan daftar yang diizinkan. Anda dapat menggunakan referensi ini untuk membuat profil percakapan dan menguji fungsi fitur tanpa perlu menyediakan data Anda sendiri. Jika Anda memberikan data sendiri, data tersebut harus dalam format yang ditentukan.

Menggunakan data percakapan contoh Smart Reply

Set data percakapan contoh berasal dari sumber eksternal dan disimpan di bucket Google Cloud Storage. Data ini berisi dialog berorientasi tugas yang menyentuh enam domain: "Pemesanan", "restoran", "hotel", "atraksi", "taksi", dan "kereta". Untuk melatih model Anda sendiri menggunakan set data ini, ikuti langkah-langkah untuk membuat set data percakapan menggunakan Agent Assist Console. Di kolom Conversation data, masukkan gs://smart_messaging_integration_test_data/*.json untuk menggunakan set data pengujian. Jika Anda melakukan panggilan API langsung, bukan menggunakan Konsol, Anda dapat membuat set data percakapan dengan mengarahkan API ke bucket Cloud Storage di atas.

Menggunakan model Smart Reply dan daftar yang diizinkan untuk demo

Untuk menguji model Smart Reply dan daftar yang diizinkan demo menggunakan Konsol (tidak memerlukan set data), buka Konsol Agent Assist dan klik tombol Mulai di bagian fitur Smart Reply. Tutorial Konsol memberi Anda opsi untuk menggunakan data Anda sendiri, data yang disediakan, atau model demo.

Jika Anda melakukan panggilan ke API secara langsung, bukan menggunakan Konsol, model dan daftar yang diizinkan dapat ditemukan di lokasi berikut:

  • Model: projects/ccai-shared-external/conversationModels/c671dd72c5e4656f
  • Daftar yang diizinkan: projects/ccai-shared-external/knowledgeBases/smart_messaging_kb/documents/NzU1MDYzOTkxNzU0MjQwODE5Mg

Untuk menguji fungsi fitur, sebaiknya Anda mulai dengan menggunakan pesan pengguna akhir berikut untuk memicu respons:

  • "Dapatkah Anda menemukan tempat menginap mahal yang terletak di timur?"
  • "Saya mencari restoran mahal yang menyajikan makanan Thailand."
  • "Halo, saya memerlukan hotel yang menyediakan Wi-Fi gratis di utara Cambridge."

Format data ringkasan

Ringkasan dapat digunakan bersama dengan fitur Agent Assist apa pun, atau sebagai fitur mandiri. Untuk menerapkan Ringkasan, Anda harus memberikan data percakapan yang menyertakan anotasi ke Agent Assist. Anotasi adalah ringkasan transkrip percakapan terkait. Anotasi digunakan untuk melatih model yang dapat Anda gunakan untuk membuat ringkasan bagi agen di akhir setiap percakapan dengan pengguna akhir.

Menggunakan contoh data percakapan dan model demo Peringkasan

Agent Assist juga menyediakan contoh data percakapan yang dianotasi yang dapat Anda gunakan untuk melatih model. Sebaiknya pilih opsi ini jika Anda ingin menguji fitur Ringkasan sebelum memformat set data Anda sendiri. Set data pengujian terletak di bucket Cloud Storage berikut: gs://summarization_integration_test_data/data. Jika menggunakan data contoh, Anda dapat melatih model Ringkasan menggunakan Konsol atau API. Masukkan gs://summarization_integration_test_data/data/* di kolom URI set data untuk menggunakan set data sampel.

Untuk menguji model Ringkasan demo (tidak memerlukan set data), buka Konsol Agent Assist lalu klik tombol Mulai di bagian fitur Ringkasan. Tutorial Konsol memberi Anda opsi untuk menggunakan data Anda sendiri, data yang disediakan, atau model demo.

Memformat anotasi

Model kustom Ringkasan Agent Assist dilatih menggunakan set data percakapan. Set data percakapan berisi data transkrip dan anotasi yang Anda upload sendiri.

Sebelum dapat mulai mengupload data, Anda harus memastikan bahwa setiap transkrip percakapan dalam format JSON, memiliki anotasi terkait, dan disimpan di bucket Google Cloud Storage.

Untuk membuat anotasi, tambahkan string key dan value yang diharapkan ke kolom annotation yang terkait dengan setiap percakapan dalam set data Anda. Untuk hasil terbaik, data pelatihan anotasi harus mematuhi panduan berikut:

  1. Jumlah minimum anotasi pelatihan yang direkomendasikan adalah 1.000. Jumlah minimum yang diterapkan adalah 100.
  2. Data pelatihan tidak boleh berisi PII.
  3. Anotasi tidak boleh menyertakan informasi apa pun tentang gender, ras, atau usia.
  4. Anotasi tidak boleh menggunakan bahasa yang beracun atau tidak sopan.
  5. Anotasi tidak boleh berisi informasi apa pun yang tidak dapat disimpulkan dari transkrip percakapan yang sesuai.
  6. Setiap anotasi dapat berisi hingga 3 bagian. Anda dapat memilih nama bagian Anda sendiri.
  7. Anotasi harus memiliki ejaan dan tata bahasa yang benar.

Berikut adalah contoh yang menunjukkan format transkrip percakapan dengan anotasi terkait:

{
  "entries": [
    {
      "text": "How can I help?",
      "role": "AGENT"
    },
    {
      "text": "I cannot login",
      "role": "CUSTOMER"
    },
    {
      "text": "Ok, let me confirm. Are you experiencing issues accessing your account",
      "role": "AGENT"
    },
    {
      "text": "Yes",
      "role": "CUSTOMER"
    },
    {
      "text": "Got it. Do you still have access to the registered email for the account",
      "role": "AGENT"
    },
    {
      "text": "Yes",
      "role": "AGENT"
    },
    {
      "text": "I have sent an email with reset steps. You can follow the instructions in the email to reset your login password",
      "role": "AGENT"
    },
    {
      "text": "That's nice",
      "role": "CUSTOMER"
    },
    {
      "text": "Is there anything else I can help",
      "role": "AGENT"
    },
    {
      "text": "No that's all",
      "role": "CUSTOMER"
    },
    {
      "text": "Thanks for calling. You have a nice day",
      "role": "AGENT"
    }
  ],
  "conversation_info": {
    "annotations": [
      {
        "annotation": {
          "conversation_summarization_suggestion": {
            "text_sections": [
              {
                "key": "Situation",
                "value": "Customer was unable to login to account"
              },
              {
                "key": "Action",
                "value": "Agent sent an email with password reset instructions"
              },
              {
                "key": "Outcome",
                "value": "Problem was resolved"
              }
            ]
          }
        }
      }
    ]
  }
}

Data transkrip percakapan

Data percakapan teks harus disediakan dalam file berformat JSON, dengan setiap file berisi data untuk satu percakapan. Berikut ini penjelasan format JSON yang diperlukan.

Percakapan

Objek tingkat atas untuk data percakapan.

Kolom Jenis Deskripsi
conversation_info ConversationInfo { } Opsional. Metadata untuk percakapan.
entries Entri [ ] Wajib. Pesan percakapan yang diurutkan secara kronologis.

ConversationInfo

Metadata untuk percakapan.

Kolom Jenis Deskripsi
kategori Kategori [ ] Opsional. Kategori kustom untuk data percakapan.

Kategori

Kategori data percakapan. Jika Anda memberikan kategori dengan data percakapan, kategori tersebut akan digunakan untuk mengidentifikasi topik dalam percakapan Anda. Jika Anda tidak memberikan kategori, sistem akan otomatis mengategorikan percakapan berdasarkan konten.

Kolom Jenis Deskripsi
display_name string Wajib. Nama tampilan untuk kategori.

Entri

Data untuk satu pesan percakapan.

Kolom Jenis Deskripsi
teks biasa string Wajib. Teks untuk pesan percakapan ini. Semua teks harus ditulis dengan huruf besar dengan benar. Kualitas model dapat terpengaruh secara signifikan jika semua huruf dalam teks menggunakan huruf besar atau huruf kecil. Error akan ditampilkan jika kolom ini dibiarkan kosong.
user_id bilangan bulat Opsional. Nomor yang mengidentifikasi peserta percakapan. Setiap peserta harus memiliki satu user_id, yang digunakan berulang kali jika mereka berpartisipasi dalam beberapa percakapan.
peran string Wajib. Peran peserta percakapan. Salah satu dari: "AGENT", "CUSTOMER".
start_timestamp_usec bilangan bulat Opsional jika percakapan hanya digunakan untuk bantuan FAQ, Saran Artikel, dan Ringkasan. Jika tidak, Wajib. Stempel waktu untuk awal giliran percakapan ini dalam mikrodetik.

Contoh

Berikut adalah contoh file data percakapan.

{
  "conversation_info":{
    "categories":[
      {
        "display_name":"Category 1"
      }
    ]
  },
  "entries": [
    {
      "start_timestamp_usec": 1000000,
      "text": "Hello, I'm calling in regards to ...",
      "role": "CUSTOMER",
      "user_id": 1
    },
    {
      "start_timestamp_usec": 5000000,
      "text": "Yes, I can answer your question ...",
      "role": "AGENT",
      "user_id": 2
    },
    ...
  ]
}

Mengupload percakapan ke Cloud Storage

Anda harus memberikan data percakapan dalam bucket Cloud Storage yang terdapat dalam project Google Cloud Platform Anda. Saat membuat bucket:

  • Pastikan Anda telah memilih project Google Cloud Platform yang digunakan untuk Dialogflow.
  • Gunakan Kelas Standard Storage.
  • Tetapkan lokasi bucket ke lokasi terdekat dengan lokasi Anda. Anda memerlukan ID lokasi (misalnya, us-west1) saat memberikan data percakapan, jadi catat pilihan Anda.
  • Anda juga memerlukan nama bucket saat memberikan data percakapan.

Ikuti petunjuk Mulai cepat Cloud Storage untuk membuat bucket dan mengupload file.