대화 데이터 업로드

스마트 답장에서는 대화 데이터를 입력 값으로 허용하며 데이터를 사용하여 커스텀 응답 추천 모델을 학습시킵니다. 원하는 경우 자체 데이터를 제공하지 않고 Agent Assist에서 제공하는 대화 데이터를 사용해 기능 또는 통합을 테스트할 수 있습니다. 런타임 중에 스마트 답장을 사용하려면 고유한 대화 데이터를 제공해야 합니다.

이 페이지에서는 기존 데이터 세트를 사용하고 Cloud Storage에 업로드할 자체 데이터를 포맷하는 방법을 설명합니다. 대화 데이터는 JSON 형식의 텍스트 파일로 제공해야 합니다.

Agent Assist에서 제공하는 대화 데이터 사용(선택사항)

Agent Assist에서는 공개적으로 사용 가능한 대화 데이터와 이 데이터를 학습한 모델 및 허용 목록을 제공합니다. 이 리소스를 사용하면 자체 데이터를 제공할 필요 없이 대화 프로필을 만들어 기능을 테스트할 수 있습니다. 이 옵션을 사용하려면 대화 프로필 튜토리얼로 이동하고 다음 리소스를 사용하여 대화 프로필을 만들면 됩니다.

제공된 대화 데이터 세트는 외부 소스에서 파생되며 Google Cloud Storage 버킷 gs://smart_messaging_integration_test_data에 저장됩니다. 이 데이터에는 '예약', '레스토랑', '호텔', '관광', '택시', '기차'와 같은 6개 도메인을 다루는 작업 중심의 대화가 포함되어 있습니다. 이 데이터로 학습된 모델과 연결된 허용 목록은 다음 위치에서 찾을 수 있습니다.

  • 모델: projects/ccai-shared-external/conversationModels/c671dd72c5e4656f
  • 허용 목록: projects/ccai-shared-external/knowledgeBases/smart_messaging_kb/documents/NzU1MDYzOTkxNzU0MjQwODE5Mg

기능을 테스트하려면 먼저 다음 최종 사용자 메시지를 사용하여 응답을 트리거하는 것이 좋습니다.

  • '동쪽에 위치한 고급 숙소를 찾아주세요'
  • '태국 음식을 판매하는 고급 레스토랑을 찾습니다.'
  • '안녕하세요. 케임브리지 북부에서 무료 Wi-Fi를 제공하는 호텔이 필요합니다.'

대화 스크립트 데이터

텍스트 대화 데이터는 각 파일마다 단일 대화의 데이터가 포함된 JSON 형식의 파일로 제공되어야 합니다. 다음은 필수 JSON 형식을 설명합니다.

대화

대화 데이터의 최상위 객체입니다.

필드 유형 설명
conversation_info ConversationInfo { } 선택사항. 대화의 메타데이터입니다.
entries Entry [ ] 필수 항목입니다. 시간순으로 정렬된 대화 메시지입니다.

대화 정보

대화의 메타데이터입니다.

필드 유형 설명
categories Category [ ] 선택사항. 대화 데이터의 커스텀 카테고리입니다.

카테고리

대화 데이터 카테고리입니다. 대화 데이터와 함께 카테고리를 제공하면 대화의 주제를 식별하는 데 카테고리가 사용됩니다. 카테고리를 제공하지 않으면 시스템에서 콘텐츠에 따라 대화를 자동으로 분류합니다.

필드 유형 설명
display_name 문자열 필수 항목입니다. 카테고리의 표시 이름입니다.

항목

단일 대화 메시지의 데이터입니다.

필드 유형 설명
텍스트 문자열 필수 항목입니다. 이 대화 메시지의 텍스트입니다. 모든 텍스트를 대문자로 적절하게 표기해야 합니다. 텍스트의 모든 문자가 대문자이거나 소문자일 경우 모델 품질이 크게 영향을 받을 수 있습니다. 이 필드를 비워두면 오류가 반환됩니다.
user_id 정수 선택사항. 대화 참여자를 식별하는 번호입니다. 여러 대화에 참여하는 경우 참가자마다 반복적으로 사용하는 단일 user_id가 있어야 합니다.
role 문자열 필수 항목입니다. 대화 참여자 역할입니다. 'AGENT', 'CUSTOMER' 중 하나입니다.
start_timestamp_usec 정수 필수 항목입니다. 이 대화의 시작 타임스탬프가 마이크로초 단위로 표시됩니다.

예시

다음은 대화 데이터 파일의 예시입니다.

{
  "conversation_info":{
    "categories":[
      {
        "display_name":"Category 1"
      }
    ]
  },
  "entries": [
    {
      "start_timestamp_usec": 1000000,
      "text": "Hello, I'm calling in regards to ...",
      "role": "CUSTOMER",
      "user_id": 1
    },
    {
      "start_timestamp_usec": 5000000,
      "text": "Yes, I can answer your question ...",
      "role": "AGENT",
      "user_id": 2
    },
    ...
  ]
}

Cloud Storage에 대화 업로드

GCP 프로젝트에 포함된 Cloud Storage 버킷에 대화 데이터를 제공해야 합니다. 버킷을 만들려면 다음 안내를 따르세요.

  • Dialogflow에 사용할 GCP 프로젝트를 선택했는지 확인합니다.
  • 표준 스토리지 클래스를 사용합니다.
  • 버킷 위치를 자신과 가장 가까운 위치로 설정합니다. 대화 데이터를 제공할 때 위치 ID(예: us-west1)가 필요하므로 선택한 위치 ID를 기록합니다.
  • 대화 데이터를 제공할 때 버킷 이름도 필요합니다.

Cloud Storage 빠른 시작의 안내를 따라 버킷을 만들고 파일을 업로드합니다.