대화 데이터 세트 만들기

대화 데이터 세트에는 대화 스크립트 데이터가 포함됩니다. 이 데이터는 스마트 답장 모델을 학습시키고 최종 사용자와 대화하는 상담사에게 텍스트 응답을 추천하는 데 사용됩니다. Agent Assist에서 사용할 수 있는 데이터 유형에 대한 자세한 내용은 데이터 개요 페이지를 참조하세요. 자체 데이터를 업로드하지 않고 API 통합 또는 기능을 테스트하려면 Agent Assist에서 제공하는 대화 데이터를 사용하면 됩니다.

시작하기 전에

  1. Dialogflow 설정의 안내에 따라 Google Cloud Platform(GCP) 프로젝트에서 Dialogflow를 사용 설정합니다.
  2. 프로젝트에 Data Labeling API를 사용 설정합니다.
  3. 이 튜토리얼을 시작하기 전에 Agent Assist 기본 페이지를 읽는 것이 좋습니다.
  4. (선택사항) 자체 데이터를 제공하지 않고 스마트 답장 기능을 테스트하려면 공개적으로 사용 가능한 대화 데이터 및 모델 사용에 대한 문서를 검토하세요. 이 옵션을 선택하면 공개적으로 제공되는 대화 데이터 세트 및 선행 학습된 모델을 사용해 바로 대화 프로필을 만들 수 있습니다.
  5. 자체 대화 데이터를 사용하여 스마트 답장을 구현하는 경우 스크립트가 지정된 형식JSON에 있고 Google Cloud Storage 버킷에 저장되어 있어야 합니다. 대화 데이터 세트에 30,000개 이상의 대화가 포함되어 있어야 합니다. 그렇지 않은 경우 모델 학습이 실패합니다. 일반적으로 대화가 많을수록 모델 품질이 향상됩니다. 메시지가 20개 미만이거나 대화 차례(참여자의 발언 기회 전환)가 3회 미만인 대화는 모두 삭제하는 것이 좋습니다. 최대한 많은 사용 사례에 적용되도록 적어도 3개월 간의 대화를 업로드하는 것이 좋습니다. 대화 데이터 세트의 최대 대화 수는 1,000,000개입니다.

  6. Agent Assist 콘솔로 이동합니다. GCP 프로젝트를 선택한 다음 페이지의 왼쪽 끝에 있는 데이터 메뉴 옵션을 클릭합니다.

    데이터 메뉴에 모든 데이터가 표시됩니다. 대화 데이터 세트 탭과 기술 자료 탭이 각각 1개씩 총 2개의 탭이 있습니다.

  7. 대화 데이터 세트 탭을 클릭한 후 대화 데이터 세트 페이지 오른쪽 상단에 있는 +새로 만들기 버튼을 클릭합니다.

대화 데이터 세트 만들기

  1. 새 대화 데이터 세트를 만들면 다음 페이지가 표시됩니다.

  2. 새 데이터 세트의 이름설명(선택사항)을 입력합니다. 대화 데이터 필드에 대화 스크립트가 포함된 스토리지 버킷의 URI를 입력합니다. Agent Assist는 와일드 카드 일치에 * 기호의 사용을 지원합니다. URI의 형식은 다음과 같아야 합니다.

    gs://<bucket name>/<object name>
    

    예를 들면 다음과 같습니다.

    gs://mydata/conversationjsons/conv0*.json
    gs://mydatabucket/test/conv.json
    
  3. 페이지 하단에 목표 드롭다운 메뉴가 있습니다.

    스마트 답장 모델을 학습시키는 데 데이터 세트를 사용하겠다는 확신이 들면 이를 선택하면 됩니다. 그렇지 않다면 데이터 세트를 모델 유형에 할당하지 않고 만들면 됩니다. 선택 후 만들기를 클릭합니다. 이제 새 데이터 세트가 대화 데이터 세트 탭의 데이터 메뉴 페이지에 있는 데이터 세트 목록에 표시됩니다.

다음 단계

Agent Assist 콘솔을 사용하여 하나 이상의 대화 데이터 세트로 스마트 답장 모델을 학습시킵니다.