자동 음성 적응

인텐트 감지 요청을 수행할 때 선택적으로 음성 컨텍스트를 제공하여 음성 인식기에 힌트를 제공할 수 있습니다. 이러한 힌트는 특정 대화 상태에서 인식에 도움이 될 수 있습니다.

자동 음성 적응 기능은 모든 인텐트 감지 요청에 대해 자동으로 에이전트 항목, 학습 문구, 대화 상태를 음성 컨텍스트 힌트로 사용하여 에이전트의 음성 인식 정확성을 높입니다. 이 기능은 기본적으로 사용하도록 설정되어 있습니다.

자동 음성 적응 사용 또는 사용 중지

자동 음성 적응을 사용 또는 사용 중지하려면 다음 안내를 따르세요.

  1. Dialogflow 콘솔로 이동합니다.
  2. 왼쪽 사이드바 메뉴의 상단 근처에 있는 에이전트를 선택합니다.
  3. 에이전트 이름 옆에 있는 설정 버튼을 클릭합니다.
  4. 음성 탭을 선택합니다.
  5. 음성 인식 품질 개선 섹션으로 이동합니다.
  6. 자동 음성 적응 사용을 사용 또는 사용 중지로 전환합니다.

음성 인식 개선 예시

자동 음성 적응을 사용하면 에이전트 활용을 극대화할 수 있는 방법으로 에이전트를 빌드할 수 있습니다. 다음 예시는 에이전트를 변경하여 음성 인식을 어떻게 개선할 수 있는지 보여줍니다.

  1. @sys.number 시스템 항목을 사용하는 학습 문구를 정의할 때 최종 사용자가 'two'라고 말하면 이 음성은 'to', 'too', '2', 'two'로 인식될 수 있습니다. 자동 음성 적응이 사용 설정된 경우 음성 인식 중에 Dialogflow가 @sys.number 항목을 힌트로 사용하고, 매개변수가 'two' 또는 '2'로 인식됩니다.

  2. 예를 들어 'stuffy nose'가 포함된 학습 문구를 정의할 경우 발음이 비슷한 사용자 발화도 'stuff he knows'가 아니라 'stuffy nose'로 안정적으로 인식됩니다.

  3. 회사에서 제공되는 제품 또는 서비스 이름의 항목들을 정의하면 최종 사용자가 이러한 단어를 발화에서 언급할 때 단어의 인식 가능성이 더 높아집니다.

  4. 연속적이지만 고유한 숫자 항목이 있는 사용자 발화는 모호할 수 있습니다. 예를 들어 'I want two sixteen packs'는 16개 팩 2개 또는 팩 216개를 의미할 수 있습니다. 철자 값이 있는 항목을 설정하면 음성 적응이 이러한 경우를 명확하게 하는 데 도움이 될 수 있습니다.

    • 다음 항목이 있는 quantity 항목을 정의합니다.
      zero
      one
      ...
      twenty
    • 다음 항목이 있는 product 또는 size 항목을 정의합니다.
      sixteen pack
      two ounce
      ...
      five liter
    • 음성 적응에서는 항목 동의어만 사용되므로 참조 값 1 및 단일 동의어 one으로 항목을 정의하여 fulfillment 로직을 단순화할 수 있습니다.
  5. 정규 표현식 항목에서 자동 음성 적응을 사용할 수 있습니다. 이러한 특성을 함께 사용하여 영숫자 또는 숫자 시퀀스를 캡처할 수 있습니다.

    • ` ~ ! @ # $ % ^ & * ( ) - _ = + , . < > / ? ; ' : " [ ] { } \ |와 같은 특수문자 및 구두점은 지원되지 않습니다.
    • \s*\s?는 허용되지만 \s는 허용되지 않습니다.
    • 이러한 사양을 준수하지 않는 정규 표현식 객체 항목을 추가할 수 있습니다. 입력한 내용 중 하나 이상이 준수하는 한 자동 음성 조정을 활용할 수 있습니다.

    예를 들어 다음과 같은 정규 표현식을 사용하여 영숫자 시퀀스를 캡처할 수 있습니다.

    ^[A-Za-z0-9]{1,10}$
    ^WAC\d+$
    215[2-8]{3}[A-Z]+$
    [a-zA-Z]\s?[a-zA-Z]\s?[0-9]\s?[0-9]\s?[0-9]\s?[a-zA-Z]\s?[a-zA-Z]
    

    다음 정규 표현식은 숫자 시퀀스에 맞게 조정됩니다.

    \d{2,8}
    ^[0-9]+$
    2[0-9]{7}
    [2-9]\d{2}[0-8]{3}\d{4}
    

    또한 @sys.number-sequence를 사용하여 숫자 시퀀스를 수락하고 @sys.phone-number를 현지화된 전화 번호 인식기에 사용하는 것이 좋습니다.

제한사항

다음과 같은 제한사항이 적용됩니다.

  1. Dialogflow에 데이터를 전송하기 전 Actions on Google에 의해 음성 인식이 수행되기 때문에 Actions on Google(Google 어시스턴트)에서 자동 음성 적응은 작동하지 않습니다.

  2. 자동 음성 적응의 시스템 및 정규 표현식 항목에 대한 기본 제공 지원은 언어마다 다릅니다. 지원되는 언어는 음성 클래스 토큰 $OOV_CLASS_ALPHANUMERIC_SEQUENCE$OOV_CLASS_DIGIT_SEQUENCE를 참조하세요. 원하는 언어가 목록에 없는 경우 이러한 제한을 해결할 수 있습니다. 예를 들어 세 글자와 세 자리 숫자로 된 직원 ID를 정확하게 인식하려면 다음 항목 및 매개변수를 사용하여 에이전트를 빌드할 수 있습니다.

    • 10개 개체 항목(동의어 포함)이 포함된 digit 개체를 정의합니다.
      0, 0
      1, 1
      ...
      9, 9
    • 26개 개체 항목(동의어 포함)이 포함된 letter 개체를 정의합니다.
      A, A
      B, B
      ...
      Z, Z
    • 단일 개체 항목(동의어 제외)이 포함된 employee-id 개체를 정의합니다.
      @letter @letter @letter @digit @digit @digit
    • 학습 문구에서 @employee-id를 매개변수로 사용합니다.