Speech-to-Text 모델 적응 설정

Agent Assist는 Speech-to-Text 모델 적응을 사용하여 특정 구문을 다른 구문보다 더 자주 인식하여 스크립트 작성 품질을 개선합니다. 이 페이지에서는 Speech-to-Text 스크립트 작성을 위한 모델 적응 설정 가이드를 제공합니다.

Speech-to-Text 콘솔 사용

Speech-to-Text 콘솔에서는 전역 문구 집합만 만들 수 있습니다. 지역 문구 세트는 Speech-to-Text API를 사용하여 만들어야 합니다.

  1. Google Cloud 콘솔에서 음성 텍스트 변환 페이지로 이동합니다. Speech-to-Text로 이동
  2. 모델 조정을 클릭합니다.
  3. add_box새 리소스를 클릭합니다.
  4. 문구 세트 리소스와 API 버전 V1을 선택한 다음 문구와 부스트 값을 입력하고 문구 세트 이름을 복사합니다.
  5. 저장을 클릭합니다.
  6. Agent Assist 콘솔로 이동합니다.
  7. 대화 프로필을 클릭한 다음 수정할 대화 프로필을 선택합니다.
  8. 문구 세트 섹션으로 이동하여 문구 세트 이름을 붙여넣습니다.

Speech-to-Text API 사용

  1. 음성 인식 안내에 따라 구문 세트 스크립트를 만듭니다.
  2. 다음 Python 스크립트를 실행하여 대화 프로필을 업데이트합니다.

    # Conversation Profile to update
    PROJECT_ID = "sample-project"
    LOCATION = "global"
    CONVERSATION_PROFILE_ID = "sample-conversation-profile"
    # Speech model adaptation resource names
    SPEECH_ADAPTATION_PHRASES = ["projects/sample-project/locations/global/phraseSets/sample-phrase-sets"]

    import google.auth from google.auth.transport.requests import AuthorizedSession

    scopes=['https://www.googleapis.com/auth/cloud-platform'] credentials, project = google.auth.default( scopes=scopes, quota_project_id=PROJECT_ID, ) session = AuthorizedSession(credentials)

    profile_url = f"https://dialogflow.googleapis.com/v2beta1/projects/{PROJECT_ID}/locations/{LOCATION}/conversationProfiles/{CONVERSATION_PROFILE_ID}" get_response = session.get(profile_url) print("Checking for existing ConversationProfile...") print(get_response.status_code) print(get_response.json()) if get_response.status_code == 200: patch_response = session.patch( profile_url, params={ "updateMask": "sttConfig.phraseSets" }, json={ "sttConfig": { "phraseSets": SPEECH_ADAPTATION_PHRASES } } ) print("Updating ConversationProfile...") print(patch_response.status_code) print(patch_response.json())

지역별 구문 세트

Speech-to-Text 모델 적응은 영어 (en-US)만 지원하지만 Speech-to-Text API를 사용하여 다른 언어 리전의 문구 세트를 구성할 수 있습니다. 이 기능은 해당 지역에서 이루어지는 영어 대화를 스크립트로 작성할 때 특히 유용합니다.

다음 샘플 명령어를 사용하여 Speech-to-Text API로 지역 구문 집합을 만듭니다.

curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -H "X-Goog-User-Project: sample_project" \
    -d @sample_phrase_sets.json \
"https://us-speech.googleapis.com/v1/projects/sample-project/locations/us/phraseSets"

json 파일 @sample_phrase_sets.json에는 다음과 같은 문구 세트 콘텐츠가 포함되어 있습니다.

{
  "parent": "projects/sample-project/locations/us",
  "phraseSetId": "sample-phrase-sets",
  "phraseSet": {
    "name": "sample-phrase-sets",
    "phrases": [
      {
        "value": "Some phrase",
        "boost": 20
      }
    ]
  }
}
단일 Dialogflow 리전의 대화 프로필의 경우 다음 표에 문구 세트를 만들 수 있는 해당 음성 텍스트 변환 리전이 표시됩니다.

Dialogflow 리전 Speech-to-Text 지역
us
us-central1
us-east1
us-east7
us-west1
northamerica-northeast1
northamerica-northeast2
미국
eu
europe-west1
europe-west2
europe-west3
europe-west4
eu
australia-southeast1
asia-northeast1
asia-south1
asia-southeast1
me-west1
global
전역