이 페이지는 Cloud Translation API를 통해 번역되었습니다.

Speech-to-Text 모델 적응 설정

Agent Assist는 Speech-to-Text 모델 적응을 사용하여 특정 구문을 다른 구문보다 더 자주 인식하여 스크립트 작성 품질을 개선합니다. 이 페이지에서는 Speech-to-Text 스크립트 작성을 위한 모델 적응 설정 가이드를 제공합니다.

Speech-to-Text 콘솔 사용

Speech-to-Text 콘솔에서는 전역 문구 집합만 만들 수 있습니다. 지역 문구 세트는 Speech-to-Text API를 사용하여 만들어야 합니다.

Google Cloud 콘솔에서 음성 텍스트 변환 페이지로 이동합니다. Speech-to-Text로 이동
모델 조정을 클릭합니다.
add_box새 리소스를 클릭합니다.
문구 세트 리소스와 API 버전 V1을 선택한 다음 문구와 부스트 값을 입력하고 문구 세트 이름을 복사합니다.
저장을 클릭합니다.
Agent Assist 콘솔로 이동합니다.
대화 프로필을 클릭한 다음 수정할 대화 프로필을 선택합니다.
문구 세트 섹션으로 이동하여 문구 세트 이름을 붙여넣습니다.

Speech-to-Text API 사용

음성 인식 안내에 따라 구문 세트 스크립트를 만듭니다.

다음 Python 스크립트를 실행하여 대화 프로필을 업데이트합니다.

# Conversation Profile to update
PROJECT_ID = "sample-project"
LOCATION = "global"
CONVERSATION_PROFILE_ID = "sample-conversation-profile"
# Speech model adaptation resource names
SPEECH_ADAPTATION_PHRASES = ["projects/sample-project/locations/global/phraseSets/sample-phrase-sets"]

import google.auth
from google.auth.transport.requests import AuthorizedSession

scopes=['https://www.googleapis.com/auth/cloud-platform']
credentials, project = google.auth.default(
  scopes=scopes,
  quota_project_id=PROJECT_ID,
)
session = AuthorizedSession(credentials)

profile_url = f"https://dialogflow.googleapis.com/v2beta1/projects/{PROJECT_ID}/locations/{LOCATION}/conversationProfiles/{CONVERSATION_PROFILE_ID}"
get_response = session.get(profile_url)
print("Checking for existing ConversationProfile...")
print(get_response.status_code)
print(get_response.json())
if get_response.status_code == 200:
  patch_response = session.patch(
     profile_url,
     params={
        "updateMask": "sttConfig.phraseSets"
     },
     json={
        "sttConfig": {
           "phraseSets": SPEECH_ADAPTATION_PHRASES
        }
     }
  )
  print("Updating ConversationProfile...")
  print(patch_response.status_code)
  print(patch_response.json())

지역별 구문 세트

Speech-to-Text 모델 적응은 영어 (en-US)만 지원하지만 Speech-to-Text API를 사용하여 다른 언어 리전의 문구 세트를 구성할 수 있습니다. 이 기능은 해당 지역에서 이루어지는 영어 대화를 스크립트로 작성할 때 특히 유용합니다.

다음 샘플 명령어를 사용하여 Speech-to-Text API로 지역 구문 집합을 만듭니다.

curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -H "X-Goog-User-Project: sample_project" \
    -d @sample_phrase_sets.json \
"https://us-speech.googleapis.com/v1/projects/sample-project/locations/us/phraseSets"

json 파일 @sample_phrase_sets.json에는 다음과 같은 문구 세트 콘텐츠가 포함되어 있습니다.

{
  "parent": "projects/sample-project/locations/us",
  "phraseSetId": "sample-phrase-sets",
  "phraseSet": {
    "name": "sample-phrase-sets",
    "phrases": [
      {
        "value": "Some phrase",
        "boost": 20
      }
    ]
  }
}

단일 Dialogflow 리전의 대화 프로필의 경우 다음 표에 문구 세트를 만들 수 있는 해당 음성 텍스트 변환 리전이 표시됩니다.

Dialogflow 리전	Speech-to-Text 지역
us us-central1 us-east1 us-east7 us-west1 northamerica-northeast1 northamerica-northeast2	미국
eu europe-west1 europe-west2 europe-west3 europe-west4	eu
australia-southeast1 asia-northeast1 asia-south1 asia-southeast1 me-west1 global	전역