Menyiapkan adaptasi model Speech-to-Text

Agent Assist menggunakan adaptasi model Speech-to-Text untuk meningkatkan kualitas transkripsi dengan lebih sering mengenali frasa tertentu daripada yang lain. Halaman ini memberikan panduan untuk menyiapkan adaptasi model untuk transkripsi Speech-to-Text.

Menggunakan konsol Speech-to-Text

Anda hanya dapat membuat kumpulan frasa global dengan konsol Speech-to-Text. Kumpulan frasa regional harus dibuat menggunakan Speech-to-Text API.

  1. Di konsol Google Cloud , buka halaman Speech-to-Text. Buka Speech-to-Text
  2. Klik Adaptasi Model.
  3. Klik add_boxNew Resource.
  4. Pilih resource Phrase set dan versi API V1, lalu isi frasa dan nilai boost, lalu salin nama phrase set.
  5. Klik Simpan.
  6. Buka konsol Agent Assist.
  7. Klik Conversation Profiles, lalu pilih profil percakapan yang ingin Anda edit.
  8. Buka bagian Kumpulan frasa dan tempel nama kumpulan frasa.

Menggunakan Speech-to-Text API

  1. Buat skrip kumpulan frasa dengan mengikuti petunjuk pengenalan ucapan.
  2. Jalankan skrip Python berikut untuk memperbarui profil percakapan Anda:

    # Conversation Profile to update
    PROJECT_ID = "sample-project"
    LOCATION = "global"
    CONVERSATION_PROFILE_ID = "sample-conversation-profile"
    # Speech model adaptation resource names
    SPEECH_ADAPTATION_PHRASES = ["projects/sample-project/locations/global/phraseSets/sample-phrase-sets"]

    import google.auth from google.auth.transport.requests import AuthorizedSession

    scopes=['https://www.googleapis.com/auth/cloud-platform'] credentials, project = google.auth.default( scopes=scopes, quota_project_id=PROJECT_ID, ) session = AuthorizedSession(credentials)

    profile_url = f"https://dialogflow.googleapis.com/v2beta1/projects/{PROJECT_ID}/locations/{LOCATION}/conversationProfiles/{CONVERSATION_PROFILE_ID}" get_response = session.get(profile_url) print("Checking for existing ConversationProfile...") print(get_response.status_code) print(get_response.json()) if get_response.status_code == 200: patch_response = session.patch( profile_url, params={ "updateMask": "sttConfig.phraseSets" }, json={ "sttConfig": { "phraseSets": SPEECH_ADAPTATION_PHRASES } } ) print("Updating ConversationProfile...") print(patch_response.status_code) print(patch_response.json())

Kumpulan frasa regional

Meskipun adaptasi model Speech-to-Text hanya mendukung bahasa Inggris (en-US), Anda dapat mengonfigurasi kumpulan frasa untuk wilayah bahasa lain dengan Speech-to-Text API. Hal ini sangat berguna saat mentranskripsikan percakapan bahasa Inggris yang terjadi di wilayah tersebut.

Gunakan contoh perintah berikut untuk membuat kumpulan frasa regional dengan Speech-to-Text API.

curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -H "X-Goog-User-Project: sample_project" \
    -d @sample_phrase_sets.json \
"https://us-speech.googleapis.com/v1/projects/sample-project/locations/us/phraseSets"

File json @sample_phrase_sets.json berisi konten kumpulan frasa berikut:

{
  "parent": "projects/sample-project/locations/us",
  "phraseSetId": "sample-phrase-sets",
  "phraseSet": {
    "name": "sample-phrase-sets",
    "phrases": [
      {
        "value": "Some phrase",
        "boost": 20
      }
    ]
  }
}
Untuk profil percakapan di satu region Dialogflow, tabel berikut menunjukkan region Speech-to-Text yang sesuai untuk membuat kumpulan frasa Anda.

Wilayah Dialogflow Wilayah Speech-to-Text
us
us-central1
us-east1
us-east7
us-west1
northamerica-northeast1
northamerica-northeast2
us
eu
europe-west1
europe-west2
europe-west3
europe-west4
eu
australia-southeast1
asia-northeast1
asia-south1
asia-southeast1
me-west1
global
global