Agent Assist utilise l'adaptation de modèle Speech-to-Text pour améliorer la qualité de la transcription en reconnaissant certaines expressions plus fréquemment que d'autres. Cette page explique comment configurer l'adaptation de modèle pour la transcription Speech-to-Text.
Utiliser la console Speech-to-Text
Vous ne pouvez créer que des ensembles d'expressions globaux avec la console Speech-to-Text. Les ensembles d'expressions régionaux doivent être créés à l'aide de l'API Speech-to-Text.
- Dans la console Google Cloud , accédez à la page Speech-to-Text. Accéder à Speech-to-Text
- Cliquez sur Adaptations du modèle.
- Cliquez sur add_boxNouvelle ressource.
- Choisissez la ressource Ensemble de phrases et la version de l'API V1, puis saisissez les phrases et les valeurs de boost. Copiez ensuite le nom de l'ensemble de phrases.
- Cliquez sur Enregistrer.
- Accédez à la console Agent Assist.
- Cliquez sur Profils de conversation, puis sélectionnez le profil de conversation que vous souhaitez modifier.
- Accédez à la section Ensembles de phrases et collez le nom de l'ensemble de phrases.
Utiliser l'API Speech-to-Text
- Créez un script d'ensemble de phrases en suivant les instructions de reconnaissance vocale.
Exécutez le script Python suivant pour mettre à jour votre profil de conversation :
# Conversation Profile to update PROJECT_ID = "sample-project" LOCATION = "global" CONVERSATION_PROFILE_ID = "sample-conversation-profile" # Speech model adaptation resource names SPEECH_ADAPTATION_PHRASES = ["projects/sample-project/locations/global/phraseSets/sample-phrase-sets"]
import google.auth from google.auth.transport.requests import AuthorizedSession
scopes=['https://www.googleapis.com/auth/cloud-platform'] credentials, project = google.auth.default( scopes=scopes, quota_project_id=PROJECT_ID, ) session = AuthorizedSession(credentials)
profile_url = f"https://dialogflow.googleapis.com/v2beta1/projects/{PROJECT_ID}/locations/{LOCATION}/conversationProfiles/{CONVERSATION_PROFILE_ID}" get_response = session.get(profile_url) print("Checking for existing ConversationProfile...") print(get_response.status_code) print(get_response.json()) if get_response.status_code == 200: patch_response = session.patch( profile_url, params={ "updateMask": "sttConfig.phraseSets" }, json={ "sttConfig": { "phraseSets": SPEECH_ADAPTATION_PHRASES } } ) print("Updating ConversationProfile...") print(patch_response.status_code) print(patch_response.json())
Ensembles de phrases régionaux
Bien que l'adaptation de modèle Speech-to-Text ne soit compatible qu'avec l'anglais (en-US
), vous pouvez configurer des ensembles de phrases pour d'autres régions linguistiques avec l'API Speech-to-Text. Cela est particulièrement utile pour transcrire des conversations en anglais qui ont lieu dans ces régions.
Utilisez l'exemple de commande suivant pour créer des ensembles d'expressions régionaux avec l'API Speech-to-Text.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ -H "X-Goog-User-Project: sample_project" \ -d @sample_phrase_sets.json \ "https://us-speech.googleapis.com/v1/projects/sample-project/locations/us/phraseSets"
Le fichier JSON @sample_phrase_sets.json
contient les ensembles de phrases suivants :
{ "parent": "projects/sample-project/locations/us", "phraseSetId": "sample-phrase-sets", "phraseSet": { "name": "sample-phrase-sets", "phrases": [ { "value": "Some phrase", "boost": 20 } ] } }
Région Dialogflow | Région Speech-to-Text |
---|---|
us us-central1 us-east1 us-east7 us-west1 northamerica-northeast1 northamerica-northeast2 |
us |
eu europe-west1 europe-west2 europe-west3 europe-west4 |
eu |
australia-southeast1 asia-northeast1 asia-south1 asia-southeast1 me-west1 global |
global |