Agent Assist utilise l'adaptation de modèle Speech-to-Text pour améliorer la qualité de la transcription en reconnaissant certaines expressions plus fréquemment que d'autres. Cette page fournit un guide pour configurer l'adaptation du modèle pour la transcription Speech-to-Text.
Utiliser la console Speech-to-Text
Vous ne pouvez créer que des ensembles de phrases globaux avec la console Speech-to-Text. Les ensembles de phrases régionaux doivent être créés à l'aide de l'API Speech-to-Text.
- Dans la console Google Cloud, accédez à la page Speech-to-Text (Reconnaissance vocale). Accéder à la synthèse vocale
- Cliquez sur Adaptations du modèle.
- Cliquez sur add_boxNouvelle ressource.
- Choisissez la ressource Ensemble de phrases et la version de l'API V1, puis saisissez les expressions et les valeurs de boost, puis copiez le nom de l'ensemble de phrases.
- Cliquez sur Enregistrer.
- Accédez à la console Agent Assist.
- Cliquez sur Profils de conversation, puis sélectionnez le profil de conversation que vous souhaitez modifier.
- Accédez à la section Ensembles de phrases et collez le nom de l'ensemble de phrases.
Utiliser l'API Speech-to-Text
- Créez un script d'ensemble de phrases en suivant les instructions de reconnaissance vocale.
Exécutez le script Python suivant pour mettre à jour votre profil de conversation:
# Conversation Profile to update PROJECT_ID = "sample-project" LOCATION = "global" CONVERSATION_PROFILE_ID = "sample-conversation-profile" # Speech model adaptation resource names SPEECH_ADAPTATION_PHRASES = ["projects/sample-project/locations/global/phraseSets/sample-phrase-sets"]
import google.auth from google.auth.transport.requests import AuthorizedSession
scopes=['https://www.googleapis.com/auth/cloud-platform'] credentials, project = google.auth.default( scopes=scopes, quota_project_id=PROJECT_ID, ) session = AuthorizedSession(credentials)
profile_url = f"https://dialogflow.googleapis.com/v2beta1/projects/{PROJECT_ID}/locations/{LOCATION}/conversationProfiles/{CONVERSATION_PROFILE_ID}" get_response = session.get(profile_url) print("Checking for existing ConversationProfile...") print(get_response.status_code) print(get_response.json()) if get_response.status_code == 200: patch_response = session.patch( profile_url, params={ "updateMask": "sttConfig.phraseSets" }, json={ "sttConfig": { "phraseSets": SPEECH_ADAPTATION_PHRASES } } ) print("Updating ConversationProfile...") print(patch_response.status_code) print(patch_response.json())
Ensembles de phrases régionaux
Bien que l'adaptation du modèle Speech-to-Text ne soit disponible qu'en anglais (en-US
), vous pouvez configurer des ensembles de phrases pour d'autres régions linguistiques avec l'API Speech-to-Text. Cette fonctionnalité est particulièrement utile pour transcrire des conversations en anglais qui se déroulent dans ces régions.
Utilisez l'exemple de commande suivant pour créer des ensembles de phrases régionaux avec l'API Speech-to-Text.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ -H "X-Goog-User-Project: sample_project" \ -d @sample_phrase_sets.json \ "https://us-speech.googleapis.com/v1/projects/sample-project/locations/us/phraseSets"
Le fichier JSON @sample_phrase_sets.json
contient les contenus suivants des ensembles de phrases:
{ "parent": "projects/sample-project/locations/us", "phraseSetId": "sample-phrase-sets", "phraseSet": { "name": "sample-phrase-sets", "phrases": [ { "value": "Some phrase", "boost": 20 } ] } }
Région Dialogflow | Zone géographique pour Speech-to-Text |
---|---|
États-Unis us-central1 us-east1 us-east7 us-west1 northamerica-northeast1 northamerica-northeast2 |
us |
eu europe-west1 europe-west2 europe-west3 europe-west4 |
eu |
australia-southeast1 asia-northeast1 asia-south1 asia-southeast1 me-west1 global |
global |