Agent Assist usa la adaptación de modelos de Speech-to-Text para mejorar la calidad de la transcripción, ya que reconoce ciertas frases con más frecuencia que otras. En esta página, se proporciona una guía para configurar la adaptación del modelo para la transcripción de Speech-to-Text.
Usa la consola de Speech-to-Text
Solo puedes crear conjuntos de frases globales con la consola de Speech-to-Text. Los conjuntos de frases regionales se deben crear con la API de Speech-to-Text.
- En la consola de Google Cloud , ve a la página Speech-to-Text. Ir a Speech-to-Text
- Haz clic en Adaptaciones del modelo.
- Haz clic en add_boxRecurso nuevo.
- Elige el recurso Conjunto de frases y la versión de la API V1, completa las frases y los valores de refuerzo, y, luego, copia el nombre del conjunto de frases.
- Haz clic en Guardar.
- Navega a la consola de Agent Assist.
- Haz clic en Perfiles de conversación y, luego, elige el perfil de conversación que quieras editar.
- Ve a la sección Conjuntos de frases y pega el nombre del conjunto de frases.
Usa la API de Speech-to-Text
- Crea una secuencia de comandos de conjunto de frases siguiendo las instrucciones de reconocimiento de voz.
Ejecuta la siguiente secuencia de comandos de Python para actualizar tu perfil de conversación:
# Conversation Profile to update PROJECT_ID = "sample-project" LOCATION = "global" CONVERSATION_PROFILE_ID = "sample-conversation-profile" # Speech model adaptation resource names SPEECH_ADAPTATION_PHRASES = ["projects/sample-project/locations/global/phraseSets/sample-phrase-sets"]
import google.auth from google.auth.transport.requests import AuthorizedSession
scopes=['https://www.googleapis.com/auth/cloud-platform'] credentials, project = google.auth.default( scopes=scopes, quota_project_id=PROJECT_ID, ) session = AuthorizedSession(credentials)
profile_url = f"https://dialogflow.googleapis.com/v2beta1/projects/{PROJECT_ID}/locations/{LOCATION}/conversationProfiles/{CONVERSATION_PROFILE_ID}" get_response = session.get(profile_url) print("Checking for existing ConversationProfile...") print(get_response.status_code) print(get_response.json()) if get_response.status_code == 200: patch_response = session.patch( profile_url, params={ "updateMask": "sttConfig.phraseSets" }, json={ "sttConfig": { "phraseSets": SPEECH_ADAPTATION_PHRASES } } ) print("Updating ConversationProfile...") print(patch_response.status_code) print(patch_response.json())
Conjuntos de frases regionales
Si bien la adaptación del modelo de Speech-to-Text solo admite inglés (en-US
), puedes configurar conjuntos de frases para otras regiones de idiomas con la API de Speech-to-Text. Esto es particularmente útil cuando se transcriben conversaciones en inglés que tienen lugar en esas regiones.
Usa el siguiente comando de muestra para crear conjuntos de frases regionales con la API de Speech-to-Text.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ -H "X-Goog-User-Project: sample_project" \ -d @sample_phrase_sets.json \ "https://us-speech.googleapis.com/v1/projects/sample-project/locations/us/phraseSets"
El archivo json @sample_phrase_sets.json
contiene el siguiente contenido de los conjuntos de frases:
{ "parent": "projects/sample-project/locations/us", "phraseSetId": "sample-phrase-sets", "phraseSet": { "name": "sample-phrase-sets", "phrases": [ { "value": "Some phrase", "boost": 20 } ] } }
Región de Dialogflow | Región de Speech-to-Text |
---|---|
us us-central1 us-east1 us-east7 us-west1 northamerica-northeast1 northamerica-northeast2 |
us |
eu europe-west1 europe-west2 europe-west3 europe-west4 |
eu |
australia-southeast1 asia-northeast1 asia-south1 asia-southeast1 me-west1 global |
global |