Configura la adaptación de modelos de Speech-to-Text

Agent Assist usa la adaptación de modelos de Speech-to-Text para mejorar la calidad de la transcripción reconociendo ciertas frases con más frecuencia que otras. En esta página, se proporciona una guía para configurar la adaptación de modelos para la transcripción de Speech-to-Text.

Usa la consola de Speech-to-Text

Solo puedes crear conjuntos de frases globales con la consola de Speech-to-Text voz. Los conjuntos de frases regionales se deben crear con la API de Speech-to-Text.

  1. En la consola de Google Cloud, ve a la página Texto a voz. Ir a Texto a voz
  2. Haz clic en Adaptaciones de modelos.
  3. Haz clic en add_boxRecurso nuevo.
  4. Elige el recurso Conjunto de frases y la versión de la API V1, completa las frases y los valores de aumento, y copia el nombre del conjunto de frases.
  5. Haz clic en Guardar.
  6. Navega a la consola de Agent Assist.
  7. Haz clic en Perfiles de conversación y, luego, elige el perfil de conversación que quieras editar.
  8. Ve a la sección Conjuntos de frases y pega el nombre del conjunto de frases.

Usa la API de Speech-to-Text

  1. Sigue las instrucciones de reconocimiento de voz para crear una secuencia de comandos de conjunto de frases.
  2. Ejecuta la siguiente secuencia de comandos de Python para actualizar tu perfil de conversación:

    # Conversation Profile to update
    PROJECT_ID = "sample-project"
    LOCATION = "global"
    CONVERSATION_PROFILE_ID = "sample-conversation-profile"
    # Speech model adaptation resource names
    SPEECH_ADAPTATION_PHRASES = ["projects/sample-project/locations/global/phraseSets/sample-phrase-sets"]

    import google.auth from google.auth.transport.requests import AuthorizedSession

    scopes=['https://www.googleapis.com/auth/cloud-platform'] credentials, project = google.auth.default( scopes=scopes, quota_project_id=PROJECT_ID, ) session = AuthorizedSession(credentials)

    profile_url = f"https://dialogflow.googleapis.com/v2beta1/projects/{PROJECT_ID}/locations/{LOCATION}/conversationProfiles/{CONVERSATION_PROFILE_ID}" get_response = session.get(profile_url) print("Checking for existing ConversationProfile...") print(get_response.status_code) print(get_response.json()) if get_response.status_code == 200: patch_response = session.patch( profile_url, params={ "updateMask": "sttConfig.phraseSets" }, json={ "sttConfig": { "phraseSets": SPEECH_ADAPTATION_PHRASES } } ) print("Updating ConversationProfile...") print(patch_response.status_code) print(patch_response.json())

Conjuntos de frases regionales

Si bien la adaptación del modelo de Speech-to-Text solo admite inglés (en-US), puedes configurar conjuntos de frases para otras regiones lingüísticas con la API de Speech-to-Text. Esto es especialmente útil cuando se transcriben conversaciones en inglés que se llevan a cabo en esas regiones.

Usa el siguiente comando de muestra para crear conjuntos de frases regionales con la API de Speech-to-Text.

curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -H "X-Goog-User-Project: sample_project" \
    -d @sample_phrase_sets.json \
"https://us-speech.googleapis.com/v1/projects/sample-project/locations/us/phraseSets"

El archivo JSON @sample_phrase_sets.json contiene el siguiente contenido de los conjuntos de frases:

{
  "parent": "projects/sample-project/locations/us",
  "phraseSetId": "sample-phrase-sets",
  "phraseSet": {
    "name": "sample-phrase-sets",
    "phrases": [
      {
        "value": "Some phrase",
        "boost": 20
      }
    ]
  }
}
Para un perfil de conversación en una sola región de Dialogflow, la siguiente tabla muestra la región de Speech-to-Text voz correspondiente en la que debes crear tu conjunto de frases.

Región de Dialogflow Región de Speech-to-Text
us
us-central1
us-east1
us-east7
us-west1
northamerica-northeast1
northamerica-northeast2
us
eu
europe-west1
europe-west2
europe-west3
europe-west4
eu
australia-southeast1
asia-northeast1
asia-south1
asia-southeast1
me-west1
global
global