Esta página se ha traducido con Cloud Translation API.

Configurar la adaptación de modelos de Speech-to-Text

Agent Assist usa la adaptación de modelos de Speech-to-Text para mejorar la calidad de la transcripción reconociendo determinadas frases con más frecuencia que otras. En esta página se ofrece una guía para configurar la adaptación de modelos para la transcripción de Speech-to-Text.

Usar la consola de Speech-to-Text

Solo puedes crear conjuntos de frases globales con la consola Speech-to-Text. Los conjuntos de frases regionales deben crearse con la API Speech-to-Text.

En la Google Cloud consola, ve a la página Speech-to-Text. Ir a Conversión de voz a texto
Haz clic en Adaptaciones del modelo.
Haz clic en add_boxNuevo recurso.
Elige el recurso Conjunto de frases y la versión de la API V1. A continuación, introduce las frases y los valores de impulso, y copia el nombre del conjunto de frases.
Haz clic en Guardar.
Ve a la consola de Asistente.
Haz clic en Perfiles de conversación y, a continuación, elige el perfil que quieras editar.
Vaya a la sección Conjuntos de frases y pegue el nombre del conjunto de frases.

Usar la API Speech-to-Text

Crea un script de conjunto de frases siguiendo las instrucciones de reconocimiento de voz.

Ejecuta la siguiente secuencia de comandos de Python para actualizar tu perfil de conversación:

# Conversation Profile to update
PROJECT_ID = "sample-project"
LOCATION = "global"
CONVERSATION_PROFILE_ID = "sample-conversation-profile"
# Speech model adaptation resource names
SPEECH_ADAPTATION_PHRASES = ["projects/sample-project/locations/global/phraseSets/sample-phrase-sets"]

import google.auth
from google.auth.transport.requests import AuthorizedSession

scopes=['https://www.googleapis.com/auth/cloud-platform']
credentials, project = google.auth.default(
  scopes=scopes,
  quota_project_id=PROJECT_ID,
)
session = AuthorizedSession(credentials)

profile_url = f"https://dialogflow.googleapis.com/v2beta1/projects/{PROJECT_ID}/locations/{LOCATION}/conversationProfiles/{CONVERSATION_PROFILE_ID}"
get_response = session.get(profile_url)
print("Checking for existing ConversationProfile...")
print(get_response.status_code)
print(get_response.json())
if get_response.status_code == 200:
  patch_response = session.patch(
     profile_url,
     params={
        "updateMask": "sttConfig.phraseSets"
     },
     json={
        "sttConfig": {
           "phraseSets": SPEECH_ADAPTATION_PHRASES
        }
     }
  )
  print("Updating ConversationProfile...")
  print(patch_response.status_code)
  print(patch_response.json())

Conjuntos de frases regionales

Aunque la adaptación de modelos de Speech-to-Text solo admite el inglés (en-US), puedes configurar conjuntos de frases para otras regiones de idiomas con la API Speech-to-Text. Esto resulta especialmente útil al transcribir conversaciones en inglés que tienen lugar en esas regiones.

Usa el siguiente comando de ejemplo para crear conjuntos de frases regionales con la API Speech-to-Text.

curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -H "X-Goog-User-Project: sample_project" \
    -d @sample_phrase_sets.json \
"https://us-speech.googleapis.com/v1/projects/sample-project/locations/us/phraseSets"

El archivo JSON @sample_phrase_sets.json contiene el siguiente contenido de los conjuntos de frases:

{
  "parent": "projects/sample-project/locations/us",
  "phraseSetId": "sample-phrase-sets",
  "phraseSet": {
    "name": "sample-phrase-sets",
    "phrases": [
      {
        "value": "Some phrase",
        "boost": 20
      }
    ]
  }
}

En el caso de un perfil de conversación en una sola región de Dialogflow, la siguiente tabla muestra la región de Speech-to-Text correspondiente en la que debes crear tu conjunto de frases.

Región de Dialogflow	Región de Speech-to-Text
us us-central1 us-east1 us-east7 us-west1 northamerica-northeast1 northamerica-northeast2	us
eu europe-west1 europe-west2 europe-west3 europe-west4	eu
australia-southeast1 asia-northeast1 asia-south1 asia-southeast1 me-west1 global	Mundial