Questa pagina è stata tradotta dall'API Cloud Translation.

Configurare l'adattamento del modello Speech-to-Text

Agent Assist utilizza l'adattamento del modello Speech-to-Text per migliorare la qualità della trascrizione riconoscendo alcune frasi più spesso di altre. Questa pagina fornisce una guida alla configurazione dell'adattamento del modello per la trascrizione di Speech-to-Text.

Utilizzo della console Speech-to-Text

Puoi creare solo set di frasi globali con la console Speech-to-Text. I set di frasi regionali devono essere creati utilizzando l'API Speech-to-Text.

Nella console Google Cloud , vai alla pagina Speech-to-Text. Vai a Speech-to-Text
Fai clic su Adattamenti del modello.
Fai clic su add_boxNuova risorsa.
Scegli la risorsa insieme di frasi e la versione dell'API V1, poi inserisci le frasi e i valori di incremento, quindi copia il nome dell'insieme di frasi.
Fai clic su Salva.
Vai alla console Agente Assist.
Fai clic su Profili conversazione, poi scegli il profilo conversazione che vuoi modificare.
Vai alla sezione Set di frasi e incolla il nome del set di frasi.

Usa l'API Speech-to-Text

Crea uno script del set di frasi seguendo le istruzioni per il riconoscimento vocale.

Esegui il seguente script Python per aggiornare il profilo della conversazione:

# Conversation Profile to update
PROJECT_ID = "sample-project"
LOCATION = "global"
CONVERSATION_PROFILE_ID = "sample-conversation-profile"
# Speech model adaptation resource names
SPEECH_ADAPTATION_PHRASES = ["projects/sample-project/locations/global/phraseSets/sample-phrase-sets"]

import google.auth
from google.auth.transport.requests import AuthorizedSession

scopes=['https://www.googleapis.com/auth/cloud-platform']
credentials, project = google.auth.default(
  scopes=scopes,
  quota_project_id=PROJECT_ID,
)
session = AuthorizedSession(credentials)

profile_url = f"https://dialogflow.googleapis.com/v2beta1/projects/{PROJECT_ID}/locations/{LOCATION}/conversationProfiles/{CONVERSATION_PROFILE_ID}"
get_response = session.get(profile_url)
print("Checking for existing ConversationProfile...")
print(get_response.status_code)
print(get_response.json())
if get_response.status_code == 200:
  patch_response = session.patch(
     profile_url,
     params={
        "updateMask": "sttConfig.phraseSets"
     },
     json={
        "sttConfig": {
           "phraseSets": SPEECH_ADAPTATION_PHRASES
        }
     }
  )
  print("Updating ConversationProfile...")
  print(patch_response.status_code)
  print(patch_response.json())

Set di frasi regionali

Sebbene l'adattamento del modello Speech-to-Text supporti solo l'inglese (en-US), puoi configurare i set di frasi per altre regioni linguistiche con l'API Speech-to-Text. Questa funzionalità è particolarmente utile per la trascrizione di conversazioni in inglese che si svolgono in queste regioni.

Utilizza il seguente comando di esempio per creare frasi regionali con l'API Speech-to-Text.

curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -H "X-Goog-User-Project: sample_project" \
    -d @sample_phrase_sets.json \
"https://us-speech.googleapis.com/v1/projects/sample-project/locations/us/phraseSets"

Il file JSON @sample_phrase_sets.json contiene i seguenti contenuti dei set di frasi:

{
  "parent": "projects/sample-project/locations/us",
  "phraseSetId": "sample-phrase-sets",
  "phraseSet": {
    "name": "sample-phrase-sets",
    "phrases": [
      {
        "value": "Some phrase",
        "boost": 20
      }
    ]
  }
}

Per un profilo di conversazione in una singola regione Dialogflow, la seguente tabella mostra la regione Speech-to-Text corrispondente in cui creare il set di frasi.

Regione Dialogflow	Regione Speech-to-Text
us us-central1 us-east1 us-east7 us-west1 northamerica-northeast1 northamerica-northeast2	us
eu europe-west1 europe-west2 europe-west3 europe-west4	eu
australia-southeast1 asia-northeast1 asia-south1 asia-southeast1 me-west1 global	globale