Esta página foi traduzida pela API Cloud Translation.

Configurar a adaptação do modelo da Speech-to-Text

O Agent Assist usa a adaptação de modelo do Speech-to-Text para melhorar a qualidade da transcrição, reconhecendo certas frases com mais frequência do que outras. Esta página oferece um guia para configurar a adaptação de modelo para transcrição do Speech-to-Text.

Usar o console da Speech-to-Text

Só é possível criar conjuntos de frases globais com o console do Speech-to-Text. Os conjuntos de frases regionais precisam ser criados usando a API Speech-to-Text.

No console Google Cloud , acesse a página Speech-to-Text. Acessar o Speech-to-Text
Clique em Adaptações de modelo.
Clique em add_boxNovo recurso.
Escolha o recurso Conjunto de frases e a versão da API V1. Em seguida, preencha as frases e os valores de reforço e copie o nome do conjunto de frases.
Clique em Salvar.
Acesse o console da Assistente de agente.
Clique em Perfis de conversa e escolha o perfil que você quer editar.
Acesse a seção Conjuntos de frases e cole o nome do conjunto.

Usar a API Speech-to-Text

Crie um script de conjunto de frases seguindo as instruções de reconhecimento de fala.

Execute o seguinte script Python para atualizar seu perfil de conversa:

# Conversation Profile to update
PROJECT_ID = "sample-project"
LOCATION = "global"
CONVERSATION_PROFILE_ID = "sample-conversation-profile"
# Speech model adaptation resource names
SPEECH_ADAPTATION_PHRASES = ["projects/sample-project/locations/global/phraseSets/sample-phrase-sets"]

import google.auth
from google.auth.transport.requests import AuthorizedSession

scopes=['https://www.googleapis.com/auth/cloud-platform']
credentials, project = google.auth.default(
  scopes=scopes,
  quota_project_id=PROJECT_ID,
)
session = AuthorizedSession(credentials)

profile_url = f"https://dialogflow.googleapis.com/v2beta1/projects/{PROJECT_ID}/locations/{LOCATION}/conversationProfiles/{CONVERSATION_PROFILE_ID}"
get_response = session.get(profile_url)
print("Checking for existing ConversationProfile...")
print(get_response.status_code)
print(get_response.json())
if get_response.status_code == 200:
  patch_response = session.patch(
     profile_url,
     params={
        "updateMask": "sttConfig.phraseSets"
     },
     json={
        "sttConfig": {
           "phraseSets": SPEECH_ADAPTATION_PHRASES
        }
     }
  )
  print("Updating ConversationProfile...")
  print(patch_response.status_code)
  print(patch_response.json())

Conjuntos de frases regionais

Embora a adaptação de modelos do Speech-to-Text seja compatível apenas com inglês (en-US), é possível configurar conjuntos de frases para outras regiões de idioma com a API Speech-to-Text. Isso é especialmente útil ao transcrever conversas em inglês que acontecem nessas regiões.

Use o exemplo de comando a seguir para criar conjuntos de frases regionais com a API Speech-to-Text.

curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -H "X-Goog-User-Project: sample_project" \
    -d @sample_phrase_sets.json \
"https://us-speech.googleapis.com/v1/projects/sample-project/locations/us/phraseSets"

O arquivo json @sample_phrase_sets.json contém o seguinte conteúdo dos conjuntos de frases:

{
  "parent": "projects/sample-project/locations/us",
  "phraseSetId": "sample-phrase-sets",
  "phraseSet": {
    "name": "sample-phrase-sets",
    "phrases": [
      {
        "value": "Some phrase",
        "boost": 20
      }
    ]
  }
}

Para um perfil de conversa em uma única região do Dialogflow, a tabela a seguir mostra a região correspondente do Speech-to-Text em que o conjunto de frases deve ser criado.

Região do Dialogflow	Região da Speech-to-Text
us us-central1 us-east1 us-east7 us-west1 northamerica-northeast1 northamerica-northeast2	us
eu europe-west1 europe-west2 europe-west3 europe-west4	eu
australia-southeast1 asia-northeast1 asia-south1 asia-southeast1 me-west1 global	global