Os agentes de voz do Dialogflow usam a Speech-to-Text para reconhecimento de fala, que está incluído nos preços do Dialogflow. O Dialogflow seleciona automaticamente um modelo de reconhecimento de fala, mas é possível especificar o modelo.
Modelos disponíveis
Todos os modelos disponíveis estão listados em Modelos de conversão de voz em texto. Selecione um modelo mais adequado ao seu domínio e compatível com os recursos de fala e linguagem do agente.
Se um modelo não for especificado explicitamente, o Dialogflow selecionará automaticamente um modelo com base na configuração de áudio nas solicitações de API e nas configurações do agente.
Se o modelo de fala aprimorado estiver ativado para o agente e não houver uma versão aprimorada do modelo especificado para o idioma, a fala será reconhecida usando a versão padrão do modelo especificado.Os modelos a seguir normalmente têm o melhor desempenho:
- telephony_short (melhor para o Dialogflow de telefonia)
- telefonia (melhor para o Agent Assist)
- phone_call (bom para Agent Assist e telefonia Dialogflow)
- mais recente_short (melhor para o Dialogflow que não é de telefonia)
- command_and_search (melhor para idiomas onde outros modelos não estão disponíveis)
Especificar um modelo
É possível fornecer o modelo ao chamar os métodosdetectIntent
ou streamingDetectIntent
no tipo
Sessions
ou ao configurar o
ConversationProfile
para o
Agent Assist.