Os agentes de voz do Dialogflow usam a Speech-to-Text para reconhecimento de fala, que está incluída nos preços do Dialogflow. O Dialogflow seleciona automaticamente um modelo de reconhecimento de fala para você, mas você pode especificar o modelo.
Modelos disponíveis
Todos os modelos disponíveis estão listados em Modelos de Speech-to-Text. Selecione um modelo mais adequado ao seu domínio e que ofereça suporte ao idioma e aos recursos de fala do agente.
Se um modelo não for especificado explicitamente, o Dialogflow vai selecionar automaticamente um modelo com base na configuração de áudio nas solicitações de API e nas configurações do agente.
Se o modelo de fala aprimorado estiver ativado para o agente e não existir uma versão aprimorada do modelo especificado para o idioma, a fala será reconhecida usando a versão padrão do modelo especificado.Os modelos a seguir geralmente têm a melhor performance:
- telephony_short (melhor para o Dialogflow de telefonia)
- telefonia (melhor para o Agent Assist)
- phone_call (bom para o Agent Assist e o Dialogflow de telefonia)
- latest_short (melhor para Dialogflow não telefônico)
- command_and_search (melhor para idiomas em que outros modelos não estão disponíveis)
Especificar um modelo
É possível fornecer o modelo ao chamar os métodosdetectIntent
ou streamingDetectIntent
no tipo
Sessions
ou ao configurar o
ConversationProfile
para
Agent Assist.