Modelos de fala

Os agentes de voz do Dialogflow usam a Speech-to-Text para reconhecimento de fala, que está incluída nos preços do Dialogflow. O Dialogflow seleciona automaticamente um modelo de reconhecimento de fala, mas é possível especificar o modelo.

Modelos disponíveis

Todos os modelos disponíveis estão listados em Modelos de conversão de voz em texto. Selecione um modelo mais adequado ao seu domínio e compatível com os recursos de fala e idioma do agente.

Se um modelo não for especificado explicitamente, o Dialogflow selecionará automaticamente um modelo com base na configuração de áudio nas solicitações da API e nas configurações do agente.

Os modelos a seguir geralmente têm o melhor desempenho:

  • telephony_short (melhor para Dialogflow de telefonia)
  • telefonia (melhor para o Agent Assist) (também útil para Dialogflow de telefonia quando a sensibilidade avançada de fim de fala baseada em tempo limite estiver ativada)
  • phone_call (bom para o Agent Assist e o Dialogflow de telefonia)
  • last_short (melhor para Dialogflow não relacionados a telefonia)
  • command_and_search (melhor para idiomas em que outros modelos não estão disponíveis);

Especificar um modelo

É possível fornecer o modelo para um agente, fluxo ou página com a configuração de seleção de modelo.

Também é possível fornecer o modelo ao chamar os métodos Sessions.detectIntent ou Sessions.streamingDetectIntent.

Selecione um protocolo e uma versão para a referência de sessão:

Protocolo V3 V3beta1
REST Recurso da sessão Recurso da sessão
RPC (remote procedure call) Interface da sessão Interface da sessão
C++ SessionsClient Indisponível
C# SessionsClient Indisponível
Go SessionsClient Indisponível
Java SessionsClient SessionsClient
Node.js SessionsClient SessionsClient
PHP Indisponível Indisponível
Python SessionsClient SessionsClient
Ruby Indisponível Indisponível
ou ao configurar o ConversationProfile para o Agent Assist. Especificar o modelo em uma chamada de API de detecção de intent ou de perfil de conversa substitui todas as seleções de modelo aplicadas ao agente, fluxo ou página, a menos que você ative a configuração Modificar o modelo de fala no nível da solicitação.