Modelos de fala

Os agentes de voz do Dialogflow usam a Speech-to-Text para reconhecimento de fala, que está incluída nos preços do Dialogflow. O Dialogflow seleciona automaticamente um modelo de reconhecimento de fala para você, mas você pode especificar o modelo.

Modelos disponíveis

Todos os modelos disponíveis estão listados em Modelos de Speech-to-Text. Selecione um modelo mais adequado ao seu domínio e que ofereça suporte ao idioma e aos recursos de fala do agente.

Se um modelo não for especificado explicitamente, o Dialogflow vai selecionar automaticamente um modelo com base na configuração de áudio nas solicitações de API e nas configurações do agente.

Os modelos a seguir geralmente têm a melhor performance:

  • telephony_short (melhor para o Dialogflow de telefonia)
  • telefonia (melhor para o Agent Assist) (também é bom para o Dialogflow de telefonia quando a sensibilidade de fim de fala avançada com base no tempo limite está ativada)
  • phone_call (bom para o Agent Assist e o Dialogflow de telefonia)
  • latest_short (melhor para Dialogflow não telefônico)
  • command_and_search (melhor para idiomas em que outros modelos não estão disponíveis)

Especificar um modelo

É possível fornecer o modelo para um agente, fluxo ou página com a configuração de seleção de modelo.

Também é possível fornecer o modelo ao chamar os métodos Sessions.detectIntent ou Sessions.streamingDetectIntent.

Selecione um protocolo e uma versão para a referência de sessão:

Protocolo V3 V3beta1
REST Recurso da sessão Recurso da sessão
RPC (remote procedure call) Interface da sessão Interface da sessão
C++ SessionsClient Indisponível
C# SessionsClient Indisponível
Go SessionsClient Indisponível
Java SessionsClient SessionsClient
Node.js SessionsClient SessionsClient
PHP Indisponível Indisponível
Python SessionsClient SessionsClient
Ruby Indisponível Indisponível
ou ao configurar o ConversationProfile para o Agent Assist. Especificar o modelo em uma chamada de API de detecção de intent ou perfil de conversa vai substituir todas as seleções de modelo aplicadas ao agente, fluxo ou página, a menos que você ative a configuração Substituir modelo de voz no nível da solicitação.