Migration du modèle de synthèse vocale au 1er trimestre 2024

État de la migration

Depuis juillet 2024, aucun projet n'a été migré automatiquement. La migration automatique restera suspendue jusqu'à nouvel ordre (aucune date estimée).

Vous pouvez continuer à utiliser les modèles classiques de Speech-to-Text, mais nous vous encourageons à activer l'utilisation des modèles de synthèse vocale basés sur Conformer.

Présentation de la migration

Pour certaines combinaisons de codes de langue et de paramètres de synthèse vocale, le trafic des agents de conversation (Dialogflow CX) et de Dialogflow ES avec audio sera progressivement redirigé depuis les modèles de synthèse Speech-to-Text classiques derrière les identifiants de modèle command_and_search, default, phone_call et video vers les nouveaux modèles de synthèse vocale basés sur les conformeurs. Comme la redirection sera interne uniquement, les identifiants de modèle et le code actuels resteront valides et continueront de diffuser du trafic.

Les tableaux des sections Migration pour les tags de langue en et en-us et Migration pour les tags de langue de, en-au, en-gb, en-in, es, es-es, es-us, fr, fr-ca, fr-fr, it, ja, nl, pt-br montrent le routage des modèles de Speech-to-Text qui aura lieu lorsque la migration prendra effet. Si votre configuration correspond au tag de langue et aux deux premières colonnes du tableau, le nouvel identifiant de modèle est indiqué dans la troisième colonne. Aucune modification n'est attendue pour les autres configurations.

Consultez la section Options de migration pour choisir l'option la plus adaptée à vos besoins.

Migration des balises de langue en et en-us

Identifiant model actuel Paramètre single_utterance actuel * Identifiant du modèle vers lequel le trafic sera dirigé
command_and_search false latest_long
command_and_search true latest_short
default false telephony
phone_call false telephony
phone_call (model_variant n'est pas USE_STANDARD) true telephony_short
video false telephony
Non spécifié true/false Le modèle est sélectionné automatiquement parmi les options ci-dessus, en fonction des paramètres de InputAudioConfig.

Migration des balises de langue de, en-au, en-gb, en-in, es, es-es, es-us, fr, fr-ca, fr-fr, it, ja, nl et pt-br

Identifiant model actuel Paramètre single_utterance actuel * Identifiant du modèle vers lequel le trafic sera dirigé
command_and_search false latest_long
command_and_search true latest_short
default false latest_long
Non spécifié true/false Le modèle est sélectionné automatiquement parmi les options ci-dessus, en fonction des paramètres de InputAudioConfig.

Options de migration

Il existe trois options de migration: l'activation anticipée, l'activation automatique et la désactivation temporaire.

Activer et migrer plus tôt

Pour activer le modèle de manière proactive, remplacez l'identifiant de modèle de synthèse vocale que vous avez utilisé dans l'API Conversational Agents (Dialogflow CX) et l'API Dialogflow ES par l'identifiant mis à jour. Pour les agents de conversation (Dialogflow CX), vous pouvez également modifier l'identifiant du modèle dans les paramètres vocaux avancés sous Paramètres vocaux et IVR dans la console des agents de conversation (Dialogflow CX).

Le modèle de reconnaissance vocale spécifié dans l'API au moment de l'exécution prévaut sur le modèle de reconnaissance vocale spécifié dans la console des agents conversationnels (Dialogflow CX), sauf si vous activez le paramètre Ignorer le modèle de reconnaissance vocale au niveau de la requête. En savoir plus sur la priorité dans les modèles de reconnaissance vocale

Pour les intégrations téléphoniques de partenaires, vérifiez auprès de votre fournisseur de téléphonie si le modèle de synthèse vocale est défini dans l'API. Si vous utilisez la passerelle de téléphonie pour les agents de conversation (Dialogflow CX), consultez les limites du modèle de reconnaissance vocale.

La migration proactive de votre projet vous donne le temps de tester les modèles et de bénéficier d'une précision et d'une robustesse accrues plus tôt. Cette approche est vivement recommandée, en particulier si vous utilisez un modèle qui sera migrate vers les nouveaux modèles telephony et telephony_short. La plupart des intégrations nécessitent single_utterance = true. Par conséquent, si vous n'utilisez pas la sensibilité de fin de la parole basée sur un délai avancé, vous devrez probablement utiliser telephony_short ou latest_short.

Si vous rencontrez des problèmes avec les nouveaux modèles, ouvrez une demande d'assistance Google Cloud en indiquant les détails du problème.

Migrer automatiquement

Pour être migré automatiquement, aucune action n'est requise de votre part. Les identifiants de modèles Speech-to-Text existants sont valides et nous transférons le trafic en interne.

Désactiver et migrer plus tard

En raison de l'état de migration suspendu, les nouvelles demandes de désactivation ne sont pas acceptées. Si vous avez désactivé vos projets avant juillet 2024, ils resteront dans cet état jusqu'à nouvel ordre.