Cloud Text-to-Speechbêta

Synthèse vocale basée sur le machine learning

Profiter d'un essai gratuit

Synthèse vocale haute fidélité

Google Cloud Text-to-Speech permet aux développeurs de synthétiser des discours naturels avec 30 voix différentes, dans plusieurs langues et variantes. L'outil applique les avancées révolutionnaires de DeepMind dans les puissants réseaux de neurones de Google et WaveNet afin d'offrir une excellente fidélité audio. Cette API facile à utiliser permet de créer des interactions réalistes avec vos utilisateurs dans de nombreuses applications et sur de nombreux appareils.

Synthèse vocale haute fidélité

Utilisez la synthèse vocale dès maintenant

Saisissez le texte de votre choix, choisissez une langue, puis cliquez sur "Synthétiser" pour écouter l'audio.

Solution basée sur le machine learning de Google

Cloud Text-to-Speech utilise des algorithmes de deep learning sophistiqués. Cette technologie basée sur les réseaux de neurones permet de synthétiser du texte en différentes voix et langues. Nos réseaux de neurones ont été conçus grâce à l'expérience de Google en matière de synthèse vocale.

Machine learning de Google

Accès exclusif aux voix WaveNet de DeepMind

DeepMind a réalisé des avancées révolutionnaires sur les modèles de machine learning, qui sont désormais capables d'imiter des voix humaines. Grâce à un rendu plus naturel, l'écart avec les performances humaines a été réduit de plus de 50 %. Cloud Text-to-Speech offre un accès exclusif à plusieurs voix WaveNet et continuera à en ajouter au fil du temps.

Voix WaveNet de DeepMind

Plus de 30 voix disponibles

Google Cloud Text-to-Speech offre une sélection de plus de 30 voix dans 14 langues et variantes, permettant ainsi aux développeurs de choisir la voix la plus adaptée à leur application.

Plus de 30 voix disponibles

Intégration facile aux applications et appareils existants

Cloud Text-to-Speech est compatible avec tous les appareils et applications qui peuvent envoyer des requêtes REST ou gRPC, tels que les téléphones, les ordinateurs, les tablettes et les appareils IdO (voitures, téléviseurs, haut-parleurs, etc.).

Intégration facile aux applications et appareils existants

Compatibilité avec les cas d'utilisation courants

Proposant une API facile à utiliser, Google Cloud Text-to-Speech est une solution flexible capable de créer des expériences naturelles adaptées à de nombreux cas d'utilisation. Elle permet par exemple d'automatiser les centres d'appels, d'offrir des réponses interactives via des appareils IdO et d'effectuer une synthèse vocale diffusée sous forme d'audio.

Compatibilité avec les cas d'utilisation courants

Fonctionnalités de Cloud Text-to-Speech

Solution multilingue
L'API est compatible avec plus de 30 voix et 14 langues et variantes, qui seront enrichies au fil du temps.
Voix WaveNet
Bénéficiez d'un accès multilingue exclusif aux voix WaveNet de DeepMind, qui offrent un rendu extrêmement naturel.
Texte et compatibilité SSML
Personnalisez votre discours en ajoutant des balises SSML. Ils vous permettent d'intégrer des pauses, des nombres, des dates et heures et d'autres instructions de prononciation.
Ajustement de la vitesse d'élocution
Ajustez la vitesse d'élocution pour obtenir un discours quatre fois plus lent ou plus rapide que la normale.
Réglage de la hauteur de voix
Augmentez ou réduisez la hauteur de la voix sélectionnée d'un maximum de 20 demi-tons par rapport au paramètre par défaut.
Contrôle du volume
Augmentez le volume de la sortie d'un maximum de 16 dB ou réduisez-le d'un maximum de 96 dB.
Flexibilité du format audio
Choisissez le format audio qui vous convient : mp3, Linear16 ou Ogg Opus.
Profils audioBÊTA
Optimisez la lecture pour le type de haut-parleur diffusant l'audio (casque ou ligne téléphonique, par exemple).

Tarifs de CLOUD Text-to-Speech

Synthèse vocale haute fidélité

Cloud Text-to-Speech est facturé par tranche d'un million de caractères texte traités, après une première tranche d'un million gratuite. Pour plus d'informations, consultez notre grille tarifaire.

Fonctionnalité Utilisation mensuelle gratuite Utilisation payante
Voix standard (hors WaveNet) 0 à 4 millions de caractères 4 $/1 million de caractères
Voix WaveNet 0 à 1 million de caractères 16 $/1 million de caractères
Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page relative aux SKU de Cloud Platform s'appliquent.
Un produit ou une fonctionnalité figurant sur cette page est en version bêta. Pour en savoir plus sur les étapes de lancement de nos produits, cliquez ici.

Envoyer des commentaires concernant…

Cloud Text-to-Speech API