L'utilisation de Text-to-Speech est facturée mensuellement en fonction du nombre de caractères envoyés au service pour synthèse audio. Vous devez activer la facturation pour utiliser Text-to-Speech. Vous serez facturé automatiquement si votre utilisation dépasse le nombre de caractères gratuits autorisés par mois. Pour savoir comment effectuer le suivi du nombre total de caractères, consultez Surveiller l'utilisation de l'API. Le prix est calculé par caractère.
Le nombre total de caractères dans la chaîne d'entrée, y compris les espaces et les caractères de retour à la ligne, est comptabilisé pour la facturation. À l'exception de la balise <mark>, toutes les balises du langage de balisage de synthèse vocale (SSML) sont également incluses dans le nombre de caractères.
La dernière évolution de notre technologie Text-to-Speech, qui permet de contrôler de façon précise l'audio généré à l'aide de requêtes textuelles.
Modèle | Limite d'utilisation sans frais | Tarifs une fois la limite d'utilisation gratuite dépassée |
---|---|---|
Gemini 2.5 Flash TTS | Non disponible | Jetons d'entrée : 0,50 $ par million de jetons de texte (sku: 242A-EA16-C1EC) Jetons de sortie : 10 $ par million de jetons audio* (sku: 9228-79EF-B162) |
Gemini 2.5 Pro TTS | Non disponible | Jetons d'entrée : 1 $ par million de jetons de texte (sku: 8FF1-7E5B-5BB7) Jetons de sortie : 20 $ par million de jetons audio* (sku: DCF3-CB17-8262) |
* Les jetons audio correspondent à 25 jetons par seconde d'audio.
Basés sur nos LLM de pointe, nos derniers modèles de synthèse vocale offrent un niveau de réalisme et de résonance émotionnelle inégalé, et ce, dès le départ pour chaque cas d'utilisation.
Modèle | Limite d'utilisation sans frais | Tarifs une fois la limite d'utilisation gratuite dépassée |
---|---|---|
Voix Chirp 3 HD (sku:F977-2280-6F1B) | 0 à 1 million de caractères | 0,00003$par caractère (30$par million de caractères) |
Voix personnalisée instantanée (sku:A247-37D7-C094) | Non disponible | 0,00006$par caractère (60$par million de caractères) |
Modèle | Limite d'utilisation sans frais | Tarifs une fois la limite d'utilisation gratuite dépassée |
---|---|---|
Voix WaveNet (sku:9D01-5995-B545) | 0 à 4 millions de caractères | 0,000004$par caractère (4$par million de caractères) |
Voix Studio (sku:84AB-48C0-F9C3) | 0 à 1 million de caractères | 0,00016$par caractère (160$par million de caractères) |
Voix standard (sku:9D01-5995-B545) | 0 à 4 millions de caractères | 0,000004 $ par caractère (4 $ par million de caractères) |
Voix Neural2 (sku:FEBD-04B6-769B) | 0 à 1 million de caractères | 0,000016 $ par caractère (16 $ par million de caractères) |
Voix Polyglot (Preview) (sku:FEBD-04B6-769B) | 0 à 1 million de caractères | 0,000016 $ par caractère (16 $ par million de caractères) |
Remarque : Pour les voix WaveNet et Standard, le nombre de caractères sera égal ou inférieur au nombre d'octets représentés par le texte. Ce nombre inclut les caractères alphanumériques, les signes de ponctuation et les espaces blancs. Certains jeux de caractères utilisent plus d'un octet par caractère. Par exemple, un caractère japonais (ja-JP) au format UTF-8 nécessite généralement plusieurs octets. Dans ce cas, un seul caractère vous est facturé, et non plusieurs octets.
Si vous utilisez d'autres ressources Google Cloud conjointement avec Text-to-Speech (par exemple, des instances Google App Engine), l'utilisation de ces services vous sera facturée. Accédez au simulateur de coût Google Cloud pour calculer les coûts additionnels en fonction des tarifs en vigueur.