Coût de création et de déploiement de modèles d'IA dans Vertex AI

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.

Vous n'êtes facturé que pour les requêtes qui renvoient un code de réponse 200. Les requêtes renvoyant d'autres codes de réponse, tels que les codes 4xx et 5xx, ne sont pas facturées pour l'entrée ou la sortie.

Cette page présente les tarifs de l'IA générative sur Vertex AI. Pour tous les autres tarifs de Vertex AI, y compris les services ML Platform et MLOps, consultez la page des tarifs de Vertex AI.

Modèles Google

Gemini 3

Modèle	Type	Prix (pour 1 million de jetons) <= 200 000 jetons d'entrée	Prix (par million de jetons) > 200 000 jetons d'entrée	Prix (pour 1 million de jetons) <= 200 000 jetons d'entrée mis en cache	Prix (par million de jetons) > 200 000 jetons d'entrée mis en cache	Prix (pour 1 million de jetons) <= 200 000 jetons d'entrée avec l'API par lots	Prix (pour 1 million de jetons) > 200 000 jetons d'entrée avec l'API par lot
Gemini 3 Pro (preview)
	Entrée (texte, image, vidéo, audio)	2 $	4 $	0,2 $	0,4 $	1 $	2 $
	Sortie textuelle (réponse et raisonnement)	12 $	18 $	N/A	N/A	6 $	9 $
	Sortie d'image**	120 $	N/A	N/A	N/A	60 $	N/A
Aperçu de Gemini 3 Flash
	Entrée (texte, image, vidéo)	0,5 $	0,5 $	0,05 $	0,05 $	0,25 $	0,25 $
	Entrée (audio)	1 $	1 $	0,1 $	0,1 $	0,5 $	0,5 $
	Sortie textuelle (réponse et raisonnement)	3 $	3 $	N/A	N/A	1,5 $	1,5 $
Ancrage avec la recherche Google et ancrage Web pour les entreprises	Inclut 5 000 requêtes de recherche par mois sans frais, agrégées sur tous les modèles Gemini 3. Les requêtes de recherche qui dépassent ces limites sont facturées 14$par tranche de 1 000 requêtes. Une requête envoyée par un client à Gemini peut générer une ou plusieurs requêtes adressées à la recherche Google (ou à l'ancrage Web pour Enterprise). Chaque requête de recherche individuelle effectuée vous sera facturée. La facturation commencera le 5 janvier 2026. Les jetons d'entrée fournis par l'ancrage avec la recherche Google ou l'ancrage Web pour les entreprises ne sont pas facturés. Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes ancrées par jour.
Ancrage avec Google Maps	Inclut 5 000 requêtes de recherche par mois sans frais, agrégées sur tous les modèles Gemini 3. Les requêtes Maps qui dépassent ces limites sont facturées 14$par tranche de 1 000 requêtes. Une requête envoyée par un client à Gemini peut générer une ou plusieurs requêtes à Google Maps. Vous serez facturé pour chaque requête individuelle exécutée. La facturation commencera le 5 janvier 2026 Les jetons d'entrée fournis par Google Maps ne sont pas facturés.
Ancrage basé sur vos données	2,50 $ par ensemble de 1 000 requêtes.

* Si le contexte d'entrée d'une requête dépasse 200 000 jetons, tous les jetons (entrée et sortie) sont facturés aux tarifs du contexte long.
** Une image de sortie 1K (1024 x 1024) et 2K (2048 x 2048) consomme 1 120 jetons de sortie d'image, soit l'équivalent de 0,134 $par image générée. Une image 4K (4 096 x 4 096) consomme 2 000 jetons de sortie d'image, soit l'équivalent de 0,24 $par image générée.

Gemini 2.5

Modèle	Type	Prix (pour 1 million de jetons) <= 200 000 jetons d'entrée	Prix (par million de jetons) > 200 000 jetons d'entrée	Prix (pour 1 million de jetons) <= 200 000 jetons d'entrée mis en cache	Prix (par million de jetons) > 200 000 jetons d'entrée mis en cache	Prix (pour 1 million de jetons) <= 200 000 jetons d'entrée avec l'API par lots	Prix (pour 1 million de jetons) > 200 000 jetons d'entrée avec l'API par lot
Gemini 2.5 Pro
	Entrée (texte, image, vidéo, audio)	1,25 $	2,5 $	0,125 $	0,250 $	0,625 $	1,25 $
	Sortie textuelle (réponse et raisonnement)	10 $	15 $	N/A	N/A	5 $	7,5 $
Gemini 2.5 Pro Utilisation sur ordinateur – Preview
	Entrée (texte, image, vidéo, audio)	1,25 $	2,5 $	N/A	N/A	N/A	N/A
	Sortie textuelle (réponse et raisonnement)	10 $	15 €	N/A	N/A	N/A	N/A
Gemini 2.5 Flash
	Entrée (texte, image, vidéo)	0,30 $	0,30 $	0,030 $	0,030 $	0,15 $	0,15 $
	Entrée audio	1 $	1 $	0,100 $	0,100 $	0,5 $	0,5 $
	Sortie textuelle (réponse et raisonnement)	2,50 $	2,50 $	N/A	N/A	1,25 $	1,25 $
	Sortie d'image***	30 $	30 $	N/A	N/A	15 $	15 $
API Gemini 2.5 Flash Live
	1 million de jetons de texte en entrée	0,5 $	0,5 $	N/A	N/A	N/A	N/A
	1 million de jetons audio en entrée	3 $	3 $	N/A	N/A	N/A	N/A
	1 million de jetons d'entrée vidéo/image	3 $	3 $	N/A	N/A	N/A	N/A
	1 million de jetons de texte en sortie	2 $	2 $	N/A	N/A	N/A	N/A
	1 million de jetons audio en sortie	12 $	12 $	N/A	N/A	N/A	N/A
Gemini 2.5 Flash Lite
	Entrée (texte, image, vidéo)	0,1 $	0,1 $	0,010 $	0,010 $	0,05 $	0,05 $
	Entrée audio	0,3 $	0,3 $	0,030 $	0,030 $	0,15 $	0,15 $
	Sortie textuelle (réponse et raisonnement)	0,4 $	0,4 $	N/A	N/A	0,2 $	0,2 $
Ancrage avec la recherche Google	Gemini 2.0 Flash, 2.5 Flash et 2.5 Flash-Lite incluent 1 500 requêtes ancrées combinées par jour sans frais supplémentaires. Gemini 2.5 Pro inclut 10 000 requêtes ancrées par jour sans frais supplémentaires. Les requêtes ancrées qui dépassent ces limites sont facturées 35$par tranche de 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google&ast;&ast;. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée. Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe de gestion de votre compte.
Ancrage Web pour entreprise	45$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes à l'ancrage Web pour les entreprises**. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée. Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes ancrées par jour.
Ancrage basé sur vos données	2,5 $ par tranche de 1 000 requêtes.
Ancrage avec Google Maps	25$pour 1 000 requêtes ancrées. Un prompt ancré est une requête envoyée à Gemini qui effectue au moins une requête à Google Maps.

* Si le contexte d'entrée d'une requête dépasse 200 000 jetons, tous les jetons (entrée et sortie) sont facturés aux tarifs du contexte long.
** L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL d'ancrage Web). Les frais d'utilisation du modèle Gemini s'appliquent séparément.
*** Une image de 1 024 x 1 024 consomme 1 290 jetons. Le nombre de jetons par image varie en fonction de la résolution de l'image. Pour en savoir plus sur le calcul des jetons, vous pouvez consulter notre documentation.
**** La facturation de l'utilisation de l'ordinateur utilise le SKU Gemini 2.5 Pro. Pour séparer les coûts d'utilisation de l'ordinateur, appliquez des tags de facturation. Pour en savoir plus, cliquez ici.

Facturation de la fenêtre de contexte de session LiveAPI : vous êtes facturé par tour pour tous les jetons présents dans la fenêtre de contexte de session. La fenêtre de contexte de la session inclut les nouveaux jetons (tour actuel) et tous les jetons accumulés lors des tours précédents. Cela signifie que les jetons des tours précédents sont retraités et pris en compte dans chaque nouveau tour, jusqu'à la taille de la fenêtre de contexte que vous avez configurée. Un "tour" correspond à une entrée utilisateur et à la réponse du modèle.
Mode audio proactif : lorsqu'il est activé, les jetons d'entrée sont facturés pendant que LiveAPI écoute. Les jetons de sortie ne sont facturés que lorsque l'API répond.
Lorsque la transcription audio en texte est activée, tous les jetons de texte générés pour la transcription sont facturés au tarif de sortie des jetons de texte.

Gemini 2.0

Gemini 2.0 est facturé en fonction des jetons. Pour calculer le nombre de jetons d'entrée dans votre requête avant de l'envoyer, vous pouvez utiliser le tokenizer du SDK ou l'API countTokens. Si votre requête échoue et renvoie une erreur 400 ou 500, les jetons utilisés ne vous seront pas facturés.

Utilisez le bouton bascule dans la grille tarifaire pour comparer la tarification basée sur les jetons et la tarification basée sur les modalités.

Tarification basée sur les jetons

Modèle	Type	Prix	Prix avec l'API Batch
Gemini 2.0 Flash
	1 million de jetons en entrée	0,15 $	0,075 $
	1 million de jetons audio en entrée	1,00 $	0,50 $
	1 million de jetons de texte de sortie	0,60 $	0,30 $
	Ajustement pour 1 million de jetons d'entraînement	3 $
Génération d'images avec Gemini 2.0 Flash
	1 million de jetons en entrée	0,15 $
	1 million de jetons audio en entrée	1,00 $
	1 million de jetons vidéo en entrée	3 $
	1 million de jetons de texte en sortie	0,60 $
	1 million de jetons d'image en sortie	$30.00
API Gemini 2.0 Flash Live
	1 million de jetons de texte en entrée	0,5 $
	1 million de jetons audio en entrée	3 $
	1 million de jetons d'entrée vidéo/image	3 $
	1 million de jetons de texte en sortie	2 $
	1 million de jetons audio en sortie	12 $
Gemini 2.0 Flash-Lite
	1 million de jetons en entrée	0,075 $	0,0375 $
	1 million de jetons audio en entrée	0,075 $	0,0375 $
	1 million de jetons de texte de sortie	0,30 $	0,15 $
	Ajustement pour 1 million de jetons d'entraînement	1,00 $
Ancrage avec la recherche Google	Gemini 2.0 Flash et 2.5 Flash incluent 1 500 requêtes ancrées par jour au total,sans frais supplémentaires. Les requêtes ancrées qui dépassent ces limites sont facturées 35$par tranche de 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée. Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe de gestion de votre compte.
Ancrage Web pour entreprise	45$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes à l'ancrage Web pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée. Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe de gestion de votre compte.
Ancrage basé sur vos données	2,5 $ pour 1 000 requêtes à partir du 16 juin 2025.
Ancrage avec Google Maps	Les modèles Gemini incluent un certain nombre de requêtes ancrées quotidiennes sans frais supplémentaires : Gemini Flash et Flash-Lite : 1 500 requêtes ancrées par jour au total. Gemini Pro : 10 000 requêtes ancrées par jour. Les requêtes ancrées qui dépassent ces limites sont facturées 25$par tranche de 1 000 requêtes ancrées. Un prompt ancré est une requête envoyée à Gemini qui effectue au moins une requête à Google Maps. Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe de gestion de votre compte.

Tarifs basés sur les modalités

Les tarifs des modalités ci-dessous sont basés sur des cas d'utilisation moyens et sont fournis à titre de référence uniquement. La facturation réelle sera basée uniquement sur les jetons :

4 caractères correspondent à environ 1 jeton de texte, y compris les espaces blancs.

Pour une image de 1 024 x 1 024, elle consomme 1 290 jetons. Le nombre de jetons par image varie en fonction de la résolution de l'image. Pour en savoir plus sur le calcul des jetons, vous pouvez consulter notre documentation.

L'entrée vidéo consomme 258 jetons par seconde à la fréquence d'échantillonnage d'une image par seconde. Une vidéo avec audio est facturée à la fois pour les jetons vidéo et les jetons audio.

L'entrée audio consomme 25 jetons par seconde sans horodatage.

Modèle	Type	Prix	Prix avec l'API Batch
Gemini 2.0 Flash
	Texte d'entrée (€/M de caractères)	0,0375 $	0,01875 $
	Image d'entrée ($/image)	0,0001935 $	0,00009675 $
	Vidéo d'entrée ($/s)	0,0000387 $	0,00001935 $
	Audio d'entrée ($/s)	0,000025 $	0,0000125 $
	Texte de sortie (€/M de caractères)	0,15 $	0,075 $
Génération d'images avec Gemini 2.0 Flash
	Texte d'entrée (€/M de caractères)	0,0375 $
	Image d'entrée ($/image)	0,0001935 $
	Vidéo d'entrée ($/s)	0,0000387 $
	Audio d'entrée ($/s)	0,000025 $
	Texte de sortie (€/M de caractères)	0,15 $
	Image de sortie ($/image)	0,04 $
Gemini 2.0 Flash Lite
	Texte d'entrée (€/M de caractères)	0,01875 $	0,009375 $
	Image d'entrée ($/image)	0,00009675 $	0,000048375 $
	Vidéo d'entrée ($/s)	0,00001935 $	0,000009675 $
	Audio d'entrée ($/s)	0,000001875 $	0,000000938 $
	Texte de sortie (€/M de caractères)	0,075 $	0,0375 $
Ancrage avec la recherche Google	Gemini 2.0 Flash et 2.5 Flash incluent 1 500 requêtes ancrées par jour au total,sans frais supplémentaires. Les requêtes ancrées qui dépassent ces limites sont facturées 35$par tranche de 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée. Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe de gestion de votre compte.
Ancrage Web pour entreprise	45$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes à l'ancrage Web pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée. Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe de gestion de votre compte.

* Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.
* Les jetons d'entraînement sont calculés en multipliant le nombre total de jetons dans votre ensemble de données d'entraînement par le nombre d'époques.
* Les PDF sont facturés comme des entrées d'image, une page de PDF équivalant à une image.
* Le point de terminaison du modèle réglé a le même prix de prédiction que le modèle de base.
* L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL d'ancrage issue du Web). Les frais d'utilisation du modèle Gemini s'appliquent séparément.
* API Gemini 2.0 Flash Live : 25 jetons par seconde d'audio (entrée/sortie), 258 jetons par seconde de vidéo (entrée). L'ancrage avec la recherche Google reste sans frais tant que l'API Gemini 2.0 Flash Live est en preview.

Facturation de la fenêtre de contexte de session LiveAPI : vous êtes facturé par tour pour tous les jetons présents dans la fenêtre de contexte de session. La fenêtre de contexte de la session inclut les nouveaux jetons (tour actuel) et tous les jetons accumulés lors des tours précédents. Cela signifie que les jetons des tours précédents sont retraités et pris en compte dans chaque nouveau tour, jusqu'à la taille de la fenêtre de contexte que vous avez configurée. Un "tour" correspond à une entrée utilisateur et à la réponse du modèle.
Lorsque la transcription audio en texte est activée, tous les jetons de texte générés pour la transcription sont facturés au tarif de sortie des jetons de texte.

Tarification de Vertex AI Model Optimizer (expérimental)*

L'optimiseur de modèle Vertex AI simplifie l'utilisation de Gemini pour les entreprises en fournissant un seul méta-point de terminaison pour les requêtes de modèle Gemini. Les clients qui utilisent ce service n'ont pas à spécifier s'ils souhaitent utiliser Flash, Pro ou une version spécifique. Au lieu de cela, ils fournissent simplement un paramètre configurable (coût, qualité ou équilibre) pour indiquer leurs préférences, et Model Optimizer applique le niveau d'intelligence approprié à la tâche en envoyant chaque requête au modèle le plus adapté.

Vertex AI Model Optimizer applique une tarification dynamique. Cela signifie que le prix moyen par jeton dépend du niveau d'intelligence du modèle appliqué pour effectuer la tâche. C'est pourquoi nous fournissons ci-dessous des exemples de tarification pour illustrer des scénarios probables en fonction de votre paramètre de configuration (voir les tableaux ci-dessous). Les SKU Model Optimizer sont des SKU à 1 $qui servent d'unité d'achat pour votre facturation. Vous êtes facturé à l'usage après avoir utilisé les modèles.

Rapport E/S de 5:1	Exemple 1 Chatbot	REMARQUE : Ces fourchettes ne sont pas garanties, et les résultats individuels des clients peuvent varier.
Préférence du client	Jetons d'entrée du client envoyés au modèle	Jetons de sortie client envoyés au MO	Prix moyen de l'entrée par million de jetons (fourchette haute)	Prix moyen de sortie par million de jetons (fourchette haute)	Prix moyen des entrées par million de jetons (fourchette basse)	Prix moyen de la sortie par million de jetons (fourchette basse)
Coût	10 000 000	2 000 000	0,63 $	2,50 $	0,16 $	0,63 $
Équilibré	10 000 000	2 000 000	1,26 $	5 $	0,63 $	2,50 $
Qualité	10 000 000	2 000 000	1,89 $	7,50 $	1,26 $	5 $

Rapport E/S de 1:20	Exemple 2 : Génération de contenu
Préférence du client	Jetons d'entrée du client envoyés au modèle	Jetons de sortie client envoyés au MO	Prix moyen de l'entrée par million de jetons (fourchette haute)	Prix moyen de sortie par million de jetons (fourchette haute)	Prix moyen des entrées par million de jetons (fourchette basse)	Prix moyen de la sortie par million de jetons (fourchette basse)
Coût	1 000 000	20 000 000	0,63 $	2,50 $	0,16 $	0,63 $
Équilibré	1 000 000	20 000 000	1,26 $	5 $	0,63 $	2,50 $
Qualité	1 000 000	20 000 000	1,89 $	7,50 $	1,26 $	5 $

* Model Optimizer est une offre expérimentale payante qui peut acheminer les requêtes vers des versions expérimentales de Gemini sur Vertex.

Autres modèles Gemini

Tous les modèles Gemini autres que Gemini 2.0 ou Gemini 2.5 sont facturés en fonction des modalités, comme le nombre de caractères, d'images ou de secondes de vidéo/d'audio. Les entrées de type texte sont facturées pour chaque tranche de 1 000 caractères d'entrée (requête) et pour chaque tranche de 1 000 caractères de sortie (réponse). Les caractères sont comptabilisés par points de code UTF-8, et les espaces sont exclus du décompte, ce qui donne environ quatre caractères par jeton. Les requêtes de prédiction qui aboutissent à des réponses filtrées ne sont facturées que pour l'entrée. À la fin de chaque cycle de facturation, les fractions de centime (0,01 $) sont arrondies à un centime. Les entrées de type média sont facturées par image ou par seconde (vidéo). Si votre requête échoue et renvoie une erreur 400 ou 500, les jetons utilisés ne vous seront pas facturés.

Modèle	Caractéristique	Type	Prix ( =< 128 000 jetons d'entrée)	Prix (plus de 128 000 jetons d'entrée)
Gemini 1.5 Flash	Multimodal	Entrée image Entrée vidéo Entrée textuelle Entrée audio	0,00002 $ par image 0,00002$par seconde 0,00001875$pour 1 000 caractères 0,000002$par seconde	0,00004 $ par image 0,00004$par seconde 0,0000375$pour 1 000 caractères 0,000004$par seconde
		Sortie textuelle	0,000075 $ pour 1 000 caractères	0,00015 $ pour 1 000 caractères
	Réglage*	Jeton de formation	8 $ / M de jetons
Gemini 1.5 Pro	Multimodal	Entrée image Entrée vidéo Entrée textuelle Entrée audio	0,00032875 $ par image 0,00032875$par seconde 0,0003125$pour 1 000 caractères 0,00003125$par seconde	0,0006575 $ par image 0,0006575$par seconde 0,000625$pour 1 000 caractères 0,0000625$par seconde
		Sortie textuelle	0,00125 $ pour 1 000 caractères	0,0025 $ pour 1 000 caractères
	Réglage*	Jeton de formation	80 $ / M de jetons
Gemini 1.0 Pro	Multimodal	Entrée image Entrée vidéo Entrée textuelle	0,0025 $ par image 0,002 $ par seconde 0,000125 $ pour 1 000 caractères
Gemini 1.0 Pro		Sortie textuelle	0,000375 $ pour 1 000 caractères
Ancrage avec la recherche Google	Texte	35$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée. Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes ancrées par jour.
Ancrage Web pour les entreprises	Texte	45$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes à l'ancrage Web pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée. Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes ancrées par jour.
Ancrage basé sur vos données	Texte	2,5 $ par tranche de 1 000 requêtes à partir du 16 juin 2025.

* Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.
* Si le contexte d'une requête dépasse 128 000 jetons, tous les jetons sont facturés au tarif du contexte long.
* Les modèles Gemini sont disponibles en mode par lot avec une remise de 50 %.
* Gemini 1.0 Pro ne prend en charge qu'une fenêtre de contexte de 32 000 jetons maximum.
* Les PDF sont facturés comme des entrées d'image, une page de PDF équivalant à une image.
* Le point de terminaison du modèle réglé a le même prix de prédiction que le modèle de base.
* L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL d'ancrage issue du Web). Les frais d'utilisation du modèle Gemini s'appliquent séparément.

Imagen

Avec Imagen sur Vertex AI, vous pouvez générer de nouvelles images ou modifier des images existantes sur la base de requêtes de texte que vous fournissez, modifier partiellement des images à l'aide d'une zone de masquage que vous définissez, et bien d'autres fonctionnalités encore.

Modèle	Fonctionnalité	Description	Entrée	Sortie	Prix
Imagen 4 Ultra	Génération d'images	Générer une image	Requête textuelle	Image	0,06 $ par image
Imagen 4	Augmentation de la résolution	Augmenter la résolution d'une image générée à 2K, 3K ou 4K	Image	Image	0,06 $ par image
Imagen 4	Génération d'images	Générer une image	Requête textuelle	Image	0,04 $ par image
Imagen 4 Fast	Génération d'images	Générer une image	Requête textuelle	Image	0,02 $ par image
Imagen 3	Génération d'images	Générer une image Modifier une image Personnaliser une image	Requête textuelle	Image	0,04 $ par image
Imagen 3 Fast	Génération d'images	Générer une image	Requête textuelle	Image	0,02 $ par image
Imagen 2, Imagen 1	Génération d'images	Générer une image	Requête textuelle	Images	0,020 $ par image
Imagen 2, Imagen 1	Édition d'images	Modifier une image par une approche avec masque ou sans masque	Image/Requête textuelle	Images	0,020 $ par image
Imagen 1	Augmentation de la résolution	Augmenter la résolution d'une image générée à 2k ou 4k	Images	Images	0,003 $ par image
Imagen 1	Affinage	Permettre l'utilisation d'un "sujet" fourni par l'utilisateur dans les requêtes Imagen (entraînement "few-shot")	Sujet(s) avec identifiant textuel et 4 à 8 images par sujet	Modèle affiné (après l'entraînement avec des sujets fournis par l'utilisateur)	$ par heure-nœud (tarifs d'entraînement personnalisé Vertex AI)
Imagen	Visual Captioning	Générer une légende textuelle courte ou longue pour une image	Images	Légende textuelle	0,0015 $ par image
Imagen	Questions/réponses visuelles	Fournir une réponse basée sur une question faisant référence à une image	Image/Requête textuelle	Réponse textuelle	0,0015 $ par image
Imagen	Recontextualisation du produit	Réinventez des produits dans une nouvelle scène	1 à 3 images du même produit et un prompt textuel décrivant la scène souhaitée	Image	0,12 $ par image
	Vertex Virtual Try-On	Créez des images de personnes portant différents vêtements	1 image d'une personne et 1 image de vêtements	Image	0,06 $ par image

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

Veo

Veo crée des vidéos d'une qualité incroyable dans une grande variété de sujets et de styles, en s'appuyant sur une meilleure compréhension des lois de la physique réelle et des nuances des mouvements et expressions humaines.

Modèle	Fonctionnalité	Description	Entrée	Sortie	Résolution de sortie	Prix
Veo 3.1	Génération de vidéos et d'audio	Générez des vidéos de haute qualité avec des effets sonores/vocaux synchronisés à partir d'un prompt textuel ou d'une image de référence	Requête textuelle/image	Vidéo et audio	720p, 1080p	0,40 $/seconde
	Génération de vidéos et d'audio	Générez des vidéos de haute qualité avec des effets sonores/vocaux synchronisés à partir d'un prompt textuel ou d'une image de référence	Requête textuelle/image	Vidéo et audio	4k	0,60 $/seconde
	Génération de vidéos	Générez des vidéos de haute qualité à partir d'un prompt textuel ou d'une image de référence.	Requête textuelle/image	Vidéo	720p, 1080p	0,20 $/seconde
	Génération de vidéos	Générez des vidéos de haute qualité à partir d'un prompt textuel ou d'une image de référence.	Requête textuelle/image	Vidéo	4k	0,40 $/seconde
Veo 3.1 Fast	Génération de vidéos et d'audio	Générez plus rapidement des vidéos avec des effets sonores/vocaux synchronisés à partir d'un prompt textuel ou d'une image de référence	Requête textuelle/image	Vidéo et audio	720p, 1080p	0,15 $/seconde
	Génération de vidéos et d'audio	Générez plus rapidement des vidéos avec des effets sonores/vocaux synchronisés à partir d'un prompt textuel ou d'une image de référence	Requête textuelle/image	Vidéo et audio	4k	0,35 $/seconde
	Génération de vidéos	Générez plus rapidement des vidéos à partir d'un prompt textuel ou d'une image de référence	Requête textuelle/image	Vidéo	720p, 1080p	0,10 $/seconde
	Génération de vidéos	Générez plus rapidement des vidéos à partir d'un prompt textuel ou d'une image de référence	Requête textuelle/image	Vidéo	4k	0,30 $/seconde
Veo 3	Génération de vidéos et d'audio	Générez des vidéos de haute qualité avec des effets sonores/vocaux synchronisés à partir d'un prompt textuel ou d'une image de référence	Requête textuelle/image	Vidéo et audio	720p, 1080p	0,40 $/seconde
Veo 3	Génération de vidéos	Générez des vidéos de haute qualité à partir d'un prompt textuel ou d'une image de référence.	Requête textuelle/image	Vidéo	720p, 1080p	0,20 $/seconde
Veo 3 Fast	Génération de vidéos et d'audio	Générez plus rapidement des vidéos avec des effets sonores/vocaux synchronisés à partir d'un prompt textuel ou d'une image de référence	Requête textuelle/image	Vidéo et audio	720p, 1080p	0,15 $/seconde
Veo 3 Fast	Génération de vidéos	Générez plus rapidement des vidéos à partir d'un prompt textuel ou d'une image de référence	Requête textuelle/image	Vidéo	720p, 1080p	0,10 $/seconde
Veo 2	Génération de vidéos	Générez des vidéos à partir d'un prompt textuel ou d'une image de référence	Requête textuelle/image	Vidéo	720p	0,50 $/seconde
Veo 2	Contrôles avancés	Générez des vidéos par interpolation des images de début et de fin, prolongez les vidéos générées et appliquez des commandes de caméra.	Requête textuelle/image/vidéo	Vidéo	720p	0,50 $/seconde

Lyria

Lyria 2 génère de la musique instrumentale de haute qualité, idéale pour les compositions sophistiquées et l'exploration créative détaillée où la nuance est essentielle.

Modèle	Fonctionnalité	Description	Entrée	Sortie	Prix
Lyria 2	Génération de musique	Générer de la musique à partir d'un prompt textuel	Requête textuelle	Musique	0,06 $ par tranche de 30 secondes

Comprendre les coûts d'embedding pour vos applications d'IA

Modèle	Type	Région	Prix par 1 000 jetons d'entrée
Embedding Gemini	Entrée	Monde	Requêtes en ligne : 0,00015 $ Requêtes par lot : 0,00012 $
Embedding Gemini	Sortie	Monde	Requêtes en ligne : sans frais Requêtes par lot : sans frais

Modèle	Type	Région	Prix par tranche de 1000 caractères
Embeddings pour le texte (à l'exclusion de Gemini Embedding)	Entrée	Globaux	Requêtes en ligne : 0,000025 $ Requêtes par lot : 0,00002 $
	Sortie	Monde	Requêtes en ligne : sans frais Requêtes par lot : sans frais

Modèle	Fonctionnalité	Description	Entrée	Sortie	Prix
multimodalembedding	Embeddings multimodaux : texte	Générer des représentations vectorielles continues en utilisant du texte comme entrée	Texte	Embeddings	0,0002 $ pour 1000 caractères d'entrée
	Embeddings multimodaux : image	Générer des représentations vectorielles continues en utilisant une image comme entrée	Images	Embeddings	0,0001 $ par image d'entrée
	Embeddings multimodaux : vidéo et plus	Vidéo Plus	Vidéo	Représentations vectorielles continues (jusqu'à 15 représentations vectorielles continues par minute de vidéo)	0,0020 $ par seconde de vidéo
	Embeddings multimodaux : vidéo Standard	Vidéo Standard	Vidéo	Représentations vectorielles continues (jusqu'à 8 représentations vectorielles continues par minute de vidéo)	0,0010 $ par seconde de vidéo
	Embeddings multimodaux : vidéo (essentiel)	Vidéo Essentiel	Vidéo	Représentations vectorielles continues (jusqu'à 4 représentations vectorielles continues par minute de vidéo)	0,0005 $ par seconde de vidéo

Modèle Open Source	Type	Prix par 1 000 jetons d'entrée
multilingual-e5-small	Entrée : Sortie : Entrée par lot : Sortie par lot :	Requêtes en ligne : 0,000015 $ Requêtes en ligne : sans frais Requêtes par lot : 0,0000075 $ Requêtes par lot : sans frais
multilingual-e5-large	Entrée : Sortie : Entrée par lot : Sortie par lot :	Requêtes en ligne : 0,000025 $ Requêtes en ligne : sans frais Requêtes par lot : 0,0000125 $ Requêtes par lot : sans frais

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

Tarifs de la complétion de code de Vertex AI

La prise en charge de l'IA générative sur Vertex AI est facturée pour chaque tranche de 1000 caractères d'entrée (requête) et pour chaque tranche de 1000 caractères de sortie (réponse). Les caractères sont comptabilisés avec les points de code UTF-8, et les espaces sont exclus du décompte. Pendant la phase de bêta, les frais sont réduits de 100 %. Les requêtes de prédiction qui aboutissent à des réponses filtrées ne sont facturées que pour l'entrée. À la fin de chaque cycle de facturation, les fractions de centime (0,01 $) sont arrondies à un centime.

Modèle	Type	Région	Prix par tranche de 1000 caractères
Codey pour la saisie de code	Entrée	Global	Requêtes en ligne : 0,00025 $
Codey pour la saisie de code	Sortie	Global	Requêtes en ligne : 0,0005 $

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

Traduction (texte)

Utilisez l'API Vertex AI et le LLM de traduction pour traduire du texte. Les traductions LLM ont tendance à être plus fluides et à sonner plus naturelles que celles des modèles de traduction classiques, mais elles sont disponibles dans moins de langues (en savoir plus).

Modèle	Méthode	Utilisation	Prix par million de caractères
LLM	Texte traduit^*	Nombre de caractères d'entrée par mois	10 $ par million de caractères^*
	Texte traduit^*	Nombre de caractères de sortie par mois	10 $ par million de caractères^*

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.
^* Le prix est calculé en fonction du nombre de caractères traités par le modèle. Pour en savoir plus sur le comptage de caractères, consultez la section Caractères facturés.

Prix du stockage du cache de contexte pour la mise en cache explicite

Modèle	Caractéristique	Type	Prix (par million de jetons) <= 200 000 jetons en entrée	Prix (pour 1 million de jetons) > 200 000 jetons d'entrée
Gemini 3 Pro	Stockage du cache de contexte	Entrée (texte, image, vidéo, audio)	4,5 $ (par million de jetons/heure)	4,5 $ (par million de jetons/heure)
Gemini 2.5 Pro	Stockage du cache de contexte	Entrée (texte, image, vidéo, audio)	4,5 $ (par million de jetons/heure)	4,5 $ (par million de jetons/heure)
Gemini 2.0 Flash	Stockage du cache de contexte	Entrée (texte, image, vidéo, audio)	1 $ (/M jetons/h)	1 $ (/M jetons/h)
Gemini 2.5 Flash Lite	Stockage du cache de contexte	Entrée (texte, image, vidéo, audio)	1 $ (/M jetons/h)	1 $ (/M jetons/h)

Modèles Gemini 2.0

Tarification basée sur les jetons

Modèle	Type	Stockage (M tok-heure)	Prix
Gemini 2.0 Flash
	1 million de jetons en entrée	1,00 $	0,0375 $
	1 million de jetons audio en entrée	1,00 $	0,25 $
	1 million de jetons de texte de sortie	N/A	N/A
Gemini 2.0 Flash Lite
	1 million de jetons en entrée	1,00 $	0,01875 $
	1 million de jetons audio en entrée	1,00 $	0,01875 $
	1 million de jetons de texte de sortie	N/A	N/A

Tarifs basés sur les modalités

Les tarifs des modalités ci-dessous sont basés sur des cas d'utilisation moyens et sont fournis à titre de référence uniquement. La facturation réelle sera basée uniquement sur les jetons :

4 caractères correspondent à environ 1 jeton de texte, y compris les espaces blancs.

L'entrée audio consomme 25 jetons par seconde sans horodatage.

Modèle	Type	Stockage (heures de modalité)	Prix
Gemini 2.0 Flash
	Texte d'entrée (€/M de caractères)	0,25 $	0,009375 $
	Image d'entrée ($/image)	0,00129 $	0,000048375 $
	Vidéo d'entrée ($/s)	0,000258 $	0,000009675 $
	Audio d'entrée ($/s)	0,000025 $	0,00000625 $
	Texte de sortie (€/M de caractères)	N/A	N/A
Gemini 2.0 Flash-Lite
	Texte d'entrée (€/M de caractères)	0,25 $	0,0046875 $
	Image d'entrée ($/image)	0,00129 $	0,0000241875 $
	Vidéo d'entrée ($/s)	0,000258 $	0,000009675 $
	Audio d'entrée ($/s)	0,000258 $	0,0000048375 $
	Texte de sortie (€/M de caractères)	N/A	N/A
Ancrage avec la recherche Google	Gemini 2.0 Flash inclut jusqu'à 1 500 requêtes ancrées par jour sans frais supplémentaires. Les requêtes ancrées au-delà de 1 500 par jour sont facturées 35 $par tranche de 1 000 requêtes (jusqu'à 1 million de requêtes par jour). Si vous avez besoin de plus d'un million de requêtes par jour, veuillez contacter l'équipe de gestion de votre compte.
Ancrage Web pour entreprise	45 $ par tranche de 1 000 requêtes (jusqu'à 1 million de requêtes par jour) à partir du 5 mai 2025. Si vous avez besoin de plus d'un million de requêtes par jour, veuillez contacter l'équipe de gestion de votre compte.

* Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.
* Les PDF sont facturés comme des entrées d'image, une page de PDF équivalant à une image.
* Le point de terminaison du modèle réglé a le même prix de prédiction que le modèle de base.
* L'ancrage avec la recherche Google n'est facturé que pour les requêtes qui renvoient des résultats contenant au moins une URL d'ancrage issue du Web. Les frais d'utilisation standards du modèle Gemini s'appliquent également.

Débit provisionné

Le débit provisionné assure un débit pour vos besoins en IA générative et est géré par le biais d'unités de scaling pour l'IA générative, ou GSU. Pour en savoir plus sur le débit fourni par chaque GSU, cliquez ici. Vous pouvez également utiliser notre outil d'estimation en ligne ici.

Durée	Prix par GSU	Par
Engagement d'une semaine	1 200 $	Semaine
Engagement d'un mois	2 700 $	Mois
Engagement de 3 mois	2 400 $	Mois
Engagement sur un an	2 000 $	Mois

Exemple de calcul des coûts

Un utilisateur doit s'assurer qu'il peut gérer 10 requêtes par seconde (RPS) avec une entrée de 1 000 jetons de texte et 500 jetons audio,et recevoir une sortie de 300 jetons de texte en utilisant gemini-2.0-flash.

En utilisant le tableau des débits et des taux d'utilisation, nous savons que pour gemini-2.0-flash, le taux d'utilisation d'un jeton de texte en entrée est de 1 jeton, celui d'un jeton audio en entrée est de 7 jetons et celui d'un jeton de texte en sortie est de 4 jetons.

Le nombre total de jetons d'entrée de l'utilisateur est de 1 000* (1 jeton par jeton de texte d'entrée) + 500* (7 jetons par jeton audio d'entrée) = 4 500 jetons d'entrée ajustés. Le nombre total de jetons de sortie de l'utilisateur est de 300* (4 jetons par jeton de texte de sortie) = 1 200 jetons de sortie ajustés par épuisement. En les additionnant, nous obtenons 4 500 jetons d'entrée ajustés pour l'épuisement + 1 200 jetons de sortie ajustés pour l'épuisement = 5 700 jetons au total par requête.

En multipliant le nombre total de jetons par requête par le nombre de RPS, nous obtenons 5 700 jetons au total par requête × 10 RPS = 57 000 jetons au total par seconde.

En divisant ce nombre par le débit total par seconde par GSU,nous obtenons 57 000 jetons au total par seconde ÷ 3 360 jetons par seconde par GSU = 16,96 GSU. L'incrément minimal d'achat de GSU pour ce modèle est de 1. L'utilisateur aurait donc besoin de 17 GSU.

Si l'utilisateur souhaitait maintenir ce débit pendant une semaine, cela lui coûterait 1 200 $ * 17 GSU = 20 400 $par semaine. S'ils souhaitaient maintenir ce débit pendant un mois, cela leur coûterait 2 700 $ * 17 GSU = 45 900 $par mois. S'ils souhaitaient maintenir ce débit pendant trois mois, cela leur coûterait 2 400 $ * 17 GSU = 40 800 $par mois. Enfin, s'ils souhaitaient maintenir ce débit pendant un an, cela leur coûterait 2 000 $ * 17 GSUs = 34 000 $par mois.

Réglage des modèles

Le réglage de modèle est un moyen efficace de personnaliser les modèles volumineux pour vos tâches. Il s'agit d'une étape clé pour améliorer la qualité et l'efficacité du modèle. Le réglage du modèle offre les avantages suivants :

Une qualité supérieure pour vos tâches spécifiques
Robustesse accrue du modèle
Réduction de la latence et du coût d'inférence grâce à des requêtes plus courtes

Le réglage est facturé par million de jetons d'entraînement. Les jetons d'entraînement sont calculés en multipliant le nombre total de jetons dans votre ensemble de données d'entraînement par le nombre d'époques. Pour l'inférence de modèle, le point de terminaison du modèle Gemini réglé a le même prix de prédiction que le modèle de base.

Modèle	Type	Prix (pour 1 million de jetons d'entraînement)
Gemini 2.5 Pro	Réglage supervisé	25 $
Gemini 2.0 Flash	Affinage supervisé Réglage des préférences	5 $
Gemini 2.5 Flash Lite	Affinage supervisé Réglage des préférences	1,5 $
Gemma 3 27B IT	Réglage supervisé	6,83 $
Llama 3.1 8B	Réglage supervisé	0,67 $
Llama 3.2 1B	Réglage supervisé	0,28 $
Llama 3.2 3B	Réglage supervisé	0,61 $
Llama 3.3 70B	Réglage supervisé	6,72 $
Llama 4 Scout 17B 16E	Réglage supervisé	5,77 $
Qwen 3 32B	Réglage supervisé	6,57 $

* Les jetons d'entraînement sont calculés en multipliant le nombre total de jetons dans votre ensemble de données d'entraînement par le nombre d'époques.
* Le prix des prédictions pour un point de terminaison de modèle Gemini réglé est le même que pour le modèle de base.

Comparer les tarifs des modèles partenaires sur Vertex AI

Les modèles partenaires sont une liste organisée de modèles d'IA générative développés par les partenaires Google. Les modèles partenaires sont proposés en tant qu'API gérées. Pour en savoir plus, consultez la présentation des modèles partenaires. Les sections suivantes présentent les détails de tarification des modèles de partenaires Google.

Modèles d'AI21 Labs

Modèle	Tarifs
Jamba 1.5 Large (obsolète)	Entrée : 2 $ par million de jetons Sortie : 8 $ par million de jetons
Jamba 1.5 Mini (obsolète)	Entrée : 0,20 $ par million de jetons Sortie : 0,40 $ par million de jetons

Modèles Claude d'Anthropic

Modèles avec des tarifs régionaux

Monde

Modèle	Prix (par million de jetons) < 200 000 jetons en entrée	Prix (par million de jetons) >= 200 000 jetons d'entrée
Claude Opus 4.5	Entrée : 5 $ Sortie : 25 $ Entrée par lot : 2,50 $ Sortie par lot : 12,50 $ Écriture dans le cache (5 min) : 6,25 $ Écriture dans le cache (1 h) : 10 $ Accès au cache : 0,50 $ Écriture dans le cache par lot (5 min) : 3,125 $ Écriture dans le cache par lot (1 h) : 5 $ Accès au cache par lot : 0,25 $
Claude Sonnet 4.5	Entrée : 3 $ Sortie : 15 $ Entrée par lot : 1,50 $ Sortie par lot : 7,50 $ Écriture dans le cache (5 min) : 3,75 $ Écriture dans le cache (1 h) : 6 $ Accès au cache : 0,30 $ Écriture dans le cache par lot (5 min) : 1,88 $ Écriture dans le cache par lot (1 h) : 3 $ Accès au cache par lot : 0,15 $	Entrée : 6 $ Sortie : 22,50 $ Écriture dans le cache de 5 m : 7,50 $ Écriture dans le cache d'1 h : 12 $ Accès au cache : 0,60 $
Claude Haiku 4.5	Entrée : 1 $ Sortie : 5 $ Entrée par lot : 0,50 $ Sortie par lot : 2,50 $ Écriture dans le cache (5 min) : 1,25 $ Écriture dans le cache (1 h) : 2 $ Accès au cache : 0,10 $ Écriture dans le cache par lot (5 min) : 0,625 $ Écriture dans le cache par lot (1 h) : 1 $ Accès au cache par lot : 0,05 $

us-east5

Modèle	Prix (par million de jetons) < 200 000 jetons en entrée	Prix (par million de jetons) >= 200 000 jetons d'entrée
Claude Opus 4.5	Entrée : 5,50 $ Sortie : 27,50 $ Entrée par lot : 2,75 $ Sortie par lot : 13,75 $ Écriture dans le cache pendant 5 min : 6,875 $ Écriture dans le cache pendant 1 h : 11 $ Accès au cache : 0,55 $ Écriture dans le cache par lot pendant 5 min : 3,438 $ Écriture dans le cache par lot pendant 1 h : 5,50 $ Accès au cache par lot : 0,275 $
Claude Sonnet 4.5	Entrée : 3,30 $ Sortie : 16,50 $ Entrée par lot : 1,65 $ Sortie par lot : 8,25 $ Écriture dans le cache (5 min) : 4,13 $ Écriture dans le cache (1 h) : 6,60 $ Accès au cache : 0,33 $ Écriture dans le cache par lot (5 min) : 2,06 $ Écriture dans le cache par lot (1 h) : 3,30 $ Accès au cache par lot : 0,17 $	Entrée : 6,60 $ Sortie : 24,75 $ Écriture dans le cache (5 min) : 8,25 $ Écriture dans le cache (1 h) : 13,20 $ Accès au cache : 0,66 $
Claude Haiku 4.5	Entrée : 1,10 $ Sortie : 5,50 $ Entrée par lot : 0,55 $ Sortie par lot : 2,75 $ Écriture dans le cache (5 min) : 1,375 $ Écriture dans le cache (1 h) : 2,20 $ Écriture dans le cache : 1,375 $ Accès au cache : 0,11 $ Écriture dans le cache par lot (5 min) : 0,688 $ Écriture dans le cache par lot (1 h) : 1,10 $ Accès au cache par lot : 0,055 $

europe-west1

Modèle	Prix (par million de jetons) < 200 000 jetons en entrée	Prix (par million de jetons) >= 200 000 jetons d'entrée
Claude Opus 4.5	Entrée : 5,50 $ Sortie : 27,50 $ Entrée par lot : 2,75 $ Sortie par lot : 13,75 $ Écriture dans le cache pendant 5 min : 6,875 $ Écriture dans le cache pendant 1 h : 11 $ Accès au cache : 0,55 $ Écriture dans le cache par lot pendant 5 min : 3,438 $ Écriture dans le cache par lot pendant 1 h : 5,50 $ Accès au cache par lot : 0,275 $
Claude Sonnet 4.5	Entrée : 3,30 $ Sortie : 16,50 $ Entrée par lot : 1,65 $ Sortie par lot : 8,25 $ Écriture dans le cache (5 min) : 4,13 $ Écriture dans le cache (1 h) : 6,60 $ Accès au cache : 0,33 $ Écriture dans le cache par lot (5 min) : 2,06 $ Écriture dans le cache par lot (1 h) : 3,30 $ Accès au cache par lot : 0,17 $	Entrée : 6,60 $ Sortie : 24,75 $ Écriture dans le cache (5 min) : 8,25 $ Écriture dans le cache (1 h) : 13,20 $ Accès au cache : 0,66 $
Claude Haiku 4.5	Entrée : 1,10 $ Sortie : 5,50 $ Entrée par lot : 0,55 $ Sortie par lot : 2,75 $ Écriture dans le cache (5 min) : 1,375 $ Écriture dans le cache (1 h) : 2,20 $ Accès au cache : 0,11 $ Écriture dans le cache par lot (5 min) : 0,688 $ Écriture dans le cache par lot (1 h) : 1,10 $ Accès au cache par lot : 0,055 $

asia-southeast1

Modèle	Prix (par million de jetons) < 200 000 jetons en entrée	Prix (par million de jetons) >= 200 000 jetons d'entrée
Claude Opus 4.5	Entrée : 5,50 $ Sortie : 27,50 $ Entrée par lot : 2,75 $ Sortie par lot : 13,75 $ Écriture dans le cache pendant 5 min : 6,875 $ Écriture dans le cache pendant 1 h : 11 $ Accès au cache : 0,55 $ Écriture dans le cache par lot pendant 5 min : 3,438 $ Écriture dans le cache par lot pendant 1 h : 5,50 $ Accès au cache par lot : 0,275 $
Claude Sonnet 4.5	Entrée : 3,30 $ Sortie : 16,50 $ Entrée par lot : 1,65 $ Sortie par lot : 8,25 $ Écriture dans le cache (5 min) : 4,13 $ Écriture dans le cache (1 h) : 6,60 $ Accès au cache : 0,33 $ Écriture dans le cache par lot (5 min) : 2,06 $ Écriture dans le cache par lot (1 h) : 3,30 $ Accès au cache par lot : 0,17 $	Entrée : 6,60 $ Sortie : 24,75 $ Écriture dans le cache (5 min) : 8,25 $ Écriture dans le cache (1 h) : 13,20 $ Accès au cache : 0,66 $

asia-east1

Modèle	Prix (par million de jetons) < 200 000 jetons en entrée	Prix (par million de jetons) >= 200 000 jetons d'entrée
Claude Haiku 4.5	Entrée : 1,10 $ Sortie : 5,50 $ Entrée par lot : 0,55 $ Sortie par lot : 2,75 $ Écriture dans le cache (5 min) : 1,375 $ Écriture dans le cache (1 h) : 2,20 $ Accès au cache : 0,11 $ Écriture dans le cache par lot (5 min) : 0,688 $ Écriture dans le cache par lot (1 h) : 1,10 $ Accès au cache par lot : 0,055 $

* Si le contexte d'entrée d'une requête est supérieur ou égal à 200 000 jetons, tous les jetons (entrée et sortie) sont facturés aux tarifs du contexte long.

Modèles avec des prix uniformes dans toutes les régions

Modèle	Prix (par million de jetons) < 200 000 jetons en entrée	Prix (par million de jetons) >= 200 000 jetons d'entrée
Claude Opus 4.1	Entrée : 15 $ Sortie : 75 $ Entrée par lot : 7,50 $ Sortie par lot : 37,50 $ Écriture dans le cache (5 min) : 18,75 $ Écriture dans le cache (1 h) : 30 $ Accès au cache : 1,50 $ Écriture dans le cache par lot (5 min) : 9,375 $ Écriture dans le cache par lot (1 h) : 15 $ Accès au cache par lot : 0,75 $	N/A
Claude Opus 4	Entrée : 15 $ Sortie : 75 $ Entrée par lot : 7,50 $ Sortie par lot : 37,50 $ Écriture dans le cache (5 min) : 18,75 $ Écriture dans le cache (1 h) : 30 $ Accès au cache : 1,50 $ Écriture dans le cache par lot (5 min) : 9,375 $ Écriture dans le cache par lot (1 h) : 15 $ Accès au cache par lot : 0,75 $	N/A
Claude Sonnet 4	Entrée : 3 $ Sortie : 15 $ Entrée par lot : 1,50 $ Sortie par lot : 7,50 $ Écriture dans le cache (5 min) : 3,75 $ Écriture dans le cache (1 h) : 6 $ Accès au cache : 0,30 $ Écriture dans le cache par lot (5 min) : 1,875 $ Écriture dans le cache par lot (1 h) : 3 $ Accès au cache par lot : 0,15 $
Claude 3 Haiku	Entrée : 0,25 $ Sortie : 1,25 $ Écriture dans le cache (5 min) : 0,30 $ Écriture dans le cache (1 h) : 0,50 $ Accès au cache : 0,03 $	N/A
Claude 3.5 Haiku (obsolète)	Entrée : 0,80 $ Sortie : 4 $ Entrée par lot : 0,40 $ Sortie par lot : 2 $ Écriture dans le cache (5 min) : 1 $ Écriture dans le cache (1 h) : 1,60 $ Accès au cache : 0,08 $ Écriture dans le cache par lot : 0,50 $ Accès au cache par lot : 0,04 $	N/A
Claude 3.7 Sonnet (obsolète)	Entrée : 3 $ Sortie : 15 $ Entrée par lot : 1,50 $ Sortie par lot : 7,50 $ Écriture dans le cache : 3,75 $ Accès au cache : 0,30 $ Écriture dans le cache par lot : 1,875 $ Accès au cache par lot : 0,15 $	N/A
Claude 3.5 Sonnet v2 (obsolète)	Entrée : 3 $ Sortie : 15 $ Entrée par lot : 1,50 $ Sortie par lot : 7,50 $ Écriture dans le cache : 3,75 $ Accès au cache : 0,30 $ Écriture dans le cache par lot : 1,875 $ Accès au cache par lot : 0,15 $	N/A
Claude 3.5 Sonnet (obsolète)	Entrée : 3 $ Sortie : 15 $ Écriture dans le cache : 3,75 $ Accès au cache : 0,30 $	N/A
Claude 3 Opus (obsolète)	Entrée : 15 $ Sortie : 75 $ Écriture dans le cache : 18,75 $ Accès au cache : 1,50 $	N/A

* Si le contexte d'entrée d'une requête est supérieur ou égal à 200 000 jetons, tous les jetons (entrée et sortie) sont facturés aux tarifs du contexte long.

Tarification des outils

Outil	Prix
Demande de recherche sur le Web	10$par tranche de 1 000 recherches Modèles compatibles : Claude Haiku 4.5, Claude Sonnet 4.5, Claude Sonnet 4, Claude Opus 4.1 et Claude Opus 4.

* Si le contexte d'entrée d'une requête est supérieur ou égal à 200 000 jetons, tous les jetons (entrée et sortie) sont facturés aux tarifs du contexte long.

Modèles de Deepseek

Modèle	Tarifs
DeepSeek-V3.1	Entrée : 0,60 $ par million de jetons Sortie : 1,70 $ par million de jetons Entrée par lot : 0,30 $ par million de jetons Sortie par lot : 0,85 $ par million de jetons
DeepSeek-V3.2	Entrée : 0,56 $ par million de jetons Sortie : 1,68 $ par million de jetons Entrée par lot : 0,28 $ par million de jetons Sortie par lot : 0,84 $ par million de jetons
DeepSeek-R1 (0528)	Entrée : 1,35 $ par million de jetons Sortie : 5,40 $ par million de jetons Entrée par lot : 0,675 $ par million de jetons Sortie par lot : 2,70 $ par million de jetons
DeepSeek-OCR	Entrée : 0,30 $ par million de jetons (ou 0,0003 $par page) Sortie : 1,20 $ par million de jetons (ou 0,00012 $par page)

Modèles de MiniMax

Modèle	Tarifs
MiniMax-M2	Entrée : 0,30 $ par million de jetons Sortie : 1,20 $ par million de jetons

Modèles de Moonshot

Modèle	Tarifs
Kimi-K2-Thinking	Entrée : 0,60 $ par million de jetons Sortie : 2,50 $ par million de jetons

Modèles Qwen

Modèle	Tarifs
Qwen3-Next-80B-Thinking	Entrée : 0,15 $ par million de jetons Sortie : 1,20 $ par million de jetons
Qwen3-Next-80B-Instruct	Entrée : 0,15 $ par million de jetons Sortie : 1,20 $ par million de jetons
Qwen3-Coder-480B-A35B-Instruct	Entrée : 0,22 $ par million de jetons Sortie : 1,80 $ par million de jetons Résultat mis en cache : 0,022 $ par million de jetons Entrée par lot : 0,11 $ par million de jetons Sortie par lot : 0,90 $ par million de jetons
Qwen3-235B-A22B-Instruct-2507	Entrée : 0,22 $ par million de jetons Sortie : 0,88 $ par million de jetons Entrée par lot : 0,11 $ par million de jetons Sortie par lot : 0,44 $ par million de jetons

Modèles GLM

Modèle	Tarifs
GLM-4.7 *	Entrée : 0,60 $ par million de jetons Sortie : 2,20 $ par million de jetons

* Disponible sans frais jusqu'au 28 janvier 2026.

Modèles d'OpenAI

Modèle	Tarifs
gpt-oss-120b	Entrée : 0,09 $ par million de jetons Sortie : 0,36 $ par million de jetons Entrée par lot : 0,045 $ par million de jetons Sortie par lot : 0,18 $ par million de jetons
gpt-oss-20b	Entrée : 0,07 $ par million de jetons Sortie : 0,25 $ par million de jetons Entrée par lot : 0,035 $ par million de jetons Sortie par lot : 0,125 $ par million de jetons

Modèles Llama de Meta

Modèle	Tarifs
Llama 3.1 405B	Entrée : 5 $ par million de jetons Sortie : 16 $ par million de jetons
Llama 3.3 70B	Entrée : 0,72 $ par million de jetons Sortie : 0,72 $ par million de jetons Entrée par lot : 0,36 $ par million de jetons Sortie par lot : 0,36 $ par million de jetons
Llama 4 Scout	Entrée : 0,25 $ par million de jetons Sortie : 0,70 $ par million de jetons Entrée par lot : 0,125 $ par million de jetons Sortie par lot : 0,35 $ par million de jetons
Llama 4 Maverick	Entrée : 0,35 $ par million de jetons Sortie : 1,15 $ par million de jetons Entrée par lot : 0,175 $ par million de jetons Sortie par lot : 0,575 $ par million de jetons

Modèles de Mistral AI

Modèle	Tarifs
Mistral OCR (25.05)	Entrée : 0,0005 $ par million de jetons (ou 0,0005 $par page) Sortie : 0,0005 $ par million de jetons (ou 0,0005 $par page)
Mistral Medium 3	Entrée : 0,40 $ par million de jetons Sortie : 2 $ par million de jetons
Mistral Small 3.1 (25.03)	Entrée : 0,10 $ par million de jetons Sortie : 0,30 $ par million de jetons
Mistral Large (24.11) (obsolète)	Entrée : 2 $ / million de jetons Sortie : 6 $ / million de jetons
Codestral 2	Entrée : 0,30 $ par million de jetons Sortie : 0,90 $ par million de jetons
Codestral (25.01) (obsolète)	Entrée : 0,30 $ par million de jetons Sortie : 0,90 $ par million de jetons

Demander un devis personnalisé

Avec le paiement à l'usage de Google Cloud, vous ne payez que pour les services que vous utilisez. Contactez notre équipe commerciale pour obtenir un devis personnalisé pour votre entreprise.

Contacter le service commercial