Coût de création et de déploiement de modèles d'IA dans Vertex AI

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.

Vous n'êtes facturé que pour les requêtes qui renvoient un code de réponse 200. Les requêtes renvoyant d'autres codes de réponse, tels que les codes 4xx et 5xx, ne sont pas facturées pour l'entrée ou la sortie.

Cette page présente les tarifs de l'IA générative sur Vertex AI. Pour tous les autres tarifs de Vertex AI, y compris les services ML Platform et MLOps, consultez la page des tarifs de Vertex AI.

Modèles Google

Gemini 3

Modèle Type Prix (pour 1 million de jetons) <= 200 000 jetons d'entrée Prix (pour 1 million de jetons) > 200 000 jetons en entrée Prix (pour 1 million de jetons) <= 200 000 jetons d'entrée mis en cache Prix (par million de jetons) > 200 000 jetons d'entrée mis en cache Prix (pour 1 million de jetons) <= 200 000 jetons d'entrée avec l'API par lots Prix (pour 1 million de jetons) > 200 000 jetons d'entrée avec l'API par lot
Gemini 3 Pro (preview)
Entrée (texte, image, vidéo, audio) 2 $ 4 $ 0,2 $ 0,4 $ 1 $ 2 $
Sortie textuelle (réponse et raisonnement) 12 $ 18 $ N/A N/A 6 $ 9 $
Sortie d'image** 120 $ N/A N/A N/A 60 $ N/A
Ancrage avec la recherche Google et ancrage Web pour les entreprises Gemini 3 Pro inclut 5 000 requêtes de recherche par mois sans frais supplémentaires.

Les requêtes de recherche qui dépassent ces limites sont facturées 14$par tranche de 1 000 requêtes. Une requête envoyée par un client à Gemini peut générer une ou plusieurs requêtes adressées à la recherche Google (ou à l'ancrage Web pour Enterprise). Chaque requête de recherche individuelle effectuée vous sera facturée. La facturation commencera le 5 janvier 2026.

Les jetons d'entrée fournis par Grounding with Google Search ou Web Grounding for Enterprise ne sont pas facturés.

Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes ancrées par jour.
Ancrage avec Google Maps Gemini 3 Pro inclut 5 000 requêtes de recherche par mois sans frais supplémentaires.

Les requêtes Maps qui dépassent ces limites sont facturées 14$par tranche de 1 000 requêtes. Une requête envoyée par un client à Gemini peut générer une ou plusieurs requêtes à Google Maps. Chaque requête individuelle exécutée vous sera facturée. La facturation commencera le 5 janvier 2026
Ancrage basé sur vos données 2,5 $ par tranche de 1 000 requêtes.

* Si le contexte d'entrée d'une requête dépasse 200 000 jetons, tous les jetons (entrée et sortie) sont facturés aux tarifs du contexte long.
** Une image de sortie 1K (1024 x 1024) et 2K (2048 x 2048) consomme 1 120 jetons de sortie d'image, soit l'équivalent de 0,134 $par image générée. Une image 4K (4096x4096) consomme 2000 jetons de sortie d'image, soit l'équivalent de 0,24 $par image générée.

Gemini 2.5

Modèle Type Prix (pour 1 million de jetons) <= 200 000 jetons d'entrée Prix (pour 1 million de jetons) > 200 000 jetons en entrée Prix (pour 1 million de jetons) <= 200 000 jetons d'entrée mis en cache Prix (par million de jetons) > 200 000 jetons d'entrée mis en cache Prix (pour 1 million de jetons) <= 200 000 jetons d'entrée avec l'API par lots Prix (pour 1 million de jetons) > 200 000 jetons d'entrée avec l'API par lot
Gemini 2.5 Pro
Entrée (texte, image, vidéo, audio) 1,25 $ 2,5 $ 0,125 $ 0,250 $ 0,625 $ 1,25 $
Sortie textuelle (réponse et raisonnement) 10 $ 15 $ N/A N/A 5 $ 7,5 $
Gemini 2.5 Pro
Utilisation sur ordinateur – Preview
Entrée (texte, image, vidéo, audio) 1,25 $ 2,5 $ N/A N/A N/A N/A
Sortie textuelle (réponse et raisonnement) 10 $ 15 € N/A N/A N/A N/A


Gemini 2.5
Flash
Entrée (texte, image, vidéo) 0,30 $ 0,30 $ 0,030 $ 0,030 $ 0,15 $ 0,15 $
Entrée audio 1 $ 1 $ 0,100 $ 0,100 $ 0,5 $ 0,5 $
Sortie textuelle (réponse et raisonnement) 2,50 $ 2,50 $ N/A N/A 1,25 $ 1,25 $
Sortie d'image*** 30 $ 30 $ N/A N/A 15 $ 15 $




API Gemini 2.5 Flash en direct
1 million de jetons de texte en entrée 0,5 $ 0,5 $ N/A N/A N/A N/A
1 million de jetons audio en entrée 3 $ 3 $ N/A N/A N/A N/A
1 million de jetons d'entrée vidéo/image 3 $ 3 $ N/A N/A N/A N/A
1 million de jetons de texte en sortie 2 $ 2 $ N/A N/A N/A N/A
1 million de jetons audio en sortie 12 $ 12 $ N/A N/A N/A N/A



Gemini 2.5 Flash Lite
Entrée (texte, image, vidéo) 0,1 $ 0,1 $ 0,010 $ 0,010 $ 0,05 $ 0,05 $
Entrée audio 0,3 $ 0,3 $ 0,030 $ 0,030 $ 0,15 $ 0,15 $
Sortie textuelle (réponse et raisonnement) 0,4 $ 0,4 $ N/A N/A 0,2 $ 0,2 $


Ancrage avec la recherche Google
Gemini 2.0 Flash, 2.5 Flash et 2.5 Flash-Lite incluent 1 500 requêtes ancrées combinées par jour sans frais supplémentaires. Gemini 2.5 Pro inclut 10 000 requêtes ancrées par jour sans frais supplémentaires.

Les requêtes ancrées qui dépassent ces limites sont facturées 35$par tranche de 1 000 requêtes ancrées.

Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google&ast;&ast;. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée.

Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe de gestion de votre compte.

Ancrage Web pour entreprise
45$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes à l'ancrage Web pour les entreprises**. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée.

Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes ancrées par jour.
Ancrage basé sur vos données 2,5 $ par tranche de 1 000 requêtes.
Ancrage avec Google Maps 25$pour 1 000 requêtes ancrées.

Un prompt ancré est une requête envoyée à Gemini qui effectue au moins une requête à Google Maps.

* Si le contexte d'entrée d'une requête dépasse 200 000 jetons, tous les jetons (entrée et sortie) sont facturés aux tarifs du contexte long.
** L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL d'ancrage Web). Les frais d'utilisation du modèle Gemini s'appliquent séparément.
*** Une image de 1 024 x 1 024 consomme 1 290 jetons. Le nombre de jetons par image varie en fonction de la résolution de l'image. Pour en savoir plus sur le calcul des jetons, vous pouvez consulter notre documentation.
**** La facturation de l'utilisation de l'ordinateur utilise le SKU Gemini 2.5 Pro. Pour séparer les coûts d'utilisation de l'ordinateur, appliquez des tags de facturation. Pour en savoir plus, cliquez ici.

  • Explication de la facturation de la fenêtre de contexte d'une session Live API : vous êtes facturé par tour pour tous les jetons présents dans la fenêtre de contexte de la session. La fenêtre de contexte de la session inclut les nouveaux jetons (tour actuel) et tous les jetons accumulés lors des tours précédents. Cela signifie que les jetons des tours précédents sont retraités et pris en compte dans chaque nouveau tour, jusqu'à la taille de la fenêtre de contexte que vous avez configurée. Un "tour" correspond à une entrée utilisateur et à la réponse du modèle.
  • Mode audio proactif : lorsqu'il est activé, les jetons d'entrée sont facturés pendant que LiveAPI écoute. Les jetons de sortie ne sont facturés que lorsque l'API répond.
  • Lorsque la transcription audio en texte est activée, tous les jetons de texte générés pour la transcription sont facturés au tarif de sortie des jetons de texte.

Gemini 2.0

Gemini 2.0 est facturé en fonction des jetons. Pour calculer le nombre de jetons d'entrée dans votre requête avant de l'envoyer, vous pouvez utiliser le tokenizer du SDK ou l'API countTokens. Si votre requête échoue et renvoie une erreur 400 ou 500, les jetons utilisés ne vous seront pas facturés.

Utilisez le bouton bascule dans la grille tarifaire pour comparer la tarification basée sur les jetons et la tarification basée sur les modalités.

Tarification basée sur les jetons

Modèle Type Prix Prix avec l'API Batch




Gemini 2.0 Flash
1 million de jetons d'entrée 0,15 $ 0,075 $
1 million de jetons audio en entrée 1,00 $ 0,50 $
1 million de jetons de texte de sortie 0,60 $ 0,30 $
Ajustement pour 1 million de jetons d'entraînement 3 $




Génération d'images avec Gemini 2.0 Flash
1 million de jetons en entrée 0,15 $
1 million de jetons audio en entrée 1,00 $
1 million de jetons vidéo en entrée 3 $
1 million de jetons de texte en sortie 0,60 $
1 million de jetons d'image en sortie $30.00




API Gemini 2.0 Flash Live
1 million de jetons de texte en entrée 0,5 $
1 million de jetons audio en entrée 3 $
1 million de jetons d'entrée vidéo/image 3 $
1 million de jetons de texte en sortie 2 $
1 million de jetons audio en sortie 12 $




Gemini 2.0 Flash-Lite
1 million de jetons d'entrée 0,075 $ 0,0375 $
1 million de jetons audio en entrée 0,075 $ 0,0375 $
1 million de jetons de texte de sortie 0,30 $ 0,15 $
Ajustement pour 1 million de jetons d'entraînement 1,00 $


Ancrage avec la recherche Google
Gemini 2.0 Flash et 2.5 Flash incluent 1 500 requêtes ancrées par jour au total,sans frais supplémentaires.

Les requêtes ancrées qui dépassent ces limites sont facturées 35$par tranche de 1 000 requêtes ancrées.

Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée.

Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe de gestion de votre compte.

Ancrage Web pour entreprise
45$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes à l'ancrage Web pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée.

Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe de gestion de votre compte.
Ancrage basé sur vos données 2,5 $ pour 1 000 requêtes à partir du 16 juin 2025.


Ancrage avec Google Maps
Les modèles Gemini incluent un certain nombre de requêtes ancrées quotidiennes sans frais supplémentaires :
  • Gemini Flash et Flash-Lite : 1 500 requêtes ancrées par jour au total.
  • Gemini Pro : 10 000 requêtes ancrées par jour.

  • Les requêtes ancrées qui dépassent ces limites sont facturées 25$par tranche de 1 000 requêtes ancrées.

    Un prompt ancré est une requête envoyée à Gemini qui effectue au moins une requête à Google Maps.

    Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe de gestion de votre compte.

    Tarifs basés sur les modalités

    Les tarifs des modalités ci-dessous sont basés sur des cas d'utilisation moyens et sont fournis à titre de référence uniquement. La facturation réelle sera basée uniquement sur les jetons :

    • 4 caractères correspondent à environ 1 jeton de texte, y compris les espaces blancs.
    • Pour une image de 1 024 x 1 024, elle consomme 1 290 jetons. Le nombre de jetons par image varie en fonction de la résolution de l'image. Pour en savoir plus sur le calcul des jetons, vous pouvez consulter notre documentation.
    • L'entrée vidéo consomme 258 jetons par seconde à la fréquence d'échantillonnage d'une image par seconde. Une vidéo avec audio est facturée à la fois pour les jetons vidéo et les jetons audio.
    • L'entrée audio consomme 25 jetons par seconde sans horodatage.
    Modèle Type Prix Prix avec l'API Batch




    Gemini 2.0 Flash
    Texte d'entrée ($/M de caractères) 0,0375 $ 0,01875 $
    Image d'entrée ($/image) 0,0001935 $ 0,00009675 $
    Vidéo d'entrée ($/s) 0,0000387 $ 0,00001935 $
    Audio d'entrée ($/s) 0,000025 $ 0,0000125 $
    Texte de sortie (€/M de caractères) 0,15 $ 0,075 $




    Génération d'images avec Gemini 2.0 Flash
    Texte d'entrée ($/M de caractères) 0,0375 $
    Image d'entrée ($/image) 0,0001935 $
    Vidéo d'entrée ($/s) 0,0000387 $
    Audio d'entrée ($/s) 0,000025 $
    Texte de sortie (€/M de caractères) 0,15 $
    Image de sortie ($/image) 0,04 $





    Gemini 2.0 Flash-Lite
    Texte d'entrée ($/M de caractères) 0,01875 $ 0,009375 $
    Image d'entrée ($/image) 0,00009675 $ 0,000048375 $
    Vidéo d'entrée ($/s) 0,00001935 $ 0,000009675 $
    Audio d'entrée ($/s) 0,000001875 $ 0,000000938 $
    Texte de sortie (€/M de caractères) 0,075 $ 0,0375 $


    Ancrage avec la recherche Google
    Gemini 2.0 Flash et 2.5 Flash incluent 1 500 requêtes ancrées par jour au total,sans frais supplémentaires.

    Les requêtes ancrées qui dépassent ces limites sont facturées 35$par tranche de 1 000 requêtes ancrées.

    Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée.

    Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe de gestion de votre compte.

    Ancrage Web pour entreprise
    45$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes à l'ancrage Web pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée.

    Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe de gestion de votre compte.

    * Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.
    * Les jetons d'entraînement sont calculés en multipliant le nombre total de jetons dans votre ensemble de données d'entraînement par le nombre d'époques.
    * Les PDF sont facturés comme des entrées d'image, une page de PDF équivalant à une image.
    * Le point de terminaison du modèle réglé a le même prix de prédiction que le modèle de base.
    * L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL d'ancrage issue du Web). Les frais d'utilisation du modèle Gemini s'appliquent séparément.
    * API Gemini 2.0 Flash Live : 25 jetons par seconde d'audio (entrée/sortie), 258 jetons par seconde de vidéo (entrée). L'ancrage avec la recherche Google reste gratuit tant que l'API Gemini 2.0 Flash Live est en preview.

    • Explication de la facturation de la fenêtre de contexte d'une session Live API : vous êtes facturé par tour pour tous les jetons présents dans la fenêtre de contexte de la session. La fenêtre de contexte de la session inclut les nouveaux jetons (tour actuel) et tous les jetons accumulés lors des tours précédents. Cela signifie que les jetons des tours précédents sont retraités et pris en compte dans chaque nouveau tour, jusqu'à la taille de la fenêtre de contexte que vous avez configurée. Un "tour" correspond à une entrée utilisateur et à la réponse du modèle.
    • Lorsque la transcription audio en texte est activée, tous les jetons de texte générés pour la transcription sont facturés au tarif de sortie des jetons de texte.

    Tarification de Vertex AI Model Optimizer (expérimental)*

    L'optimiseur de modèle Vertex AI simplifie l'utilisation de Gemini pour les entreprises en fournissant un seul méta-point de terminaison pour les requêtes de modèle Gemini. Les clients qui utilisent ce service n'ont pas à spécifier s'ils souhaitent utiliser Flash, Pro ou une version spécifique. Au lieu de cela, ils fournissent simplement un paramètre configurable (coût, qualité ou équilibre) pour indiquer leurs préférences, et Model Optimizer applique le niveau d'intelligence approprié à la tâche en envoyant chaque requête au modèle le plus adapté.

    Vertex AI Model Optimizer applique une tarification dynamique. Cela signifie que le prix moyen par jeton dépend du niveau d'intelligence du modèle appliqué pour effectuer la tâche. C'est pourquoi nous fournissons ci-dessous des exemples de tarification pour illustrer des scénarios probables en fonction de votre paramètre de configuration (voir les tableaux ci-dessous). Les SKU Model Optimizer sont des SKU à 1 $qui servent d'unité d'achat pour votre facturation. Vous êtes facturé à l'usage après avoir utilisé les modèles.

    Rapport E/S de 5:1 Exemple 1
    Chatbot
    REMARQUE : Ces fourchettes ne sont pas garanties, et les résultats individuels des clients peuvent varier.
    Préférence du client Jetons d'entrée du client envoyés au modèle Jetons de sortie client envoyés au MO Prix moyen des entrées par million de jetons (fourchette haute) Prix de sortie moyen par million de jetons (fourchette haute) Prix d'entrée moyen par million de jetons (fourchette basse) Prix de sortie moyen par million de jetons (fourchette basse)
    Coût 10 000 000 2 000 000 0,63 $ 2,50 $ 0,16 $ 0,63 $
    Équilibré 10 000 000 2 000 000 1,26 $ 5 $ 0,63 $ 2,50 $
    Qualité 10 000 000 2 000 000 1,89 $ 7,50 $ 1,26 $ 5 $
    Rapport E/S de 1:20 Exemple 2 : Génération de contenu
    Préférence du client Jetons d'entrée du client envoyés au modèle Jetons de sortie client envoyés au MO Prix moyen des entrées par million de jetons (fourchette haute) Prix de sortie moyen par million de jetons (fourchette haute) Prix d'entrée moyen par million de jetons (fourchette basse) Prix de sortie moyen par million de jetons (fourchette basse)
    Coût 1 000 000 20 000 000 0,63 $ 2,50 $ 0,16 $ 0,63 $
    Équilibré 1 000 000 20 000 000 1,26 $ 5 $ 0,63 $ 2,50 $
    Qualité 1 000 000 20 000 000 1,89 $ 7,50 $ 1,26 $ 5 $

    * Model Optimizer est une offre expérimentale payante qui peut acheminer les requêtes vers des versions expérimentales de Gemini sur Vertex.

    Autres modèles Gemini

    Tous les modèles Gemini autres que Gemini 2.0 ou Gemini 2.5 sont facturés en fonction des modalités, comme le nombre de caractères, d'images ou de secondes de vidéo/d'audio. Les entrées de type texte sont facturées pour chaque tranche de 1 000 caractères d'entrée (requête) et pour chaque tranche de 1 000 caractères de sortie (réponse). Les caractères sont comptabilisés par points de code UTF-8, et les espaces sont exclus du décompte, ce qui donne environ quatre caractères par jeton. Les requêtes de prédiction qui aboutissent à des réponses filtrées ne sont facturées que pour l'entrée. À la fin de chaque cycle de facturation, les fractions de centime (0,01 $) sont arrondies à un centime. Les entrées de type média sont facturées par image ou par seconde (vidéo). Si votre requête échoue et renvoie une erreur 400 ou 500, les jetons utilisés ne vous seront pas facturés.

    Modèle Caractéristique Type Prix
    ( =< 128 000 jetons en entrée)
    Prix
    ( > 128 000 jetons d'entrée)
    Gemini 1.5 Flash Multimodal Entrée image
    Entrée vidéo
    Entrée textuelle
    Entrée audio
    0,00002 $ par image
    0,00002$par seconde
    0,00001875$pour 1 000 caractères
    0,000002$par seconde
    0,00004 $ par image
    0,00004$par seconde
    0,0000375$pour 1 000 caractères
    0,000004$par seconde
    Sortie textuelle 0,000075 $ pour 1 000 caractères 0,00015 $ pour 1 000 caractères
    Réglage* Jeton de formation 8 $ / M de jetons
    Gemini 1.5 Pro Multimodal Entrée image
    Entrée vidéo
    Entrée textuelle
    Entrée audio
    0,00032875 $ par image
    0,00032875$par seconde
    0,0003125$pour 1 000 caractères
    0,00003125$par seconde
    0,0006575 $ par image
    0,0006575$par seconde
    0,000625$pour 1 000 caractères
    0,0000625$par seconde
    Sortie textuelle 0,00125 $ pour 1 000 caractères 0,0025 $ pour 1 000 caractères
    Réglage* Jeton de formation 80 $ / M de jetons
    Gemini 1.0 Pro Multimodal Entrée image
    Entrée vidéo
    Entrée textuelle
    0,0025 $ par image
    0,002 $ par seconde
    0,000125 $ pour 1 000 caractères
    Sortie textuelle 0,000375 $ pour 1 000 caractères
    Ancrage avec la recherche Google Texte 35$pour 1 000 requêtes ancrées.

    Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée.

    Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes ancrées par jour.
    Ancrage Web pour les entreprises Texte 45$pour 1 000 requêtes ancrées.

    Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes à l'ancrage Web pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule requête ancrée est facturée.

    Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes ancrées par jour.
    Ancrage basé sur vos données Texte 2,5 $ par tranche de 1 000 requêtes à partir du 16 juin 2025.

    * Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.
    * Si le contexte d'une requête dépasse 128 000 jetons, tous les jetons sont facturés au tarif du contexte long.
    * Les modèles Gemini sont disponibles en mode par lot avec une remise de 50 %.
    * Gemini 1.0 Pro ne prend en charge qu'une fenêtre de contexte de 32 000 jetons maximum.
    * Les PDF sont facturés comme des entrées d'image, une page de PDF équivalant à une image.
    * Le point de terminaison du modèle réglé a le même prix de prédiction que le modèle de base.
    * L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL d'ancrage issue du Web). Les frais d'utilisation du modèle Gemini s'appliquent séparément.

    Imagen

    Avec Imagen sur Vertex AI, vous pouvez générer de nouvelles images ou modifier des images existantes sur la base de requêtes de texte que vous fournissez, modifier partiellement des images à l'aide d'une zone de masquage que vous définissez, et bien d'autres fonctionnalités encore.

    Modèle Fonctionnalité Description Entrée Sortie Prix
    Imagen 4 Ultra Génération d'images Générer une image Requête textuelle Image 0,06 $ par image
    Imagen 4 Augmentation de la résolution Augmenter la résolution d'une image générée à 2K, 3K ou 4K Image Image 0,06 $ par image
    Imagen 4 Génération d'images Générer une image Requête textuelle Image 0,04 $ par image
    Imagen 4 Fast Génération d'images Générer une image Requête textuelle Image 0,02 $ par image
    Imagen 3 Génération d'images Générer une image
    Modifier une image
    Personnaliser une image
    Requête textuelle Image 0,04 $ par image
    Imagen 3 Fast Génération d'images Générer une image Requête textuelle Image 0,02 $ par image
    Imagen 2, Imagen 1 Génération d'images Générer une image Requête textuelle Images 0,020 $ par image
    Imagen 2, Imagen 1 Édition d'images Modifier une image par une approche avec masque ou sans masque Image/Requête textuelle Images 0,020 $ par image
    Imagen 1 Augmentation de la résolution Augmenter la résolution d'une image générée à 2k ou 4k Images Images 0,003 $ par image
    Imagen 1 Affinage Permettre l'utilisation d'un "sujet" fourni par l'utilisateur dans les requêtes Imagen (entraînement "few-shot") Sujet(s) avec identifiant textuel et 4 à 8 images par sujet Modèle affiné (après l'entraînement avec des sujets fournis par l'utilisateur) $ par heure-nœud (tarifs d'entraînement personnalisé Vertex AI)
    Imagen Visual Captioning Générer une légende textuelle courte ou longue pour une image Images Légende textuelle 0,0015 $ par image
    Imagen Questions/réponses visuelles Fournir une réponse basée sur une question faisant référence à une image Image/Requête textuelle Réponse textuelle 0,0015 $ par image
    Imagen Product Recontext Réinventez des produits dans une nouvelle scène 1 à 3 images du même produit et un prompt textuel décrivant la scène souhaitée Image 0,12 $ par image
    Vertex Virtual Try-On Créez des images de personnes portant différents vêtements 1 image d'une personne et 1 image de vêtements Image 0,06 $ par image

    Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

    Veo

    Veo crée des vidéos d'une qualité incroyable dans une grande variété de sujets et de styles, en s'appuyant sur une meilleure compréhension des lois de la physique réelle et des nuances des mouvements et expressions humaines.

    Modèle Fonctionnalité Description Entrée Sortie Résolution de sortie Prix
    Veo 3.1 Génération de vidéos et d'audio Générez des vidéos de haute qualité avec des effets sonores/vocaux synchronisés à partir d'un prompt textuel ou d'une image de référence Requête textuelle/image Vidéo et audio 720p, 1080p 0,40 $/seconde
    Veo 3.1 Génération de vidéos Générez des vidéos de haute qualité à partir d'un prompt textuel ou d'une image de référence. Requête textuelle/image Vidéo 720p, 1080p 0,20 $/seconde
    Veo 3.1 Fast Génération de vidéos et d'audio Générez plus rapidement des vidéos avec des effets sonores/vocaux synchronisés à partir d'un prompt textuel ou d'une image de référence Requête textuelle/image Vidéo et audio 720p, 1080p 0,15 $/seconde
    Veo 3.1 Fast Génération de vidéos Générez plus rapidement des vidéos à partir d'un prompt textuel ou d'une image de référence Requête textuelle/image Vidéo 720p, 1080p 0,10 $/seconde
    Veo 3 Génération de vidéos et d'audio Générez des vidéos de haute qualité avec des effets sonores/vocaux synchronisés à partir d'un prompt textuel ou d'une image de référence Requête textuelle/image Vidéo et audio 720p, 1080p 0,40 $/seconde
    Veo 3 Génération de vidéos Générez des vidéos de haute qualité à partir d'un prompt textuel ou d'une image de référence. Requête textuelle/image Vidéo 720p, 1080p 0,20 $/seconde
    Veo 3 Fast Génération de vidéos et d'audio Générez plus rapidement des vidéos avec des effets sonores/vocaux synchronisés à partir d'un prompt textuel ou d'une image de référence Requête textuelle/image Vidéo et audio 720p, 1080p 0,15 $/seconde
    Veo 3 Fast Génération de vidéos Générez plus rapidement des vidéos à partir d'un prompt textuel ou d'une image de référence Requête textuelle/image Vidéo 720p, 1080p 0,10 $/seconde
    Veo 2 Génération de vidéos Générez des vidéos à partir d'un prompt textuel ou d'une image de référence Requête textuelle/image Vidéo 720p 0,50 $/seconde
    Veo 2 Contrôles avancés Générez des vidéos par interpolation des images de début et de fin, prolongez les vidéos générées et appliquez des commandes de caméra. Requête textuelle/image/vidéo Vidéo 720p 0,50 $/seconde

    Lyria

    Lyria 2 génère de la musique instrumentale de haute qualité, idéale pour les compositions sophistiquées et l'exploration créative détaillée où la nuance est essentielle.

    Modèle Fonctionnalité Description Entrée Sortie Prix
    Lyria 2 Génération de musique Générer de la musique à partir d'un prompt textuel Requête textuelle Musique 0,06 $ par tranche de 30 secondes

    Comprendre les coûts d'embedding pour vos applications d'IA

    Modèle Type Région Prix par tranche de 1 000 tokens d'entrée
    Gemini Embedding Entrée Monde
    • Requêtes en ligne : 0,00015 $
    • Requêtes par lot : 0,00012 $
    Sortie Monde
    • Requêtes en ligne : sans frais
    • Requêtes par lot : sans frais
    Modèle Type Région Prix par tranche de 1000 caractères
    Embeddings pour le texte
    (à l'exclusion de Gemini Embedding)
    Entrée Globaux
    • Requêtes en ligne : 0,000025 $
    • Requêtes par lot : 0,00002 $
    Sortie Monde
    • Requêtes en ligne : sans frais
    • Requêtes par lot : sans frais
    Modèle Fonctionnalité Description Entrée Sortie Prix
    multimodalembedding Embeddings multimodaux : texte Générer des représentations vectorielles continues en utilisant du texte comme entrée Texte Embeddings 0,0002 $ pour 1000 caractères d'entrée
    Embeddings multimodaux : image Générer des représentations vectorielles continues en utilisant une image comme entrée Images Embeddings 0,0001 $ par image d'entrée
    Embeddings multimodaux : vidéo et plus Vidéo Plus Vidéo Représentations vectorielles continues (jusqu'à 15 représentations vectorielles continues par minute de vidéo) 0,0020 $ par seconde de vidéo
    Embeddings multimodaux : vidéo Standard Vidéo Standard Vidéo Représentations vectorielles continues (jusqu'à 8 représentations vectorielles continues par minute de vidéo) 0,0010 $ par seconde de vidéo
    Embeddings multimodaux : vidéo (essentiel) Vidéo Essentiel Vidéo Représentations vectorielles continues (jusqu'à 4 représentations vectorielles continues par minute de vidéo) 0,0005 $ par seconde de vidéo
    Modèle Open Source Type Prix par tranche de 1 000 tokens d'entrée
    multilingual-e5-small Entrée :
    Sortie :

    Entrée par lot :
    Sortie par lot :
    Requêtes en ligne : 0,000015 $
    Requêtes en ligne : sans frais

    Requêtes par lot : 0,0000075 $
    Requêtes par lot : sans frais
    multilingual-e5-large Entrée :
    Sortie :

    Entrée par lot :
    Sortie par lot :
    Requêtes en ligne : 0,000025 $
    Requêtes en ligne : sans frais

    Requêtes par lot : 0,0000125 $
    Requêtes par lot : sans frais

    Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

    Tarifs de la complétion de code de Vertex AI

    La prise en charge de l'IA générative sur Vertex AI est facturée pour chaque tranche de 1000 caractères d'entrée (requête) et pour chaque tranche de 1000 caractères de sortie (réponse). Les caractères sont comptabilisés avec les points de code UTF-8, et les espaces sont exclus du décompte. Pendant la phase de bêta, les frais sont réduits de 100 %. Les requêtes de prédiction qui aboutissent à des réponses filtrées ne sont facturées que pour l'entrée. À la fin de chaque cycle de facturation, les fractions de centime (0,01 $) sont arrondies à un centime.

    Modèle Type Région Prix par tranche de 1000 caractères
    Codey pour la saisie de code Entrée Global
    • Requêtes en ligne : 0,00025 $
    Sortie Global
    • Requêtes en ligne : 0,0005 $

    Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

    Traduction (texte)

    Utilisez l'API Vertex AI et le LLM de traduction pour traduire du texte. Les traductions LLM ont tendance à être plus fluides et à sonner plus naturelles que celles des modèles de traduction classiques, mais elles sont disponibles dans moins de langues (en savoir plus).

    Modèle Méthode Utilisation Prix par million de caractères
    LLM Texte traduction* Nombre de caractères d'entrée par mois

    10 $ par million de caractères*

    Nombre de caractères de sortie par mois

    10 $ par million de caractères*

    Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.
    * Le prix est calculé en fonction du nombre de caractères traités par le modèle. Pour en savoir plus sur le comptage de caractères, consultez la section Caractères facturés.

    Prix du stockage du cache de contexte pour la mise en cache explicite

    Modèle Caractéristique Type Prix (pour 1 million de jetons)
    <= 200 000 jetons d'entrée
    Prix (pour 1 million de jetons)
    > 200 000 jetons d'entrée
    Gemini 3 Pro Stockage du cache de contexte Entrée (texte, image, vidéo, audio) 4,5 $ (par million de jetons/heure) 4,5 $ (par million de jetons/heure)
    Gemini 2.5 Pro Stockage du cache de contexte Entrée (texte, image, vidéo, audio) 4,5 $ (par million de jetons/heure) 4,5 $ (par million de jetons/heure)
    Gemini 2.0 Flash Stockage du cache de contexte Entrée (texte, image, vidéo, audio) 1 $ (/M jetons/h) 1 $ (/M jetons/h)
    Gemini 2.5 Flash Lite Stockage du cache de contexte Entrée (texte, image, vidéo, audio) 1 $ (/M jetons/h) 1 $ (/M jetons/h)

    Modèles Gemini 2.0

    Tarification basée sur les jetons


    Modèle

    Type
    Stockage
    (M tok-heure)
    Prix




    Gemini 2.0 Flash
    1 million de jetons d'entrée 1,00 $ 0,0375 $
    1 million de jetons audio en entrée 1,00 $ 0,25 $
    1 million de jetons de texte de sortie N/A N/A


    Gemini 2.0 Flash-Lite
    1 million de jetons d'entrée 1,00 $ 0,01875 $
    1 million de jetons audio en entrée 1,00 $ 0,01875 $
    1 million de jetons de texte de sortie N/A N/A

    Tarifs basés sur les modalités

    Les tarifs des modalités ci-dessous sont basés sur des cas d'utilisation moyens et sont fournis à titre de référence uniquement. La facturation réelle sera basée uniquement sur les jetons :

    • 4 caractères correspondent à environ 1 jeton de texte, y compris les espaces blancs.
    • Pour une image de 1 024 x 1 024, elle consomme 1 290 jetons. Le nombre de jetons par image varie en fonction de la résolution de l'image. Pour en savoir plus sur le calcul des jetons, vous pouvez consulter notre documentation.
    • L'entrée vidéo consomme 258 jetons par seconde à la fréquence d'échantillonnage d'une image par seconde. Une vidéo avec audio est facturée à la fois pour les jetons vidéo et les jetons audio.
    • L'entrée audio consomme 25 jetons par seconde sans horodatage.

    Modèle

    Type
    Stockage
    (heures de modalité)

    Prix




    Gemini 2.0 Flash
    Texte d'entrée ($/M de caractères) 0,25 $ 0,009375 $
    Image d'entrée ($/image) 0,00129 $ 0,000048375 $
    Vidéo d'entrée ($/s) 0,000258 $ 0,000009675 $
    Audio d'entrée ($/s) 0,000025 $ 0,00000625 $
    Texte de sortie (€/M de caractères) N/A N/A




    Gemini 2.0 Flash-Lite
    Texte d'entrée ($/M de caractères) 0,25 $ 0,0046875 $
    Image d'entrée ($/image) 0,00129 $ 0,0000241875 $
    Vidéo d'entrée ($/s) 0,000258 $ 0,000009675 $
    Audio d'entrée ($/s) 0,000258 $ 0,0000048375 $
    Texte de sortie (€/M de caractères) N/A N/A


    Ancrage avec la recherche Google
    Gemini 2.0 Flash inclut jusqu'à 1 500 requêtes ancrées par jour sans frais supplémentaires. Les requêtes ancrées
    au-delà de 1 500 par jour sont facturées 35 $par tranche de 1 000 requêtes (jusqu'à 1 million de requêtes par jour).

    Si vous avez besoin de plus d'un million de requêtes par jour, veuillez contacter l'équipe de gestion de votre compte.

    Ancrage Web pour entreprise
    45 $ par tranche de 1 000 requêtes (jusqu'à 1 million de requêtes par jour) à partir du 5 mai 2025.

    Si vous avez besoin de plus d'un million de requêtes par jour, veuillez contacter l'équipe de gestion de votre compte.

    * Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.
    * Les PDF sont facturés comme des entrées d'image, une page de PDF équivalant à une image.
    * Le point de terminaison du modèle réglé a le même prix de prédiction que le modèle de base.
    * L'ancrage avec la recherche Google n'est facturé que pour les requêtes qui renvoient des résultats contenant au moins une URL d'ancrage issue du Web. Les frais d'utilisation standards du modèle Gemini s'appliquent également.

    Débit provisionné

    Le débit provisionné assure un débit pour vos besoins en IA générative et est géré par le biais d'unités de scaling pour l'IA générative, ou GSU. Pour en savoir plus sur le débit fourni par chaque GSU, cliquez ici. Vous pouvez également utiliser notre outil d'estimation en ligne ici.

    Durée Prix par GSU Par
    Engagement d'une semaine 1 200 $ Semaine
    Engagement d'un mois 2 700 $ Mois
    Engagement de 3 mois 2 400 $ Mois
    Engagement sur un an 2 000 $ Mois

    Exemple de calcul des coûts

    Un utilisateur doit s'assurer qu'il peut gérer 10 requêtes par seconde (RPS) avec une entrée de 1 000 jetons de texte et 500 jetons audio,et recevoir une sortie de 300 jetons de texte en utilisant gemini-2.0-flash.

    En utilisant le tableau des débits et des taux d'utilisation, nous savons que pour gemini-2.0-flash, le taux d'utilisation d'un jeton de texte en entrée est de 1 jeton, celui d'un jeton audio en entrée est de 7 jetons et celui d'un jeton de texte en sortie est de 4 jetons.

    Le nombre total de jetons d'entrée de l'utilisateur est de 1 000* (un jeton par jeton de texte d'entrée) + 500* (sept jetons par jeton audio d'entrée) = 4 500 jetons d'entrée ajustés pour l'épuisement. Le nombre total de jetons de sortie de l'utilisateur est de 300 x 4 jetons par jeton de texte de sortie = 1 200 jetons de sortie ajustés par épuisement. En les additionnant, nous obtenons 4 500 jetons d'entrée ajustés pour l'épuisement + 1 200 jetons de sortie ajustés pour l'épuisement = 5 700 jetons au total par requête.

    En multipliant le nombre total de jetons par requête par le nombre de RPS, nous obtenons 5 700 jetons au total par requête × 10 RPS = 57 000 jetons au total par seconde.

    En divisant ce nombre par le débit total par seconde par GSU,nous obtenons 57 000 jetons au total par seconde ÷ 3 360 jetons par seconde par GSU = 16,96 GSU. L'incrément minimal d'achat de GSU pour ce modèle est de 1. L'utilisateur aurait donc besoin de 17 GSU.

    Si l'utilisateur souhaitait maintenir ce débit pendant une semaine, cela lui coûterait 1 200 $ * 17 GSU = 20 400 $par semaine. S'ils souhaitaient maintenir ce débit pendant un mois, cela leur coûterait 2 700 $ * 17 GSU = 45 900 $par mois. S'ils souhaitaient maintenir ce débit pendant trois mois, cela leur coûterait 2 400 $ * 17 GSU = 40 800 $par mois. Enfin, s'ils souhaitaient maintenir ce débit pendant un an, cela leur coûterait 2 000 $ * 17 GSU = 34 000 $par mois.

    Réglage des modèles

    Le réglage de modèle est un moyen efficace de personnaliser les modèles volumineux pour vos tâches. Il s'agit d'une étape clé pour améliorer la qualité et l'efficacité du modèle. Le réglage du modèle offre les avantages suivants :

    • Une qualité supérieure pour vos tâches spécifiques
    • Robustesse accrue du modèle
    • Réduction de la latence et du coût d'inférence grâce à des requêtes plus courtes

    Le réglage est facturé par million de jetons d'entraînement. Les jetons d'entraînement sont calculés en multipliant le nombre total de jetons dans votre ensemble de données d'entraînement par le nombre d'époques. Pour l'inférence de modèle, le point de terminaison du modèle Gemini réglé a le même prix de prédiction que le modèle de base.

    Modèle Type Prix (par million de jetons d'entraînement)
    Gemini 2.5 Pro Réglage supervisé 25 $
    Gemini 2.0 Flash Affinage supervisé
    Réglage des préférences
    5 $
    Gemini 2.5 Flash Lite Affinage supervisé
    Réglage des préférences
    1,5 $
    Gemma 3 27B IT Réglage supervisé 6,83 $
    Llama 3.1 8B Réglage supervisé 0,67 $
    Llama 3.2 1B Réglage supervisé 0,28 $
    Llama 3.2 3B Réglage supervisé 0,61 $
    Llama 3.3 70B Réglage supervisé 6,72 $
    Llama 4 Scout 17B 16E Réglage supervisé 5,77 $
    Qwen 3 32B Réglage supervisé 6,57 $

    * Les jetons d'entraînement sont calculés en multipliant le nombre total de jetons dans votre ensemble de données d'entraînement par le nombre d'époques.
    * Le prix des prédictions pour un point de terminaison de modèle Gemini réglé est le même que pour le modèle de base.

    Comparer les tarifs des modèles partenaires sur Vertex AI

    Les modèles partenaires sont une liste organisée de modèles d'IA générative développés par les partenaires Google. Les modèles partenaires sont proposés en tant qu'API gérées. Pour en savoir plus, consultez la présentation des modèles partenaires. Les sections suivantes présentent les détails de tarification des modèles de partenaires Google.

    Modèles d'AI21 Labs

    Modèle Tarifs
    Jamba 1.5 Large (obsolète) Entrée : 2 $ par million de jetons
    Sortie : 8 $ par million de jetons
    Jamba 1.5 Mini (obsolète) Entrée : 0,20 $ par million de jetons
    Sortie : 0,40 $ par million de jetons

    Modèles Claude d'Anthropic

    Modèles avec des tarifs régionaux

    Monde

    Modèle Prix (pour 1 million de jetons) < 200 000 jetons en entrée Prix (pour 1 million de jetons) >= 200 000 jetons d'entrée
    Claude Opus 4.5 Entrée : 5 $
    Sortie : 25 $

    Entrée par lot : 2,50 $
    Sortie par lot : 12,50 $

    Écriture dans le cache (5 min) : 6,25 $
    Écriture dans le cache (1 h) : 10 $

    Accès au cache : 0,50 $

    Écriture dans le cache par lot (5 min) : 3,125 $
    Écriture dans le cache par lot (1 h) : 5 $
    Accès au cache par lot : 0,25 $
    Claude Sonnet 4.5 Entrée : 3 $
    Sortie : 15 $

    Entrée par lot : 1,50 $
    Sortie par lot : 7,50 $

    Écriture dans le cache (5 min) : 3,75 $
    Écriture dans le cache (1 h) : 6 $

    Accès au cache : 0,30 $

    Écriture dans le cache par lot : 1,88 $
    Accès au cache par lot : 0,15 $
    Entrée : 6 $
    Sortie : 22,50 $

    Entrée par lot : 3 $
    Sortie par lot : 11,25 $

    Écriture dans le cache (5 min) : 7,50 $
    Écriture dans le cache (1 h) : 12 $

    Accès au cache : 0,60 $

    Écriture dans le cache par lot : 3,75 $
    Accès au cache par lot : 0,30 $
    Claude Haiku 4.5 Entrée : 1 $
    Sortie : 5 $

    Entrée par lot : 0,50 $
    Sortie par lot : 2,50 $

    Écriture dans le cache (5 min) : 1,25 $
    Écriture dans le cache (1 h) : 2 $

    Accès au cache : 0,10 $

    Écriture dans le cache par lot : 0,625 $
    Accès au cache par lot : 0,05 $

    us-east5

    Modèle Prix (pour 1 million de jetons) < 200 000 jetons en entrée Prix (pour 1 million de jetons) >= 200 000 jetons d'entrée
    Claude Opus 4.5 Entrée : 5,50 $
    Sortie : 27,50 $

    Entrée par lot : 2,75 $
    Sortie par lot : 13,75 $

    Écriture dans le cache (5 min) : 6,875 $
    Écriture dans le cache (1 h) : 11 $

    Accès au cache : 0,55 $

    Écriture dans le cache par lot (5 min) : 3,438 $

    Écriture dans le cache par lot (1 h) : 5,50 $
    Accès au cache par lot : 0,275 $
    Claude Sonnet 4.5 Entrée : 3,30 $
    Sortie : 16,50 $

    Entrée par lot : 1,65 $
    Sortie par lot : 8,25 $

    Écriture dans le cache (5 min) : 4,13 $
    Écriture dans le cache (1 h) : 6,60 $

    Accès au cache : 0,33 $

    Écriture dans le cache par lot : 2,06 $
    Accès au cache par lot : 0,17 $
    Entrée : 6,60 $
    Sortie : 24,75 $

    Entrée par lot : 3,30 $
    Sortie par lot : 12,38 $

    Écriture dans le cache (5 min) : 8,25 $
    Écriture dans le cache (1 h) : 13,20 $

    Accès au cache : 0,66 $

    Écriture dans le cache par lot : 4,13 $
    Accès au cache par lot : 0,33 $
    Claude Haiku 4.5 Entrée : 1,10 $
    Sortie : 5,50 $

    Entrée par lot : 0,55 $
    Sortie par lot : 2,75 $

    Écriture dans le cache (5 min) : 1,375 $
    Écriture dans le cache (1 h) : 2,20 $

    Écriture dans le cache : 1,375 $
    Accès au cache : 0,11 $

    Écriture dans le cache par lot : 0,688 $
    Accès au cache par lot : 0,055 $

    europe-west1

    Modèle Prix (pour 1 million de jetons) < 200 000 jetons en entrée Prix (pour 1 million de jetons) >= 200 000 jetons d'entrée
    Claude Opus 4.5 Entrée : 5,50 $
    Sortie : 27,50 $

    Entrée par lot : 2,75 $
    Sortie par lot : 13,75 $

    Écriture dans le cache (5 min) : 6,875 $
    Écriture dans le cache (1 h) : 11 $

    Accès au cache : 0,55 $

    Écriture dans le cache par lot (5 min) : 3,438 $

    Écriture dans le cache par lot (1 h) : 5,50 $
    Accès au cache par lot : 0,275 $
    Claude Sonnet 4.5 Entrée : 3,30 $
    Sortie : 16,50 $

    Entrée par lot : 1,65 $
    Sortie par lot : 8,25 $

    Écriture dans le cache (5 min) : 4,13 $
    Écriture dans le cache (1 h) : 6,60 $

    Accès au cache : 0,33 $

    Écriture dans le cache par lot : 2,06 $
    Accès au cache par lot : 0,17 $
    Entrée : 6,60 $
    Sortie : 24,75 $

    Entrée par lot : 3,30 $
    Sortie par lot : 12,38 $

    Écriture dans le cache (5 min) : 8,25 $
    Écriture dans le cache (1 h) : 13,20 $

    Accès au cache : 0,66 $

    Écriture dans le cache par lot : 4,13 $
    Accès au cache par lot : 0,33 $
    Claude Haiku 4.5 Entrée : 1,10 $
    Sortie : 5,50 $

    Entrée par lot : 0,55 $
    Sortie par lot : 2,75 $

    Écriture dans le cache (5 min) : 1,375 $
    Écriture dans le cache (1 h) : 2,20 $

    Accès au cache : 0,11 $

    Écriture dans le cache par lot : 0,688 $
    Accès au cache par lot : 0,055 $

    asia-southeast1

    Modèle Prix (pour 1 million de jetons) < 200 000 jetons en entrée Prix (pour 1 million de jetons) >= 200 000 jetons d'entrée
    Claude Opus 4.5 Entrée : 5,50 $
    Sortie : 27,50 $

    Entrée par lot : 2,75 $
    Sortie par lot : 13,75 $

    Écriture dans le cache (5 min) : 6,875 $
    Écriture dans le cache (1 h) : 11 $

    Accès au cache : 0,55 $

    Écriture dans le cache par lot (5 min) : 3,438 $

    Écriture dans le cache par lot (1 h) : 5,50 $
    Accès au cache par lot : 0,275 $
    Claude Sonnet 4.5 Entrée : 3,30 $
    Sortie : 16,50 $

    Entrée par lot : 1,65 $
    Sortie par lot : 8,25 $

    Écriture dans le cache (5 min) : 4,13 $
    Écriture dans le cache (1 h) : 6,60 $

    Accès au cache : 0,33 $

    Écriture dans le cache par lot : 2,06 $
    Accès au cache par lot : 0,17 $
    Entrée : 6,60 $
    Sortie : 24,75 $

    Entrée par lot : 3,30 $
    Sortie par lot : 12,38 $

    Écriture dans le cache (5 min) : 8,25 $
    Écriture dans le cache (1 h) : 13,20 $

    Accès au cache : 0,66 $

    Écriture dans le cache par lot : 4,13 $
    Accès au cache par lot : 0,33 $

    asia-east1

    Modèle Prix (pour 1 million de jetons) < 200 000 jetons en entrée Prix (pour 1 million de jetons) >= 200 000 jetons d'entrée
    Claude Haiku 4.5 Entrée : 1,10 $
    Sortie : 5,50 $

    Entrée par lot : 0,55 $
    Sortie par lot : 2,75 $

    Écriture dans le cache (5 min) : 1,375 $
    Écriture dans le cache (1 h) : 2,20 $

    Écriture dans le cache : 1,375 $
    Accès au cache : 0,11 $

    Écriture dans le cache par lot : 0,688 $
    Accès au cache par lot : 0,055 $

    * Si le contexte d'entrée d'une requête est supérieur ou égal à 200 000 jetons, tous les jetons (entrée et sortie) sont facturés aux tarifs du contexte long.

    Modèles avec des prix uniformes dans toutes les régions

    Modèle Prix (pour 1 million de jetons) < 200 000 jetons en entrée Prix (pour 1 million de jetons) >= 200 000 jetons d'entrée
    Claude Opus 4.1 Entrée : 15 $
    Sortie : 75 $

    Entrée par lot : 7,50 $
    Sortie par lot : 37,50 $

    Écriture dans le cache (5 min) : 18,75 $
    Écriture dans le cache (1 h) : 30 $

    Accès au cache : 1,50 $

    Écriture dans le cache par lot : 9,375 $
    Accès au cache par lot : 0,75 $
    N/A
    Claude Opus 4 Entrée : 15 $
    Sortie : 75 $

    Entrée par lot : 7,50 $
    Sortie par lot : 37,50 $

    Écriture dans le cache (5 min) : 18,75 $
    Écriture dans le cache (1 h) : 30 $

    Accès au cache : 1,50 $

    Écriture dans le cache par lot : 9,375 $
    Accès au cache par lot : 0,75 $
    N/A
    Claude Sonnet 4 Entrée : 3 $
    Sortie : 15 $

    Entrée par lot : 1,50 $
    Sortie par lot : 7,50 $

    Écriture dans le cache pendant 5 min : 3,75 $
    Écriture dans le cache pendant 1 h : 6 $

    Accès au cache : 0,30 $

    Écriture dans le cache par lot : 1,875 $
    Accès au cache par lot : 0,15 $
    Entrée : 6 $
    Sortie : 22,50 $

    Entrée par lot : 3 $
    Sortie par lot : 11,25 $

    Écriture dans le cache (5 min) : 7,50 $
    Écriture dans le cache (1 h) : 12 $

    Accès au cache : 0,60 $

    Écriture dans le cache par lot : 3,75 $
    Accès au cache par lot : 0,30 $
    Claude 3.5 Haiku Entrée : 0,80 $
    Sortie : 4 $

    Entrée par lot : 0,40 $
    Sortie par lot : 2 $

    Écriture dans le cache (5 min) : 1 $
    Écriture dans le cache (1 h) : 1,60 $

    Accès au cache : 0,08 $

    Écriture dans le cache par lot : 0,50 $
    Accès au cache par lot : 0,04 $
    N/A
    Claude 3 Haiku Entrée : 0,25 $
    Sortie : 1,25 $

    Écriture dans le cache (5 min) : 0,30 $
    Écriture dans le cache (1 h) : 0,50 $

    Accès au cache : 0,03 $
    N/A
    Claude 3.7 Sonnet (obsolète) Entrée : 3 $
    Sortie : 15 $

    Entrée par lot : 1,50 $
    Sortie par lot : 7,50 $

    Écriture dans le cache : 3,75 $
    Accès au cache : 0,30 $

    Écriture dans le cache par lot : 1,875 $
    Accès au cache par lot : 0,15 $
    N/A
    Claude 3.5 Sonnet v2 (obsolète) Entrée : 3 $
    Sortie : 15 $

    Entrée par lot : 1,50 $
    Sortie par lot : 7,50 $

    Écriture dans le cache : 3,75 $
    Accès au cache : 0,30 $

    Écriture dans le cache par lot : 1,875 $
    Accès au cache par lot : 0,15 $
    N/A
    Claude 3.5 Sonnet (obsolète) Entrée : 3 $
    Sortie : 15 $

    Écriture dans le cache : 3,75 $
    Lecture dans le cache : 0,30 $
    N/A
    Claude 3 Opus (obsolète) Entrée : 15 $
    Sortie : 75 $

    Écriture dans le cache : 18,75 $
    Accès au cache : 1,50 $
    N/A

    * Si le contexte d'entrée d'une requête est supérieur ou égal à 200 000 jetons, tous les jetons (entrée et sortie) sont facturés aux tarifs du contexte long.

    Tarification des outils

    Outil Prix
    Demande de recherche sur le Web 10$par tranche de 1 000 recherches
    Modèles compatibles : Claude Haiku 4.5, Claude Sonnet 4.5, Claude Sonnet 4, Claude Opus 4.1 et Claude Opus 4.

    * Si le contexte d'entrée d'une requête est supérieur ou égal à 200 000 jetons, tous les jetons (entrée et sortie) sont facturés aux tarifs du contexte long.

    Modèles de Deepseek

    Modèle Tarifs
    DeepSeek-V3.1 Entrée : 0,60 $ par million de jetons
    Sortie : 1,70 $ par million de jetons

    Entrée par lot : 0,30 $ par million de jetons
    Sortie par lot : 0,85 $ par million de jetons
    DeepSeek-R1 (0528) Entrée : 1,35 $ par million de jetons
    Sortie : 5,40 $ par million de jetons

    Entrée par lot : 0,675 $ par million de jetons
    Sortie par lot : 2,70 $ par million de jetons
    DeepSeek-OCR * Entrée : 0,30 $ par million de jetons (ou 0,0003 $par page)
    Sortie : 1,20 $ par million de jetons (ou 0,00012 $par page)
    • Disponible sans frais jusqu'au 10 novembre 2025.

    Modèles de MiniMax

    Modèle Tarifs
    MiniMax-M2 * Entrée : 0,30 $ par million de jetons
    Sortie : 1,20 $ par million de jetons
    • Disponible sans frais jusqu'au 10 novembre 2025.

    Modèles de Moonshot

    Modèle Tarifs
    Kimi-K2-Thinking * Entrée : 0,60 $ par million de jetons
    Sortie : 2,50 $ par million de jetons
    • Disponible sans frais jusqu'au 17 novembre 2025.

    Modèles Qwen

    Modèle Tarifs
    Qwen3-Next-80B-Thinking Entrée : 0,15 $ par million de jetons
    Sortie : 1,20 $ par million de jetons
    Qwen3-Next-80B-Instruct Entrée : 0,15 $ par million de jetons
    Sortie : 1,20 $ par million de jetons
    Qwen3-Coder-480B-A35B-Instruct Entrée : 0,22 $ par million de jetons
    Sortie : 1,80 $ par million de jetons

    Entrée par lot : 0,11 $ par million de jetons
    Sortie par lot : 0,90 $ par million de jetons
    Qwen3-235B-A22B-Instruct-2507 Entrée : 0,22 $ par million de jetons
    Sortie : 0,88 $ par million de jetons

    Entrée par lot : 0,11 $ par million de jetons
    Sortie par lot : 0,44 $ par million de jetons

    Modèles d'OpenAI

    Modèle Tarifs
    gpt-oss-120b Entrée : 0,09 $ par million de jetons
    Sortie : 0,36 $ par million de jetons

    Entrée par lot : 0,045 $ par million de jetons
    Sortie par lot : 0,18 $ par million de jetons
    gpt-oss-20b Entrée : 0,07 $ par million de jetons
    Sortie : 0,25 $ par million de jetons

    Entrée par lot : 0,035 $ par million de jetons
    Sortie par lot : 0,125 $ par million de jetons

    Modèles Llama de Meta

    Modèle Tarifs
    Llama 3.1 405B Entrée : 5 $ par million de jetons
    Sortie : 16 $ par million de jetons
    Llama 3.3 70B Entrée : 0,72 $ par million de jetons
    Sortie : 0,72 $ par million de jetons

    Entrée par lot : 0,36 $ par million de jetons
    Sortie par lot : 0,36 $ par million de jetons
    Llama 4 Scout Entrée : 0,25 $ par million de jetons
    Sortie : 0,70 $ par million de jetons

    Entrée par lot : 0,125 $ par million de jetons
    Sortie par lot : 0,35 $ par million de jetons
    Llama 4 Maverick Entrée : 0,35 $ par million de jetons
    Sortie : 1,15 $ par million de jetons

    Entrée par lot : 0,175 $ par million de jetons
    Sortie par lot : 0,575 $ par million de jetons

    Modèles de Mistral AI

    Modèle Tarifs
    Mistral OCR (25.05) Entrée : 0,0005 $ par million de jetons (ou 0,0005 $par page)
    Sortie : 0,0005 $ par million de jetons (ou 0,0005 $par page)
    Mistral Medium 3 Entrée : 0,40 $ par million de jetons
    Sortie : 2 $ par million de jetons
    Mistral Small 3.1 (25.03) Entrée : 0,10 $ par million de jetons
    Sortie : 0,30 $ par million de jetons
    Mistral Large (24.11) (obsolète) Entrée : 2 $ / million de jetons
    Sortie : 6 $ / million de jetons
    Codestral 2 Entrée : 0,30 $ par million de jetons
    Sortie : 0,90 $ par million de jetons
    Codestral (25.01) (obsolète) Entrée : 0,30 $ par million de jetons
    Sortie : 0,90 $ par million de jetons

    Demander un devis personnalisé

    Avec le paiement à l'usage de Google Cloud, vous ne payez que pour les services que vous utilisez. Contactez notre équipe commerciale pour obtenir un devis personnalisé pour votre entreprise.
    Contacter le service commercial