Tarification de Vertex AI

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.

Cette page présente les tarifs de l'IA générative sur Vertex AI. Pour connaître les autres tarifs de Vertex AI, y compris les services ML Platform et MLOps, consultez la page des tarifs de Vertex AI.

Modèles Google

Gemini

Avec les modèles multimodaux de Vertex AI, vous pouvez saisir du texte ou des médias (images, vidéos). L'entrée Text est facturée tous les 1 000 caractères d'entrée (requête) et tous les 1 000 caractères de sortie (réponse). Les caractères sont comptés par points de code UTF-8 et les espaces sont exclus du décompte, ce qui donne environ 4 caractères par jeton. Les requêtes de prédiction qui mènent à des réponses filtrées sont facturées en fonction de l'entrée uniquement. À la fin de chaque cycle de facturation, les fractions d'un centime (0,01 $) sont arrondies à un centime. L'entrée multimédia est facturée à l'image ou à la seconde (vidéo).

Modèle Caractéristique Type Prix
( =< 128 000 jetons d'entrée)
Prix
(plus de 128 000 jetons d'entrée)
Gemini 1.5 Flash Multimode Entrée d'image
Entrée vidéo
Entrée de texte
Entrée audio
0,00002 $ par image
0,00002$par seconde
0,00001875 $/1 000 caractères
0,000002$par seconde
0,00004 $/image
0,00004$par seconde
0,0000375 $/1 000 caractères
0,000004$par seconde
Sortie textuelle 0,000075 $ / 1 000 caractères 0,00015 $ / 1 000 caractères
Réglage* Jeton d'entraînement 8 $ / M de jetons
Gemini 1.5 Pro Multimode Entrée d'image
Entrée vidéo
Entrée de texte
Entrée audio
0,00032875 $/image
0,00032875$par seconde
0,0003125 $/1 000 caractères
0,00003125$par seconde
0,0006575 $/image
0,0006575$par seconde
0,000625 $/1 000 caractères
0,0000625$par seconde
Sortie textuelle 0,00125 $ / 1 000 caractères 0,0025 $ / 1 000 caractères
Réglage* Jeton d'entraînement 80 $ / M de jetons
Gemini 1.0 Pro Multimode Entrée image
Entrée vidéo
Entrée textuelle
0,0025 $ par image
0,002 $ par seconde
0,000125 $ pour 1 000 caractères
Sortie textuelle 0,000375 $ pour 1 000 caractères
Ancrage avec la recherche Google Texte Requêtes d'ancrage 35 $ / 1 000 requêtes (jusqu'à 1 million de requêtes par jour).
Veuillez contacter l'équipe chargée de votre compte si vous avez besoin
de plus d'un million de requêtes par jour.

* Les prix sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.
* Si un contexte de requête dépasse 128 Ko, tous les jetons sont facturés à des tarifs de contexte élevés.
* Les modèles Gemini sont disponibles en mode de traitement par lot avec une remise de 50 %.
* Gemini 1.0 Pro n'accepte que la fenêtre de contexte jusqu'à 32 Ko.
* Les PDF sont facturés comme des images d'entrée, et une page PDF équivaut à une image.
* Le point de terminaison du modèle réglé présente le même prix de prédiction que le modèle de base.
* Ancrage avec la recherche Google: si vous utilisez la récupération dynamique pour optimiser les coûts, seules les requêtes contenant au moins une URL d'assistance d'ancrage provenant du Web dans leur réponse sont facturées pour l'ancrage avec la recherche Google. Les frais liés à Gemini s'appliquent toujours.

Imagen

Avec Imagen sur Vertex AI, vous pouvez générer de nouvelles images et les modifier en fonction des requêtes textuelles que vous fournissez, ou ne modifier que certaines parties des images en utilisant une zone de masque que vous définissez et de nombreuses autres fonctionnalités.

Modèle Fonctionnalité Description Entrée Sortie Prix
Imagen 3 Génération d'images Générer une image Requête textuelle Image 0,04 $ par image
Imagen 3 Fast Génération d'images Générer une image Requête textuelle Image 0,02 $ par image
Imagen 2, Imagen Génération d'images Générer une image Requête textuelle Images 0,020 $ par image
Édition d'images Modifier une image par une approche avec masque ou sans masque Image/Requête textuelle Images 0,020 $ par image
Augmentation de la résolution Augmenter la résolution d'une image générée à 2k ou 4k Images Images 0,003 $ par image
Réglage Activer un "sujet" fourni par l'utilisateur à utiliser dans les requêtes Imagen (quelques plans) Sujet(s) avec identifiant textuel et 4 à 8 images par sujet Modèle affiné (après l'entraînement avec des sujets fournis par l'utilisateur) $ par heure-nœud (tarifs d'entraînement personnalisé Vertex AI)
Visual Captioning Générer une légende textuelle courte ou longue pour une image Images Légende textuelle 0,0015 $ par image
Questions/réponses visuelles Fournir une réponse basée sur une question faisant référence à une image Image/Requête textuelle Réponse textuelle 0,0015 $ par image

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

Embedding

Modèle Fonctionnalité Description Entrée Sortie Prix
intégration multimodale Représentations vectorielles continues pour les fonctions multimodales: texte Générer des représentations vectorielles continues en utilisant du texte comme entrée Texte Embeddings 0,0002 $ pour 1000 caractères d'entrée
Représentations vectorielles continues pour les fonctions multimodales: image Générer des représentations vectorielles continues en utilisant une image comme entrée Images Embeddings 0,0001 $ par image d'entrée
Représentations vectorielles continues pour les fonctions multimodales: Video Plus Vidéo Plus Vidéo Représentations vectorielles continues (jusqu'à 15 représentations vectorielles continues par minute de vidéo) 0,0020 $ par seconde de vidéo
Représentations vectorielles continues pour les fonctions multimodales: vidéo standard Vidéo Standard Vidéo Représentations vectorielles continues (jusqu'à 8 représentations vectorielles continues par minute de vidéo) 0,0010 $ par seconde de vidéo
Représentations vectorielles continues pour les fonctions multimodales: l'essentiel de la vidéo Vidéo Essentiel Vidéo Représentations vectorielles continues (jusqu'à 4 représentations vectorielles continues par minute de vidéo) 0,0005 $ par seconde de vidéo
Modèle Type Région Prix par tranche de 1000 caractères
Embeddings pour le texte Entrée Globaux
  • Requêtes en ligne : 0,000025 $
  • Requêtes par lot : 0,00002 $
Sortie Monde
  • Requêtes en ligne : sans frais
  • Requêtes par lot : sans frais

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

Complétion de code

La prise en charge de l'IA générative sur Vertex AI est facturée pour chaque tranche de 1000 caractères d'entrée (requête) et pour chaque tranche de 1000 caractères de sortie (réponse). Les caractères sont comptabilisés avec les points de code UTF-8, et les espaces sont exclus du décompte. Pendant la phase de bêta, les frais sont réduits de 100 %. Les requêtes de prédiction qui mènent à des réponses filtrées sont facturées en fonction de l'entrée uniquement. À la fin de chaque cycle de facturation, les fractions d'un centime (0,01 €) sont arrondies à un centime.

Modèle Type Région Prix par tranche de 1000 caractères
Codey pour la saisie de code Entrée Global
  • Requêtes en ligne : 0,00025 $
Sortie Global
  • Requêtes en ligne : 0,0005 $

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

Traduction (texte)

Utilisez l'API Vertex AI et le LLM de traduction pour traduire du texte. Les traductions LLM sont généralement plus fluides et humaines que les modèles de traduction classiques, mais l'assistance linguistique est plus limitée(en savoir plus).

Modèle Méthode Utilisation Prix par million de caractères
LLM Traduction de texte (preview)* Nombre de caractères d'entrée par mois

10 $ par million de caractères*

Nombre de caractères de sortie par mois

10 $ par million de caractères*

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.
* Le prix est calculé en fonction du caractère traité par le modèle. Pour en savoir plus sur le décompte des caractères, consultez Caractères facturés.

Mise en cache contextuelle

Grâce à la mise en cache contextuelle, vous pouvez réduire de 75% le coût de traitement des jetons d'entrée Gemini et la latence de génération de contenu en mettant en cache la partie contexte de votre texte d'entrée ou de votre contenu multimédia dans les modèles Gemini. La durée pendant laquelle les données sont stockées dans le cache, qui peut être contrôlée par l'utilisateur, détermine les frais liés au "stockage dans le cache contextuel". Lors de la création d'un contexte mis en cache, le coût du jeton d'entrée standard est facturé aux utilisateurs. Les succès de cache (hit) sur les données d'entrée sont facturés à un tarif réduit ("Entrée en cache"), au lieu du coût d'entrée normal. La taille des données pour le stockage et l'entrée est calculée de la même manière que pour la tarification en entrée de Gemini.

Modèle Fonctionnalité Type Prix ( =< 128 000 jetons d'entrée) Prix (> 128 000 jetons d'entrée)
Gemini 1.5 Flash Entrée en cache Entrée d'image
Entrée vidéo
Entrée de texte
Entrée audio
0,000005 / image
0,000005 / seconde
0,0000046875 / 1 000 caractères
0,0000005 / seconde
0,00001 / image
0,00001 / seconde
0,000009375 / 1 000 caractères
0,000001 / seconde
Stockage du cache contextuel Entrée d'image
Entrée vidéo
Entrée de texte
Entrée audio
0,000263 / image / h
0,000263/ seconde / h
0,00025 / 1 000 caractères / h
0,000025 / seconde / h
Gemini 1.5 Pro Entrée en cache Entrée d'image
Entrée vidéo
Entrée de texte
Entrée audio
0,0000821875 / image
0,0000821875 / seconde
0,000078125 / 1 000 caractères
0,0000078125 / seconde
0,000164375 / image
0,000164375 / seconde
0,00015625 / 1 000 caractères
0,000015625 / seconde
Stockage du cache contextuel Entrée d'image
Entrée vidéo
Entrée de texte
Entrée audio
0,0011835 / image / h
0,0011835/ seconde / h
0,001125 / 1 000 caractères / h
0,0001125 / seconde / h

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

Exemple de calcul des coûts mis en cache

Si un utilisateur crée un contexte mis en cache de 250 000 caractères avec une valeur TTL de deux heures,puis envoie vingt requêtes distinctes au modèle Gemini 1.5 Pro pendant ces deux heures, et que chaque requête inclut une requête de 200 caractères dans le contexte mis en cache et une sortie de 400 caractères, le coût total est calculé comme suit:

Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.

Exemple de calcul des coûts

Si un utilisateur envoie cinq requêtes distinctes au modèle PaLM Text Bison, et que chaque requête contient une entrée de 200 caractères pour une réponse de 400 caractères, le coût total est calculé comme suit :

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

Modèles partenaires

Les modèles partenaires sont une liste de modèles d'IA générative développés par des partenaires Google. Les modèles de partenaires sont proposés en tant qu'API gérées. Pour en savoir plus, consultez la page Présentation des modèles partenaires. Les informations tarifaires des modèles de partenaires Google sont indiquées dans les sections suivantes.

Modèles d'atelier AI21

Modèle Tarifs
Jamba 1.5 Large Entrée: 2 $ / million de jetons
Résultat: 8 $ / million de jetons
Jamba 1.5 Mini Entrée: 0,20 $ / million de jetons
Résultat: 0,40 $ / million de jetons

Modèles Claude d'Anthropic

Modèle Tarifs
Claude 3.5 Haiku Entrée: 1 $ / million de jetons
Résultat: 5 $ / million de jetons
Claude 3.5 Sonnet v2 Entrée: 3 $ / million de jetons
Résultat: 15 $ / million de jetons
Claude 3.5 Sonnet Entrée: 3 $ / million de jetons
Résultat: 15 $ / million de jetons
Claude 3 Haiku Entrée: 0,25 $ / million de jetons
Résultat: 1,25 $ / million de jetons
Claude 3 Sonnet Entrée: 3 $ / million de jetons
Résultat: 15 $ / million de jetons
Claude 3 Opus Entrée: 15 $ / million de jetons
Résultat: 75 $ / million de jetons

Modèles Llama de Meta

Modèle Tarifs
Llama 3.1 405B Entrée: 5 $ / million de jetons
Résultat: 16 $ / million de jetons

Modèles Mistral AI

Modèle Tarifs
Mistral Large (2407) Entrée: 2 $ / million de jetons
Résultat: 6 $ / million de jetons
Mistral Nemo Entrée: 0,15 $ / million de jetons
Résultat: 0,15 $ / million de jetons
Codestral Entrée: 0,20 $ / million de jetons
Résultat: 0,60 $ / million de jetons

Demander un devis personnalisé

Avec le paiement à l'usage de Google Cloud, vous ne payez que pour les services que vous utilisez. Contactez notre équipe commerciale pour obtenir un devis personnalisé pour votre entreprise.
Contacter le service commercial