Tarification de Vertex AI
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.
Cette page présente les tarifs de l'IA générative sur Vertex AI. Pour tous les autres tarifs de Vertex AI, y compris les services ML Platform et MLOps, consultez la page des tarifs de Vertex AI.
Modèles Google
Gemini
Avec les modèles multimodaux de Vertex AI, vous pouvez fournir en entrée du texte ou des médias (images, vidéos). Les entrées de type texte sont facturées pour chaque tranche de 1 000 caractères d'entrée (requête) et pour chaque tranche de 1 000 caractères de sortie (réponse). Les caractères sont comptabilisés avec les points de code UTF-8, et les espaces sont exclus du décompte. Il en résulte environ quatre caractères par jeton. Les requêtes de prédiction qui aboutissent à des réponses filtrées ne sont facturées que pour l'entrée. À la fin de chaque cycle de facturation, les fractions de centime (0,01 $) sont arrondies à un centime. Les entrées de type médias sont facturées par image ou par seconde (vidéo).
Modèle | Caractéristique | Type | Prix ( =< 128 k jetons d'entrée) |
Prix (> 128 k jetons d'entrée) |
---|---|---|---|---|
Gemini 1.5 Flash | Multimode | Entrée image Entrée vidéo Entrée texte Entrée audio |
0,00002 $ par image 0,00002$par seconde 0,00001875$pour 1 000 caractères 0,000002$par seconde |
0,00004 $ par image 0,00004$par seconde 0,0000375$pour 1 000 caractères 0,000004$par seconde |
Sortie textuelle | 0,000075 $ pour 1 000 caractères | 0,00015 $ pour 1 000 caractères | ||
Réglage* | Jeton de formation | 8 $ / M de jetons | ||
Gemini 1.5 Pro | Multimode | Entrée image Entrée vidéo Entrée texte Entrée audio |
0,00032875 $ par image 0,00032875$par seconde 0,0003125$pour 1 000 caractères 0,00003125$par seconde |
0,0006575 $ par image 0,0006575$par seconde 0,000625$pour 1 000 caractères 0,0000625$par seconde |
Sortie textuelle | 0,00125 $ pour 1 000 caractères | 0,0025 $ pour 1 000 caractères | ||
Réglage* | Jeton de formation | 80 $ / M de jetons | ||
Gemini 1.0 Pro | Multimode | Entrée image Entrée vidéo Entrée textuelle |
0,0025 $ par image 0,002 $ par seconde 0,000125 $ pour 1 000 caractères |
|
Sortie textuelle | 0,000375 $ pour 1 000 caractères | |||
Ancrage avec la recherche Google | Texte | Requêtes ancrées | 35 $ par tranche de 1 000 requêtes (jusqu'à 1 million de requêtes par jour). Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes par jour. |
* Les tarifs sont indiqués en dollars américains (USD).
Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
* Si le contexte d'une requête est plus long que 128 000 jetons, tous les jetons sont facturés au tarif des contextes longs.
* Les modèles Gemini sont disponibles en mode par lot avec une remise de 50 %.
* Gemini 1.0 Pro ne prend en charge que les fenêtres de contexte de 32 k au maximum.
* Les PDF sont facturés comme des entrées d'image, une page PDF étant équivalente à une image.
* Le point de terminaison du modèle réglé est facturé au même prix que le modèle de base.
* Grounding avec la recherche Google: si vous utilisez la reprise dynamique pour optimiser les coûts, seules les requêtes dont la réponse contient au moins une URL de prise en charge de grounding sur le Web sont facturées pour le grounding avec la recherche Google. Les coûts de Gemini s'appliquent toujours.
Imagen
Avec Imagen sur Vertex AI, vous pouvez générer de nouvelles images ou modifier des images existantes sur la base de requêtes de texte que vous fournissez, modifier partiellement des images à l'aide d'une zone de masquage que vous définissez, et bien d'autres fonctionnalités encore.
Modèle | Fonctionnalité | Description | Entrée | Sortie | Prix |
---|---|---|---|---|---|
Image 3 | Génération d'images | Générer une image | Requête textuelle | Image | 0,04 $ par image |
Imagen 3 Fast | Génération d'images | Générer une image | Requête textuelle | Image | 0,02 $ par image |
Imagen 2, Imagen | Génération d'images | Générer une image | Requête textuelle | Images | 0,020 $ par image |
Édition d'images | Modifier une image par une approche avec masque ou sans masque | Image/Requête textuelle | Images | 0,020 $ par image | |
Augmentation de la résolution | Augmenter la résolution d'une image générée à 2k ou 4k | Images | Images | 0,003 $ par image | |
Réglage | Permettre l'utilisation d'un "sujet" fourni par l'utilisateur dans les requêtes Imagen (entraînement "few-shot") | Sujet(s) avec identifiant textuel et 4 à 8 images par sujet | Modèle affiné (après l'entraînement avec des sujets fournis par l'utilisateur) | $ par heure-nœud (tarifs d'entraînement personnalisé Vertex AI) | |
Visual Captioning | Générer une légende textuelle courte ou longue pour une image | Images | Légende textuelle | 0,0015 $ par image | |
Questions/réponses visuelles | Fournir une réponse basée sur une question faisant référence à une image | Image/Requête textuelle | Réponse textuelle | 0,0015 $ par image |
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
Embedding
Modèle | Fonctionnalité | Description | Entrée | Sortie | Prix |
---|---|---|---|---|---|
Embedding multimodal | Embeddings multimodaux: texte | Générer des représentations vectorielles continues en utilisant du texte comme entrée | Texte | Embeddings | 0,0002 $ pour 1000 caractères d'entrée |
Représentations vectorielles continues pour la requête multimodale: image | Générer des représentations vectorielles continues en utilisant une image comme entrée | Images | Embeddings | 0,0001 $ par image d'entrée | |
Embeddings multimodaux: vidéo plus | Vidéo Plus | Vidéo | Représentations vectorielles continues (jusqu'à 15 représentations vectorielles continues par minute de vidéo) | 0,0020 $ par seconde de vidéo | |
Embeddings multimodaux: vidéo standard | Vidéo Standard | Vidéo | Représentations vectorielles continues (jusqu'à 8 représentations vectorielles continues par minute de vidéo) | 0,0010 $ par seconde de vidéo | |
Embeddings multimodaux: vidéo | Vidéo Essentiel | Vidéo | Représentations vectorielles continues (jusqu'à quatre représentations vectorielles continues par minute de vidéo) | 0,0005 $ par seconde de vidéo |
Modèle | Type | Région | Prix par tranche de 1000 caractères |
---|---|---|---|
Embeddings pour le texte | Entrée | Globaux |
|
Sortie | Monde |
|
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
Complétion de code
La prise en charge de l'IA générative sur Vertex AI est facturée pour chaque tranche de 1000 caractères d'entrée (requête) et pour chaque tranche de 1000 caractères de sortie (réponse). Les caractères sont comptabilisés avec les points de code UTF-8, et les espaces sont exclus du décompte. Pendant la phase de bêta, les frais sont réduits de 100 %. Les requêtes de prédiction qui aboutissent à des réponses filtrées ne sont facturées que pour l'entrée. À la fin de chaque cycle de facturation, les fractions de centime (0,01 $) sont arrondies à un centime.
Modèle | Type | Région | Prix par tranche de 1000 caractères |
---|---|---|---|
Codey pour la saisie de code | Entrée | Global |
|
Sortie | Global |
|
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
Traduction (texte)
Utilisez l'API Vertex AI et le LLM de traduction pour traduire du texte. Les traductions LLM ont tendance à être plus fluides et naturelles que celles des modèles de traduction classiques, mais elles sont moins nombreuses en termes de langues disponibles (En savoir plus).
Modèle | Méthode | Utilisation | Prix par million de caractères |
---|---|---|---|
LLM | Traduction de texte (Preview)* | Nombre de caractères saisis par mois |
10 $ par million de caractères* |
Nombre de caractères de sortie par mois |
10 $ par million de caractères* |
Les tarifs sont indiqués en dollars américains (USD).
Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
* Le prix est calculé en fonction du nombre de caractères traités par le modèle. Pour en savoir plus sur le comptage de caractères, consultez la section Caractères facturés
Mise en cache de contexte
La mise en cache du contexte vous permet de réduire le coût du traitement des jetons d'entrée Gemini de 75% et la latence de la génération de contenu en mettant en cache la partie contextuelle de votre texte ou de vos éléments multimédias d'entrée dans les modèles Gemini. La durée de stockage des données dans le cache, qui peut être contrôlée par l'utilisateur, détermine les frais de stockage du cache de contexte. Lorsque vous créez un contexte mis en cache, le coût standard des jetons d'entrée est facturé aux utilisateurs. Les correspondances de cache sur les données d'entrée sont facturées à un tarif réduit, "Données d'entrée mises en cache", au lieu du coût normal des données d'entrée. La taille des données pour le stockage et l'entrée est calculée de la même manière que le prix des entrées Gemini.
Modèle | Fonctionnalité | Type | Prix ( =< 128 k jetons d'entrée) | Prix ( > 128 k jetons d'entrée) |
---|---|---|---|---|
Gemini 1.5 Flash | Entrée mise en cache | Entrée image Entrée vidéo Entrée texte Entrée audio |
0,000005 $ / image 0,000005 $ / seconde 0,0000046875 $ / 1 000 caractères 0,0000005 $ / seconde |
0,00001 / image 0,00001 / seconde 0,000009375 / 1 000 caractères 0,000001 / seconde |
Espace de stockage du cache contextuel | Entrée image Entrée vidéo Entrée texte Entrée audio |
0,000263 / image / h 0,000263/ seconde / h 0,00025 / 1 000 caractères / h 0,000025 / seconde / h |
||
Gemini 1.5 Pro | Entrée mise en cache | Entrée image Entrée vidéo Entrée texte Entrée audio |
0,0000821875 € par image 0,0000821875 € par seconde 0,000078125 € pour 1 000 caractères 0,0000078125 € par seconde |
0,000164375 $ / image 0,000164375 $ / seconde 0,00015625 $ / 1 000 caractères 0,000015625 $ / seconde |
Espace de stockage du cache contextuel | Entrée image Entrée vidéo Entrée texte Entrée audio |
0,0011835 / image / h 0,0011835/ seconde / h 0,001125 / 1 000 caractères / h 0,0001125 / seconde / h |
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
Exemple de calcul des coûts en cache
Si un utilisateur crée un contexte mis en cache de 250 000 caractères avec un TTL de deux heures,puis envoie 20 requêtes distinctes au modèle Gemini 1.5 Pro au cours de ces deux heures, et que chaque requête contient une requête de 200 caractères ajoutée au contexte mis en cache et une sortie de 400 caractères, le coût total est calculé comme suit:
Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.
Exemple de calcul des coûts
Si un utilisateur envoie cinq requêtes distinctes au modèle PaLM Text Bison, et que chaque requête contient une entrée de 200 caractères pour une réponse de 400 caractères, le coût total est calculé comme suit :
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Modèles partenaires
Les modèles partenaires sont une liste organisée de modèles d'IA générative développés par les partenaires de Google. Les modèles partenaires sont proposés en tant qu'API gérées. Pour en savoir plus, consultez la présentation des modèles partenaires. Les sections suivantes listent les détails de tarification des modèles Google pour les partenaires.
Modèles d'AI21 Lab
Modèle | Tarifs |
---|---|
Jamba 1.5 Large | Entrée: 2 $ par million de jetons Sortie: 8 $ par million de jetons |
Jamba 1.5 Mini | Entrée: 0,20 $ par million de jetons Sortie: 0,40 $ par million de jetons |
Modèles Claude d'Anthropic
Modèle | Tarifs |
---|---|
Claude 3.5 Haiku | Entrée: 1 $ par million de jetons Sortie: 5 $ par million de jetons |
Claude 3.5 Sonnet v2 | Entrée: 3 $ par million de jetons Résultat: 15 $ par million de jetons |
Claude 3.5 Sonnet | Entrée: 3 $ par million de jetons Résultat: 15 $ par million de jetons |
Claude 3 Haiku | Entrée: 0,25 $ par million de jetons Sortie: 1,25 $ par million de jetons |
Claude 3 Sonnet | Entrée: 3 $ par million de jetons Résultat: 15 $ par million de jetons |
Claude 3 Opus | Entrée: 15 $ / million de jetons Sortie: 75 $ / million de jetons |
Modèles Llama de Meta
Modèle | Tarifs |
---|---|
Llama 3.1 405B | Entrée: 5 $ par million de jetons Sortie: 16 $ par million de jetons |
Modèles Mistral AI
Modèle | Tarifs |
---|---|
Mistral Large (24.11) | Entrée: 2 $ par million de jetons Sortie: 6 $ par million de jetons |
Mistral Large (24,07) | Entrée: 2 $ par million de jetons Sortie: 6 $ par million de jetons |
Mistral Nemo | Entrée: 0,15 $ / million de jetons Sortie: 0,15 $ / million de jetons |
Codestral (24.05) | Entrée: 0,20 $ par million de jetons Sortie: 0,60 $ par million de jetons |