Tarification de Vertex AI
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.
Cette page présente les tarifs de l'IA générative sur Vertex AI. Pour tous les autres tarifs de Vertex AI, y compris Pour les services MLOps et de plate-forme de ML, consultez la page des tarifs de Vertex AI.
Modèles Google
Gemini
Avec les modèles multimodaux de Vertex AI, vous pouvez saisir du texte ou médias (images, vidéos). La saisie de texte est facturée tous les 1 000 caractères (requête) et tous les 1 000 caractères de la sortie (réponse). Les caractères sont comptées par des points de code UTF-8 et les espaces sont exclus du décompte, ce qui génère environ 4 caractères par jeton. Requêtes de prédiction menant aux réponses filtrées sont facturées en fonction de l'entrée uniquement. À la fin de chaque facturation cycle, les fractions d'un centime (0,01 €) sont arrondies à un cent. Entrée multimédia est facturé à l'image ou à la seconde (vidéo).
Modèle | Caractéristique | Type | Prix ( =< 128 000 fenêtres de contexte) |
Prix (fenêtre de contexte > 128 K) |
---|---|---|---|---|
Gemini 1.5 Flash | Multimode | Entrée d'image Entrée vidéo Entrée de texte Entrée audio |
0,00002 $/image 0,00002$par seconde 0,00001875 $/1 000 caractères 0,000002$par seconde |
0,00004 $/image 0,00004$par seconde 0,0000375 $/1 000 caractères 0,000004$par seconde |
Sortie textuelle | 0,000075 $ / 1 000 caractères | 0,00015 $ / 1 000 caractères | ||
Gemini 1.5 Pro | Multimode | Entrée d'image Entrée vidéo Entrée de texte Entrée audio |
0,001315 $/image 0,001315$par seconde 0,00125 $/1 000 caractères 0,000125$par seconde |
0,00263 $ / image 0,00263 $ / seconde 0,0025 $ / 1 000 caractères 0,00025 $ / seconde |
Sortie textuelle | 0,00375 $ / 1 000 caractères | 0,0075 $ / 1 000 caractères | ||
Gemini 1.0 Pro | Multimode | Entrée image Entrée vidéo Entrée textuelle |
0,0025 $ par image 0,002 $ par seconde 0,000125 $ pour 1 000 caractères |
|
Sortie textuelle | 0,000375 $ pour 1 000 caractères | |||
Ancrage avec la recherche Google | Texte | Requêtes d'ancrage | 35 $ / 1 000 requêtes (jusqu'à 1 million de requêtes par jour). Si vous avez besoin de plus d'espace, veuillez contacter l'équipe chargée de votre compte. plus d'un million de requêtes par jour . |
* Les prix sont indiqués en dollars américains (USD).
Si vous ne payez pas en USD, les prix indiqués dans votre devise sur
SKU de Cloud Platform
s'appliquent.
* Si un contexte de requête dépasse 128 000, tous les jetons sont facturés à des tarifs de contexte longs.
* Les modèles Gemini sont disponibles en mode de traitement par lot avec une remise de 50 %.
* Gemini 1.0 Pro n'accepte que la fenêtre de contexte jusqu'à 32 Ko.
* Les PDF sont facturés comme des images d'entrée, et une page PDF équivaut à une image.
Imagen
Avec Imagen sur Vertex AI, vous pouvez générer de nouvelles images et les modifier en fonction des requêtes textuelles que vous fournissez, ou ne modifier que certaines parties des images en utilisant une zone de masque que vous définissez et de nombreuses autres fonctionnalités.
Modèle | Fonctionnalité | Description | Entrée | Sortie | Prix |
---|---|---|---|---|---|
Imagen 3 | Génération d'images | Générer une image | Requête textuelle | Image | 0,04 $ par image |
Imagen 3 Fast | Génération d'images | Générer une image | Requête textuelle | Image | 0,02 $ par image |
Imagen 2, Imagen | Génération d'images | Générer une image | Requête textuelle | Images | 0,020 $ par image |
Édition d'images | Modifier une image par une approche avec masque ou sans masque | Image/Requête textuelle | Images | 0,020 $ par image | |
Augmentation de la résolution | Augmenter la résolution d'une image générée à 2k ou 4k | Images | Images | 0,003 $ par image | |
Réglage | Activer un "objet" fournies par l'utilisateur et utilisées dans les requêtes Imagen (quelques plans) | Sujet(s) avec identifiant textuel et 4 à 8 images par sujet | Modèle affiné (après l'entraînement avec des sujets fournis par l'utilisateur) | $ par heure-nœud (tarifs d'entraînement personnalisé Vertex AI) | |
Visual Captioning | Générer une légende textuelle courte ou longue pour une image | Images | Légende textuelle | 0,0015 $ par image | |
Questions/réponses visuelles | Fournir une réponse basée sur une question faisant référence à une image | Image/Requête textuelle | Réponse textuelle | 0,0015 $ par image |
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
Embedding
Modèle | Fonctionnalité | Description | Entrée | Sortie | Prix |
---|---|---|---|---|---|
intégration multimodale | Représentations vectorielles continues pour les fonctions multimodales: texte | Générer des représentations vectorielles continues en utilisant du texte comme entrée | Texte | Embeddings | 0,0002 $ pour 1000 caractères d'entrée |
Représentations vectorielles continues pour les fonctions multimodales: image | Générer des représentations vectorielles continues en utilisant une image comme entrée | Images | Embeddings | 0,0001 $ par image d'entrée | |
Représentations vectorielles continues pour les fonctions multimodales: Video Plus | Vidéo Plus | Vidéo | Représentations vectorielles continues (jusqu'à 15 représentations vectorielles continues par minute de vidéo) | 0,0020 $ par seconde de vidéo | |
Représentations vectorielles continues pour les fonctions multimodales: vidéo standard | Vidéo Standard | Vidéo | Représentations vectorielles continues (jusqu'à 8 représentations vectorielles continues par minute de vidéo) | 0,0010 $ par seconde de vidéo | |
Représentations vectorielles continues pour les fonctions multimodales: l'essentiel de la vidéo | Vidéo Essentiel | Vidéo | Représentations vectorielles continues (jusqu'à 4 représentations vectorielles continues par minute de vidéo) | 0,0005 $ par seconde de vidéo |
Modèle | Type | Région | Prix par tranche de 1000 caractères |
---|---|---|---|
Embeddings pour le texte | Entrée | Globaux |
|
Sortie | Monde |
|
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
Complétion de code
La prise en charge de l'IA générative sur Vertex AI est facturée pour chaque tranche de 1000 caractères d'entrée (requête) et pour chaque tranche de 1000 caractères de sortie (réponse). Les caractères sont comptabilisés avec les points de code UTF-8, et les espaces sont exclus du décompte. Pendant la phase de bêta, les frais sont réduits de 100 %. Requêtes de prédiction entraînant un filtrage sont facturées en fonction de l'entrée uniquement. À la fin de chaque cycle de facturation, les fractions d'un centime (0,01 €) sont arrondies à un centime.
Modèle | Type | Région | Prix par tranche de 1000 caractères |
---|---|---|---|
Codey pour la saisie de code | Entrée | Monde |
|
Sortie | Monde |
|
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
Traduction (texte)
Utilisez l'API Vertex AI et le LLM de traduction pour traduire du texte. Les traductions LLM sont généralement plus fluides et humaines que les modèles de traduction classiques, mais l'assistance linguistique est plus limitée(en savoir plus).
Modèle | Méthode | Utilisation | Prix par million de caractères |
---|---|---|---|
LLM | Texte traduction (Preview)* | Nombre de caractères d'entrée par mois |
10 $ par million de caractères* |
Nombre de caractères de sortie par mois |
10 $ par million de caractères* |
Les tarifs sont indiqués en dollars américains (USD).
Si vous ne payez pas en USD, les prix indiqués dans votre devise sur
SKU de Cloud Platform
s'appliquent.
* Le prix est calculé en fonction du caractère traité par le modèle. Pour en savoir plus sur le décompte des caractères, consultez Caractères facturés.
Mise en cache contextuelle
La mise en cache contextuelle vous permet de réduire le coût du traitement des jetons d'entrée Gemini de 75% et la latence de génération de contenu en mettant en cache la partie contexte d'entrée de texte ou de contenus multimédias aux modèles Gemini. La durée pendant laquelle les données sont stockées qui peut être contrôlé par l'utilisateur, détermine Cloud Storage" frais. Lors de la création d'un contexte mis en cache, le coût du jeton d'entrée standard est facturé aux utilisateurs. Les succès de cache (hit) sur les données d'entrée sont facturés à un tarif réduit ("Entrée en cache"), au lieu du coût d'entrée normal. La taille des données le stockage et l'entrée sont calculés de la même manière que le prix de la saisie dans Gemini.
Modèle | Fonctionnalité | Type | Prix ( = fenêtre de contexte de 128 Ko) | Prix (fenêtre de contexte > 128 Ko) |
---|---|---|---|---|
Gemini 1.5 Flash | Entrée en cache | Entrée d'image Entrée vidéo Entrée de texte Entrée audio |
0,000005 / image 0,000005 / seconde 0,0000046875 / 1 000 caractères 0,0000005 / seconde |
0,00001 / image 0,00001 / seconde 0,000009375 / 1 000 caractères 0,000001 / seconde |
Stockage du cache contextuel | Entrée d'image Entrée vidéo Entrée de texte Entrée audio |
0,000263 / image / h 0,000263/ seconde / h 0,00025 / 1 000 caractères / h 0,000025 / seconde / h |
||
Gemini 1.5 Pro | Entrée en cache | Entrée d'image Entrée vidéo Entrée de texte Entrée audio |
0,00032875 / image 0,00032875 / seconde 0,0003125 / 1 000 caractères 0,00003125 / seconde |
0,0006575 / image 0,0006575 / seconde 0,000625 / 1 000 caractères 0,0000625 / seconde |
Stockage du cache contextuel | Entrée d'image Entrée vidéo Entrée de texte Entrée audio |
0,0011835 / image / h 0,0011835/ seconde / h 0,001125 / 1 000 caractères / h 0,0001125 / seconde / h |
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
Exemple de calcul des coûts mis en cache
Si un utilisateur crée un contexte mis en cache de 250 000 caractères avec une valeur TTL de deux heures,puis envoie vingt requêtes distinctes au modèle Gemini 1.5 Pro pendant ces deux heures, et que chaque requête inclut une requête de 200 caractères dans le contexte mis en cache et une sortie de 400 caractères, le coût total est calculé comme suit:
Cache Creation cost:
250,000 input characters x ($0.00125 / 1000) = $0.3125 input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached chacater inputs
2,000 total character inputs * ($0.00125 / 1000) = $.0025 character input cost
5,000,000 total cached character inputs * ($0.0003125 / 1000) = $1.5625 cached input cost
$.0025 chacater input cost + $1.5625 cached input cost = $1.565 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
.3125 cached input cost + 0.5625 cached storage cost + $1.565 input cost + $0.03 output cost = $2.47 total cost.
Exemple de calcul des coûts
Si un utilisateur envoie cinq requêtes distinctes au modèle PaLM Text Bison, et que chaque requête contient une entrée de 200 caractères pour une réponse de 400 caractères, le coût total est calculé comme suit :
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Modèles partenaires
Les modèles partenaires sont une sélection de modèles d'IA générative développés par partenaires de Google. Les modèles de partenaires sont proposés en tant qu'API gérées. Pour plus pour en savoir plus, consultez Présentation des modèles partenaires Le tableau suivant présente le détail des tarifs des modèles de partenaires Google:
Modèles Claude d'Anthropic
Modèle | Tarifs |
---|---|
Claude 3.5 Sonnet | Entrée: 3 $ / million de jetons Résultat: 15 $ / million de jetons |
Claude 3 Opus | Entrée: 15 $ / million de jetons Résultat: 75 $ / million de jetons |
Claude 3 Haiku | Entrée: 0,25 $ / million de jetons Résultat: 1,25 $ / million de jetons |
Claude 3 Sonnet | Entrée: 3 $ / million de jetons Résultat: 15 $ / million de jetons |
Modèles Mistral AI
Modèle | Tarifs |
---|---|
Mistral Large (2407) | Entrée: 3 $ / million de jetons Résultat: 9 $ / million de jetons |
Mistral Nemo | Entrée: 0,30 $ / million de jetons Résultat: 0,30 $ / million de jetons |
Codestral | Entrée: 1 $ / million de jetons Résultat: 3 $ / million de jetons |