Tarification de Vertex AI

Les coûts de Vertex AI restent identiques à ceux des produits existants remplacés par Vertex AI. Par exemple, les coûts associés à l'entraînement d'un modèle de classification d'images AutoML sont identiques, que vous l'entraîniez avec Vertex AI ou AutoML Vision.

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU Cloud Platform s'appliquent.

Tarifs de Vertex AI par rapport aux tarifs de l'ancienne version d'AI Platform

Les tarifs des opérations Vertex AI et des opérations "anciennes" équivalentes sont les mêmes pour chaque opération. Par exemple, si vous entraînez un modèle à l'aide d'AI Platform Training, le coût est le même que pour l'entraînement d'un modèle à l'aide de Vertex AI Training.

Si vous utilisez d'anciens produits AI Platform, la facturation peut être exprimée en "unités d'entraînement".

Modèles AutoML Vertex

Pour les modèles AutoML Vertex, vous payez trois activités principales :

  • Entraîner le modèle
  • Déployer le modèle sur un point de terminaison
  • Utiliser le modèle pour effectuer des prédictions

Vertex AI utilise des configurations de machine prédéfinies pour les modèles AutoML Vertex, et le tarif horaire pour ces activités reflète l'utilisation des ressources.

La durée requise dépend de la taille et de la complexité de vos données d'entraînement. Les modèles doivent être déployés avant de pouvoir fournir des prédictions ou des explications en ligne.

Sélectionnez un type de modèle ci-dessous pour accéder aux informations tarifaires.

Données d'image

Opération Prix par nœud-heure (classification) Prix par nœud-heure (détection d'objets)
Formation 3,465 $ 3,465 $
Entraînement (sur un appareil) 18,00 $ 18,00 $
Déploiement et prédiction en ligne 1,375 $ 2,002 $
Prédiction par lot 2,222 $ 2,222 $

Statistiques relatives aux vidéos

Opération Prix par nœud-heure
Formation 3,234 $
Prédictions 0,462 $

Données tabulaires

Opération Prix par nœud-heure pour la classification/régression Prix des prévisions
Formation 21,252 $ 21,252 $
Prédiction Même prix que les prédictions pour les modèles entraînés personnalisés 1 $ pour 1 000 prévisions (lot uniquement)
Ancien déploiement 0,004055 $ Non disponible
Prédiction en ligne et explication en ligne 0,231 $ Non disponible
Ancienne prédiction par lot 1,276 $ Non disponible

Données textuelles

Opération Prix
Ancienne importation de données (fichiers PDF uniquement)

1 000 premières pages gratuites chaque mois

1,50 $ les 1 000 pages

0,60 $ les 1 000 pages lorsque le nombre de pages est supérieur à 5 000 000

Formation 3,30 $ par heure
Déploiement 0,05 $ par heure
Prédiction 5,00 $ par tranche de 1 000 enregistrements texte

Les prix des requêtes de prédiction de texte AutoML Vertex sont calculés en fonction du nombre d'enregistrements texte que vous envoyez pour analyse. Un enregistrement texte correspond à du texte brut qui contient jusqu'à 1 000 caractères Unicode (espaces blancs et caractères de balisage tels que les balises HTML ou XML inclus).

Si le texte fourni dans une requête de prédiction contient plus de 1 000 caractères, chaque bloc de 1 000 caractères est compté comme un enregistrement texte. Par exemple, si vous envoyez trois requêtes contenant respectivement 800, 1 500 et 600 caractères, quatre enregistrements texte vous seront facturés : un pour la première requête (800), deux pour la deuxième (1 500) et un pour la troisième requête (600).

Modèles entraînés personnalisés

Formation

Les tableaux ci-dessous indiquent le coût par heure approximatif des différentes configurations de l'entraînement. Vous pouvez choisir une configuration personnalisée pour les types de machines sélectionnés. Pour calculer les prix, additionnez les coûts des machines virtuelles que vous utilisez.

Si vous utilisez des types de machines Compute Engine et que vous y associez des accélérateurs, les frais qui y sont liés sont distincts. Pour calculer ces frais, multipliez les tarifs indiqués dans le tableau sur les accélérateurs ci-dessous par le nombre d'accélérateurs de chaque type utilisés.

Les tableaux suivants récapitulent les tarifs associés à chaque région où l'entraînement personnalisé est disponible.

Amériques

Types de machines – prix par heure
n1-standard-4 0,2185 $
n1-standard-8 0,4370 $
n1-standard-16 0,8740 $
n1-standard-32 1,7480 $
n1-standard-64 3,4960 $
n1-standard-96 5,2440 $
n1-highmem-2 0,1362 $
n1-highmem-4 0,2723 $
n1-highmem-8 0,5446 $
n1-highmem-16 1,0893 $
n1-highmem-32 2,1786 $
n1-highmem-64 4,3571 $
n1-highmem-96 6,5357 $
n1-highcpu-16 0,6523 $
n1-highcpu-32 1,3046 $
n1-highcpu-64 2,6091 $
n1-highcpu-96 3,9123 $
a2-highgpu-1g 0,8504 $
a2-highgpu-2g 1,7009 $
a2-highgpu-4g 3,4016 $
a2-highgpu-8g 6,8032 $
a2-megagpu-16g 10,1166 $
e2-standard-4 0,1495 $
e2-standard-8 0,3105 $
e2-standard-16 0,6210 $
e2-standard-32 1,2305 $
e2-highmem-2 0,1035 $
e2-highmem-4 0,2070 $
e2-highmem-8 0,4140 $
e2-highmem-16 0,8280 $
e2-highcpu-16 0,4600 $
e2-highcpu-32 0,9085 $
n2-standard-4 0,2185 $
n2-standard-8 0,4485 $
n2-standard-16 0,8970 $
n2-standard-32 1,7825 $
n2-standard-48 2,6795 $
n2-standard-64 3,5765 $
n2-standard-80 4,4620 $
n2-highmem-2 0,1495 $
n2-highmem-4 0,2990 $
n2-highmem-8 0,5980 $
n2-highmem-16 1,2075 $
n2-highmem-32 2,4150 $
n2-highmem-48 3,6110 $
n2-highmem-64 4,8185 $
n2-highmem-80 6,0260 $
n2-highcpu-16 0,6555 $
n2-highcpu-32 1,3225 $
n2-highcpu-48 1,9780 $
n2-highcpu-64 2,6335 $
n2-highcpu-80 3,3005 $
c2-standard-4 0,2415 $
c2-standard-8 0,4830 $
c2-standard-16 0,9545 $
c2-standard-30 1,8055 $
c2-standard-60 3,5995 $
Accélérateurs – Prix par heure
NVIDIA_TESLA_A100 3,5650 $
NVIDIA_TESLA_K80 0,5175 $
NVIDIA_TESLA_P4 0,6900 $
NVIDIA_TESLA_P100 1,6790 $
NVIDIA_TESLA_T4 0,4025 $
NVIDIA_TESLA_V100 2,8520 $
Disques – prix par Go et par heure
pd-standard 0,0000767 $
pd-ssd 0,0002833 $

Europe

Types de machines – prix par heure
n1-standard-4 0,2530 $
n1-standard-8 0,5060 $
n1-standard-16 1,0120 $
n1-standard-32 2,0240 $
n1-standard-64 4,0480 $
n1-standard-96 6,0720 $
n1-highmem-2 0,1576 $
n1-highmem-4 0,3151 $
n1-highmem-8 0,6302 $
n1-highmem-16 1,2604 $
n1-highmem-32 2,5208 $
n1-highmem-64 5,0416 $
n1-highmem-96 7,5624 $
n1-highcpu-16 0,7553 $
n1-highcpu-32 1,5106 $
n1-highcpu-64 3,0213 $
n1-highcpu-96 4,5319 $
a2-highgpu-1g 0,9362 $
a2-highgpu-2g 1,8724 $
a2-highgpu-4g 3,7447 $
a2-highgpu-8g 7,4894 $
a2-megagpu-16g 11,1366 $
e2-standard-4 0,1955 $
e2-standard-8 0,3795 $
e2-standard-16 0,7590 $
e2-standard-32 1,5180 $
e2-highmem-2 $0,1265 $
e2-highmem-4 0,2530 $
e2-highmem-8 0,5175 $
e2-highmem-16 1,0235 $
e2-highcpu-16 0,5635 $
e2-highcpu-32 1,1270 $
n2-standard-4 0,2760 $
n2-standard-8 0,5520 $
n2-standard-16 1,1040 $
n2-standard-32 2,2080 $
n2-standard-48 3,3120 $
n2-standard-64 4,4045 $
n2-standard-80 5,5085 $
n2-highmem-2 0,1840 $
n2-highmem-4 0,3680 $
n2-highmem-8 0,7475 $
n2-highmem-16 1,4835 $
n2-highmem-32 2,9785 $
n2-highmem-48 4,4620 $
n2-highmem-64 5,9455 $
n2-highmem-80 7,4290 $
n2-highcpu-16 0,8165 $
n2-highcpu-32 1,6330 $
n2-highcpu-48 2,4380 $
n2-highcpu-64 3,2545 $
n2-highcpu-80 4,0710 $
c2-standard-4 0,2990 $
c2-standard-8 0,5980 $
c2-standard-16 1,1845 $
c2-standard-30 2,2195 $
c2-standard-60 4,4390 $
Accélérateurs – Prix par heure
NVIDIA_TESLA_A100 3,5650 $
NVIDIA_TESLA_K80 0,5635 $
NVIDIA_TESLA_P4 0,7475 $
NVIDIA_TESLA_P100 1,8400 $
NVIDIA_TESLA_T4 0,4370 $
NVIDIA_TESLA_V100 2,9325 $
Disques – prix par Go et par heure
pd-standard 0,0000722 $
pd-ssd 0,0003194 $

Asie-Pacifique

Types de machines – prix par heure
n1-standard-4 0,2530 $
n1-standard-8 0,5060 $
n1-standard-16 1,0120 $
n1-standard-32 2,0240 $
n1-standard-64 4,0480 $
n1-standard-96 6,0720 $
n1-highmem-2 0,1576 $
n1-highmem-4 0,3151 $
n1-highmem-8 0,6302 $
n1-highmem-16 1,2604 $
n1-highmem-32 2,5208 $
n1-highmem-64 5,0416 $
n1-highmem-96 7,5624 $
n1-highcpu-16 0,7553 $
n1-highcpu-32 1,5106 $
n1-highcpu-64 3,0213 $
n1-highcpu-96 4,5319 $
a2-highgpu-1g 0,9362 $
a2-highgpu-2g 1,8724 $
a2-highgpu-4g 3,7447 $
a2-highgpu-8g 7,4894 $
a2-megagpu-16g 11,1366 $
e2-standard-4 0,1955 $
e2-standard-8 0,3795 $
e2-standard-16 0,7590 $
e2-standard-32 1,5180 $
e2-highmem-2 $0,1265 $
e2-highmem-4 0,2530 $
e2-highmem-8 0,5175 $
e2-highmem-16 1,0235 $
e2-highcpu-16 0,5635 $
e2-highcpu-32 1,1270 $
n2-standard-4 0,2760 $
n2-standard-8 0,5520 $
n2-standard-16 1,1040 $
n2-standard-32 2,2080 $
n2-standard-48 3,3120 $
n2-standard-64 4,4045 $
n2-standard-80 5,5085 $
n2-highmem-2 0,1840 $
n2-highmem-4 0,3680 $
n2-highmem-8 0,7475 $
n2-highmem-16 1,4835 $
n2-highmem-32 2,9785 $
n2-highmem-48 4,4620 $
n2-highmem-64 5,9455 $
n2-highmem-80 7,4290 $
n2-highcpu-16 0,8165 $
n2-highcpu-32 1,6330 $
n2-highcpu-48 2,4380 $
n2-highcpu-64 3,2545 $
n2-highcpu-80 4,0710 $
c2-standard-4 0,2990 $
c2-standard-8 0,5980 $
c2-standard-16 1,1845 $
c2-standard-30 2,2195 $
c2-standard-60 4,4390 $
Accélérateurs – Prix par heure
NVIDIA_TESLA_A100 3,5650 $
NVIDIA_TESLA_K80 0,5635 $
NVIDIA_TESLA_P4 0,7475 $
NVIDIA_TESLA_P100 1,8400 $
NVIDIA_TESLA_T4 0,4485 $
NVIDIA_TESLA_V100 2,9325 $
Disques – prix par Go et par heure
pd-standard 0,0000722 $
pd-ssd 0,0003194 $
  • Toute utilisation est soumise aux règles de quotas de Vertex AI.
  • Vous devez stocker vos données et vos fichiers de programme dans des buckets Google Cloud Storage pendant le cycle de vie de Vertex AI. En savoir plus sur l'utilisation de Cloud Storage

L'entraînement de vos modèles vous est facturé :

  • Facturation par tranche d'une minute
  • Minimum de 10 minutes par tâche d'entraînement
  • Facturation à partir du moment où les ressources sont provisionnées pour une tâche et jusqu'à la fin de celle-ci

Niveaux d'évolutivité pour les configurations prédéfinies (AI Platform Training)

Vous pouvez contrôler le type de cluster de traitement à utiliser pour l'entraînement de votre modèle. La méthode la plus simple consiste à choisir parmi l'une des configurations prédéfinies appelées niveaux d'évolutivité. En savoir plus sur les niveaux d'évolutivité

Types de machines pour les configurations personnalisées

Si vous utilisez Vertex AI ou sélectionnez CUSTOM comme niveau d'évolutivité pour AI Platform Training, vous contrôlez le nombre et le type de machines virtuelles à utiliser pour le maître du cluster, le nœud de calcul et le serveur de paramètres. Apprenez-en plus sur les types de machines pour Vertex AI et les types de machines pour AI Platform Training.

Le coût de l'entraînement avec un cluster de traitement personnalisé correspond à la somme de toutes les machines que vous indiquez. La durée totale de la tâche, et non le temps de traitement actif de chaque machine, vous est facturée.

Prédiction et explication

Le tableau suivant indique le coût par nœud-heure des prédictions par lot et en ligne ainsi que des explications en ligne. Les nœuds-heure correspondent au temps durant lequel une machine virtuelle exécute une tâche de prédiction ou durant lequel elle est disponible pour traiter les requêtes de prédiction ou d'explication.

Amériques

Prédiction
Prédictions et explications
Types de machines – prix par nœud-heure
n1-standard-2 Tarifs approximatifs :
us-east4 0,123 $
northamerica-northeast1 0,1203 $
Autres régions des Amériques 0,1093 $
n1-standard-4 Tarifs approximatifs :
us-east4 0,2461 $
northamerica-northeast1 0,2405 $
Autres régions des Amériques 0,2186 $
n1-standard-8 Tarifs approximatifs :
us-east4 0,4922 $
northamerica-northeast1 0,4811 $
Autres régions des Amériques 0,4372 $
n1-standard-16 Tarifs approximatifs :
us-east4 0,9843 $
northamerica-northeast1 0,9622 $
Autres régions des Amériques 0,8744 $
n1-standard-32 Tarifs approximatifs :
us-east4 1,9687 $
northamerica-northeast1 1,9243 $
Autres régions des Amériques 1,7488 $
n1-highmem-2 Tarifs approximatifs :
us-east4 0,1532 $
northamerica-northeast1 0,1498 $
Autres régions des Amériques 0,1361 $
n1-highmem-4 Tarifs approximatifs :
us-east4 0,3064 $
northamerica-northeast1 0,2995 $
Autres régions des Amériques 0,2723 $
n1-highmem-8 Tarifs approximatifs :
us-east4 0,6129 $
northamerica-northeast1 0,5991 $
Autres régions des Amériques 0,5445 $
n1-highmem-16 Tarifs approximatifs :
us-east4 1,2257 $
northamerica-northeast1 1,1982 $
Autres régions des Amériques 1,089 $
n1-highmem-32 Tarifs approximatifs :
us-east4 2,4515 $
northamerica-northeast1 2,3963 $
Autres régions des Amériques 2,178 $
n1-highcpu-2 Tarifs approximatifs :
us-east4 0,0918 $
northamerica-northeast1 0,0897 $
Autres régions des Amériques 0,0815 $
n1-highcpu-4 Tarifs approximatifs :
us-east4 0,1835 $
northamerica-northeast1 0,1794 $
Autres régions des Amériques 0,163 $
n1-highcpu-8 Tarifs approximatifs :
us-east4 0,3671 $
northamerica-northeast1 0,3588 $
Autres régions des Amériques 0,326 $
n1-highcpu-16 Tarifs approximatifs :
us-east4 0,7341 $
northamerica-northeast1 0,7176 $
Autres régions des Amériques 0,6519 $
n1-highcpu-32 Tarifs approximatifs :
us-east4 1,4683 $
northamerica-northeast1 1,4352 $
Autres régions des Amériques 1,3039 $

Europe

Prédiction
Prédictions et explications
Types de machines – prix par nœud-heure
n1-standard-2 Tarifs approximatifs :
europe-west2 0,1408 $
Autres régions d'Europe $0,1265 $
n1-standard-4 Tarifs approximatifs :
europe-west2 0,2815 $
Autres régions d'Europe 0,2531 $
n1-standard-8 Tarifs approximatifs :
europe-west2 0,563 $
Autres régions d'Europe 0,5061 $
n1-standard-16 Tarifs approximatifs :
europe-west2 1,126 $
Autres régions d'Europe 1,0123 $
n1-standard-32 Tarifs approximatifs :
europe-west2 2,2521 $
Autres régions d'Europe 2,0245 $
n1-highmem-2 Tarifs approximatifs :
europe-west2 0,1753 $
Autres régions d'Europe 0,1575 $
n1-highmem-4 Tarifs approximatifs :
europe-west2 0,3506 $
Autres régions d'Europe 0,3151 $
n1-highmem-8 Tarifs approximatifs :
europe-west2 0,7011 $
Autres régions d'Europe 0,6302 $
n1-highmem-16 Tarifs approximatifs :
europe-west2 1,4022 $
Autres régions d'Europe 1,2603 $
n1-highmem-32 Tarifs approximatifs :
europe-west2 2,8044 $
Autres régions d'Europe 2,5206 $
n1-highcpu-2 Tarifs approximatifs :
europe-west2 0,105 $
Autres régions d'Europe 0,0944 $
n1-highcpu-4 Tarifs approximatifs :
europe-west2 0,21 USD
Autres régions d'Europe 0,1888 $
n1-highcpu-8 Tarifs approximatifs :
europe-west2 0,4199 $
Autres régions d'Europe 0,3776 $
n1-highcpu-16 Tarifs approximatifs :
europe-west2 0,8398 $
Autres régions d'Europe 0,7552 $
n1-highcpu-32 Tarifs approximatifs :
europe-west2 1,6796 $
Autres régions d'Europe 1,5104 $

Asie-Pacifique

Prédiction
Prédictions et explications
Types de machines – prix par nœud-heure
n1-standard-2 Tarifs approximatifs :
asia-northeast1 0,1402 $
asia-southeast1 0,1348 $
australia-southeast1 0,155 $
Autres régions d'Asie-Pacifique $0,1265 $
n1-standard-4 Tarifs approximatifs :
asia-northeast1 0,2803 $
asia-southeast1 0,2695 $
australia-southeast1 0,31 $
Autres régions d'Asie-Pacifique 0,2531 $
n1-standard-8 Tarifs approximatifs :
asia-northeast1 0,5606 $
asia-southeast1 0,5391 $
australia-southeast1 0,6201 $
Autres régions d'Asie-Pacifique 0,5061 $
n1-standard-16 Tarifs approximatifs :
asia-northeast1 1,1213 $
asia-southeast1 1,0782 $
australia-southeast1 1,2401 $
Autres régions d'Asie-Pacifique 1,0123 $
n1-standard-32 Tarifs approximatifs :
asia-northeast1 2,2426 $
asia-southeast1 2,1564 $
australia-southeast1 2,4802 $
Autres régions d'Asie-Pacifique 2,0245 $
n1-highmem-2 Tarifs approximatifs :
asia-northeast1 0,1744 $
asia-southeast1 0,1678 $
australia-southeast1 0,193 $
Autres régions d'Asie-Pacifique 0,1575 $
n1-highmem-4 Tarifs approximatifs :
asia-northeast1 0,3489 $
asia-southeast1 0,3357 $
australia-southeast1 0,3861 $
Autres régions d'Asie-Pacifique 0,3151 $
n1-highmem-8 Tarifs approximatifs :
asia-northeast1 0,6977 $
asia-southeast1 0,6713 $
australia-southeast1 0,7721 $
Autres régions d'Asie-Pacifique 0,6302 $
n1-highmem-16 Tarifs approximatifs :
asia-northeast1 1,3955 $
asia-southeast1 1,3426 $
australia-southeast1 1,5443 $
Autres régions d'Asie-Pacifique 1,2603 $
n1-highmem-32 Tarifs approximatifs :
asia-northeast1 2,791 $
asia-southeast1 2,6852 $
australia-southeast1 3,0885 $
Autres régions d'Asie-Pacifique 2,5206 $
n1-highcpu-2 Tarifs approximatifs :
asia-northeast1 0,1046 $
asia-southeast1 0,1005 $
australia-southeast1 0,1156 $
Autres régions d'Asie-Pacifique 0,0944 $
n1-highcpu-4 Tarifs approximatifs :
asia-northeast1 0,2093 $
asia-southeast1 0,201 $
australia-southeast1 0,2312 $
Autres régions d'Asie-Pacifique 0,1888 $
n1-highcpu-8 Tarifs approximatifs :
asia-northeast1 0,4186 $
asia-southeast1 0,4021 $
australia-southeast1 0,4624 $
Autres régions d'Asie-Pacifique 0,3776 $
n1-highcpu-16 Tarifs approximatifs :
asia-northeast1 0,8371 $
asia-southeast1 0,8041 $
australia-southeast1 0,9249 $
Autres régions d'Asie-Pacifique 0,7552 $
n1-highcpu-32 Tarifs approximatifs :
asia-northeast1 1,6742 $
asia-southeast1 1,6082 $
australia-southeast1 1,8498 $
Autres régions d'Asie-Pacifique 1,5104 $

Chaque type de machine est facturé comme deux codes SKU distincts sur votre facture Google Cloud:

  • Coût du processeur virtuel, mesuré en processeurs virtuels-heure
  • Coût de la mémoire RAM, mesurée en Go-heure

Les tarifs des types de machines indiqués dans le tableau précédent sont basés sur une approximation du coût horaire total pour chaque nœud de prédiction d'une version de modèle utilisant ce type de machine. Par exemple, étant donné qu'un type de machine n1-highcpu-32 inclut 32 processeurs virtuels et 28,8 Go de mémoire RAM, le tarif horaire par nœud est égal à 32 processeurs virtuels-heure + 28,8 Go-heure.

Les tarifs indiqués dans le tableau précédent sont fournis pour vous aider à estimer vos coûts de prédiction. Le tableau suivant indique les tarifs des processeurs virtuels et de la mémoire RAM pour les types de machines de prédiction, qui reflètent plus précisément les codes SKU qui vous seront facturés:

Amériques

Codes SKU des types de machines de prédiction
Processeur virtuel
Virginie du Nord (us-east4) 0,04094575 $ par processeur virtuel-heure
Montréal (northamerica-northeast1) 0,0400223 $ par processeur virtuel-heure
Autres régions des Amériques 0,03635495 $ par processeur virtuel-heure
RAM
Virginie du Nord (us-east4) 0,00548665 $ par Go-heure
Montréal (northamerica-northeast1) 0,0053636 $ par Go-heure
Autres régions des Amériques 0,0048783 $ par Go-heure

Europe

Codes SKU des types de machines de prédiction
Processeur virtuel
Londres (europe-west2) 0,0468395 $ par processeur virtuel-heure
Autres régions d'Europe 0,0421268 $ par processeur virtuel-heure
RAM
Londres (europe-west2) 0,0032767 $ par Go-heure
Autres régions d'Europe 0,0056373 $ par Go-heure

Asie-Pacifique

Codes SKU des types de machines de prédiction
Processeur virtuel
Tokyo (asia-northeast1) 0,0467107 $ par processeur virtuel-heure
Singapour (asia-southeast1) 0,04484885 $ par processeur virtuel-heure
Sydney (australia-southeast1) 0,0515844 $ par processeur virtuel-heure
Autres régions d'Asie-Pacifique 0,0421268 $ par processeur virtuel-heure
RAM
Tokyo (asia-northeast1) 0,00623185 $ par Go-heure
Singapour (asia-southeast1) 0,0060099 $ par Go-heure
Sydney (australia-southeast1) 0,00691265 $ par Go-heure
Autres régions d'Asie-Pacifique 0,0056373 $ par Go-heure

Vous pouvez également utiliser des accélérateurs GPU pour les prédictions. Les GPU entraînent des frais supplémentaires en plus de ceux décrits dans le tableau précédent. Le tableau suivant indique les tarifs pour chaque type de GPU :

Amériques

Accélérateurs – Prix par heure
NVIDIA_TESLA_K80
Iowa (us-central1) 0,5175 $
Caroline du Sud (us-east1) 0,5175 $
NVIDIA_TESLA_P4
Iowa (us-central1) 0,6900 $
Virginie du Nord (us-east4) 0,6900 $
Montréal (northamerica-northeast1) 0,7475 $
NVIDIA_TESLA_P100
Oregon (us-west1) 1,6790 $
Iowa (us-central1) 1,6790 $
Caroline du Sud (us-east1) 1,6790 $
NVIDIA_TESLA_T4
Oregon (us-west1) 0,4025 $
Iowa (us-central1) 0,4025 $
Caroline du Sud (us-east1) 0,4025 $
NVIDIA_TESLA_V100
Oregon (us-west1) 2,8520 $
Iowa (us-central1) 2,8520 $

Europe

Accélérateurs – Prix par heure
NVIDIA_TESLA_K80
Belgique (europe-west1) 0,5635 $
NVIDIA_TESLA_P4
Pays-Bas (europe-west4) 0,7475 $
NVIDIA_TESLA_P100
Belgique (europe-west1) 1,8400 $
NVIDIA_TESLA_T4
Londres (europe-west2) 0,4715 $
Pays-Bas (europe-west4) 0,4370 $
NVIDIA_TESLA_V100
Pays-Bas (europe-west4) 2,9325 $

Asie-Pacifique

Accélérateurs – Prix par heure
NVIDIA_TESLA_K80
Taïwan (asia-east1) 0,5635 $
NVIDIA_TESLA_P4
Singapour (asia-southeast1) 0,7475 $
Sydney (australia-southeast1) 0,7475 $
NVIDIA_TESLA_P100
Taïwan (asia-east1) 1,8400 $
NVIDIA_TESLA_T4
Tokyo (asia-northeast1) 0,4255 $
Singapour (asia-southeast1) 0,4255 $
Séoul (asia-northeast3) 0,4485 $
NVIDIA_TESLA_V100 Non disponible

Les tarifs sont indiqués par GPU. Aussi, si vous utilisez plusieurs GPU par nœud de prédiction (ou si votre version évolue pour utiliser plusieurs nœuds), les coûts évoluent en conséquence.

AI Platform Prediction réalise des prédictions à partir de votre modèle en exécutant plusieurs machines virtuelles ("nœuds"). Par défaut, Vertex AI ajuste automatiquement le nombre de nœuds en cours d'exécution à tout moment. Pour la prédiction en ligne, le nombre de nœuds s'adapte en fonction de la demande. Chaque nœud peut répondre à plusieurs requêtes de prédiction. Pour la prédiction par lot, le nombre de nœuds s'adapte afin de réduire la durée totale d'exécution de la tâche. Vous pouvez personnaliser le scaling des nœuds de prédiction.

Pour votre modèle, la durée d'exécution de chaque nœud vous est facturée, y compris dans les cas suivants :

  • Lorsque le nœud traite une tâche de prédiction par lot
  • Lorsque le nœud traite une requête de prédiction en ligne
  • Lorsque le nœud est disponible pour les prédictions en ligne

L'heure de nœud correspond au coût d'exécution d'un nœud durant une heure. Le tableau des tarifs relatifs aux prédictions indique le prix d'un nœud-heure, qui varie selon les régions et le type de prédiction (en ligne ou par lot).

Les nœuds-heure peuvent être fractionnés afin d'être consommés par tranches. Par exemple, l'exécution d'un nœud durant 30 minutes coûte 0,5 nœud-heure.

Calcul des coûts pour les anciens types de machines (MLS1) et la prédiction par lot

  • La durée d'exécution d'un nœud se mesure par tranches d'une minute et est arrondie à la minute supérieure. Par exemple, si un nœud s'exécute durant 20,1 minutes, son coût d'exécution sera calculé sur la base de 21 minutes.
  • Les durées d'exécution de nœud inférieures à 10 minutes sont arrondies à 10 minutes. Par exemple, si un nœud s'exécute durant 3 minutes seulement, son coût d'exécution sera calculé sur la base de 10 minutes.

Calcul des coûts pour les types de machines Compute Engine (N1)

  • La durée d'exécution d'un nœud est facturée par tranches de 30 secondes. Ainsi, toutes les 30 secondes, votre projet est facturé pour 30 secondes d'utilisation des processeurs virtuels, de la mémoire RAM et des ressources GPU alors utilisés par votre nœud.

Informations supplémentaires sur le scaling automatique des nœuds de prédiction

Prédiction en ligne Prédiction par lot
La priorité du scaling est de réduire la latence des requêtes individuelles. Le service permet à votre modèle de rester disponible pendant quelques minutes d'inactivité après le traitement d'une requête. La priorité du scaling est de réduire le temps total de la tâche.
Le scaling a un effet sur le montant total qui vous est facturé chaque mois : plus vos requêtes sont nombreuses et fréquentes, plus le volume de nœuds utilisés est important. Le scaling doit avoir peu d'effet sur le prix de votre tâche, même si la création d'un nœud engendre des frais.

Vous pouvez choisir de laisser le service s'adapter en fonction du trafic (scaling automatique) ou définir un nombre de nœuds à exécuter en permanence pour éviter la latence (scaling manuel).

  • Si vous sélectionnez le scaling automatique, le nombre de nœuds évolue automatiquement et peut être réduit à zéro pour les périodes sans trafic.
  • Si vous sélectionnez le scaling manuel, vous spécifiez un nombre de nœuds à exécuter en permanence. La totalité du temps d'exécution des nœuds vous est alors facturée, du déploiement jusqu'à la suppression de la version du modèle.
Vous pouvez modifier le scaling en définissant un nombre maximal de nœuds à utiliser pour une tâche de prédiction par lot et en définissant le nombre de nœuds à exécuter pour un modèle lorsque vous le déployez.

Coût minimal de 10 minutes

Souvenez-vous que si un nœud s'exécute pendant moins de 10 minutes, vous serez quand même facturé 10 minutes. Par exemple, supposons que vous utilisiez le scaling automatique. Durant une période sans trafic, aucun nœud n'est utilisé. La réception d'une seule requête de prédiction en ligne déclenche l'exécution d'un nœud pour traiter la requête. Après avoir traité la requête, le nœud continue de s'exécuter et reste disponible quelques minutes. Ensuite, il s'arrête. Même si le nœud a fonctionné moins de 10 minutes, son exécution vous est facturée 10 minutes de nœud (0,17 nœud-heure).

De même, si un nœud est ajouté pour traiter plusieurs requêtes de prédiction en ligne pendant 10 minutes avant de s'arrêter, vous serez facturé 10 minutes de nœud.

Vous pouvez utiliser le scaling manuel pour contrôler précisément le nombre de nœuds à exécuter durant une période donnée. Toutefois, si un nœud s'exécute pendant moins de 10 minutes, vous êtes quand même facturé 10 minutes.

En savoir plus sur la répartition et le scaling des nœuds

Exemple de calcul de frais liés aux prédictions

Une agence immobilière implantée dans la région des Amériques exécute une prédiction hebdomadaire de la valeur des biens immobiliers dans la zone qu'elle couvre. En un mois, elle exécute des prédictions pendant quatre semaines, par lots de 3920, 4277, 3849 et 3961. Les tâches sont traitées par un seul nœud, et chaque instance nécessite en moyenne 0.72 seconde de traitement.

Commencez par calculer la durée d'exécution de chaque tâche :

3920 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.04 minutes
4277 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 51.324 minutes
3849 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 46.188 minutes
3961 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.532 minutes

L'exécution de chaque tâche a duré plus de 10 minutes, et sera donc facturée à la minute de traitement.

($0.0909886 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964
($0.0909886 / 1 node hour) * (1 hour / 60 minutes) * 52 minutes * 1 node = $0.0685711
($0.0909886 / 1 node hour) * (1 hour / 60 minutes) * 47 minutes * 1 node = $0.061977725
($0.0909886 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964

Le coût total s'élève à 0,26 $ pour le mois.

Dans cet exemple, nous avons supposé que les tâches s'exécutaient sur un seul nœud et prenaient le même temps pour chaque instance d'entrée. En utilisation réelle, veillez à prendre en compte plusieurs nœuds et à utiliser le temps d'exécution effectif de chacun d'eux dans vos calculs.

Frais pour Vertex Explainable AI

Vertex Explainable AI est disponible sans frais supplémentaires pour les prédictions. Cependant, le traitement des explications est plus long que celui des prédictions standards. L'utilisation intensive de Vertex Explainable AI avec l'autoscaling peut donc entraîner le démarrage de davantage de nœuds, et ainsi augmenter vos frais pour les prédictions.

Vertex Pipelines

Vertex Pipelines facture des frais d'exécution de 0,03 $ par exécution de pipeline. Les frais d'exécution ne vous sont pas facturés pendant la version bêta. Vous payez également les ressources Google Cloud que vous utilisez avec Vertex Pipelines, telles que les ressources Compute Engine utilisées par les composants du pipeline (facturées au même tarif que pour l'entraînement Vertex AI.) Enfin, vous êtes responsable du coût des services (tels que Dataflow) appelés par votre pipeline.

Vertex Feature Store

Les tarifs du Feature Store sont basés sur la quantité de données de caractéristiques stockées en ligne et hors connexion, ainsi que sur la disponibilité de la diffusion en ligne. Les nœuds-heure correspondent au temps qu'une machine virtuelle passe à diffuser des données de caractéristiques ou durant lequel elle est disponible pour traiter les requêtes de données de caractéristiques.

Opération Prix
Stockage en ligne 0,25 $ par Go/mois
Stockage hors connexion 0,023 $ par Go/mois
Diffusion en ligne 0,94 $ par nœud et par heure
Exportation par lot 0,005 $ par Go

Vertex ML Metadata

Vertex ML Metadata est gratuit pendant la version bêta.

Le stockage de métadonnées est mesuré en gigaoctets binaires (Gio), et 1 Gio correspond à 1 073 741 824 octets. Cette unité de mesure est parfois appelée gibibyte. En disponibilité générale, Vertex ML Metadata facture 10 $ par gibioctet (Gio) par mois pour le stockage des métadonnées.

Vertex TensorBoard

Vertex TensorBoard est gratuit pendant la version bêta. Vous payez également les ressources Google Cloud que vous utilisez avec Vertex TensorBoard, telles que les journaux TensorBoard stockés dans Cloud Storage.

Vertex Vizier

Vertex Vizier est un service d'optimisation par boîte noire intégré à Vertex AI. Le modèle de tarification de Vizier comprend les éléments suivants :

  • Aucuns frais ne s'appliquent pour les essais qui utilisent RANDOM_SEARCH et GRID_SEARCH. En savoir plus sur les algorithmes de recherche
  • Les 100 premiers essais de Vizier par mois civil sont disponibles gratuitement. Les essais utilisant RANDOM_SEARCH et GRID_SEARCH ne sont pas pris en compte dans ce total.
  • Après 100 essais Vizier, les essais ultérieurs effectués au cours du même mois calendaire sont facturés 1 $ par essai (les essais utilisant RANDOM_SEARCH ou GRID_SEARCH n'entraînent aucuns frais).

Vertex Matching Engine

La tarification de Vertex Matching Engine comprend les éléments suivants :

  • Tarifs par nœud-heure pour chaque VM utilisée pour héberger un index déployé.
  • Coûts liés à la création d'index et à la mise à jour des index existants.

Le tarif horaire par nœud-heure de la version bêta correspond à une remise de 40 % par rapport au prix de disponibilité générale.

Région Prix par nœud-heure (remise de 40 % incluse)
us-central1 0,7952 $
asia-southeast1 0,936 $

La création et la mise à jour d'index sont gratuites pendant la phase bêta. En disponibilité générale, le prix sera de 3 $ par Go de données traitées.

Le coût par nœud-heure apparaît sur votre facture sous la forme de deux codes SKU distincts :

  • Coût du processeur virtuel, mesuré en processeurs virtuels-heure. Chaque nœud d'hébergement d'index comprend 16 processeurs virtuels.
  • Coût de la mémoire RAM, mesurée en Go-heure. Chaque nœud d'hébergement d'index comprend 60 Go de RAM.
Code SKU Région Prix par nœud-heure (remise de 40 % incluse)
Processeur virtuel us-central1 0,0332 $
asia-southeast1 0,0390 $
RAM us-central1 0,0044 $
asia-southeast1 0,0052 $

Les tableaux suivants récapitulent les tarifs de diffusion d'index dans chaque région où le moteur correspondant est en disponibilité générale.

Région Prix par nœud-heure
us-central1 1,0640 $
us-east1 1,0640 $
us-east4 1,1984 $
us-west1 1,0640 $
asia-southeast1 1,3126 $
europe-west1 1,1715 $

Les données traitées lors de la création et de la mise à jour des index sont mesurées en gigaoctets binaires (Gio) ; 1 Gio correspond à 1 073 741 824 octets. Cette unité de mesure est parfois appelée gibibyte.

En disponibilité générale, Vertex Matching Engine facture 3 $ par gibioctet (Gio) de données traitées dans toutes les régions.

Vertex Model Monitoring

Vertex AI vous permet de surveiller l'efficacité continue de votre modèle après son déploiement en production. Pour plus d'informations, consultez la page Présentation de Vertex Model Monitoring.

Lorsque vous utilisez Vertex Model Monitoring, vous êtes facturé pour les éléments suivants :

  • 3,50 $ par Go pour toutes les données analysées, y compris les données d'entraînement fournies et les données de prédiction enregistrées dans une table BigQuery.
  • Frais pour les autres produits Google Cloud que vous utilisez avec Model Monitoring, tels que le stockage BigQuery ou Batch Explain lorsque la surveillance de l'attribution est activée.

Vertex Model Monitoring est compatible avec les régions suivantes : us-central1, europe-west4, asia-east1 et asia-southeast1. Les prix sont les mêmes dans toutes les régions.

Les tailles des données sont mesurées après leur conversion au format TfRecord.

Les ensembles de données d'entraînement entraînent des frais uniques lorsque vous configurez une tâche Vertex Model Monitoring.

Les ensembles de données de prédiction sont constitués de journaux collectés à partir du service de prédiction en ligne. Au fur et à mesure que les requêtes de prédiction arrivent au cours de différentes fenêtres temporelles, les données pour chaque fenêtre temporelle sont collectées et la somme des données analysée pour chaque fenêtre de prédiction est utilisée pour calculer les frais.

Exemple : un data scientist exécute une surveillance de modèle sur le trafic de prédiction appartenant à son modèle.

  • Le modèle est entraîné à partir d'un ensemble de données BigQuery. La taille des données après la conversion au format TfRecord est de 1,5 Go.
  • Les données de prédiction enregistrées entre 13h00 et 14h00 représentent 0,1 Go, et 0,2 Go entre 15h00 et 16h00.
  • Le prix total pour la configuration de la tâche de surveillance du modèle se présente comme suit :

    (1.5 GB * $3.50) + ((0.1 GB + 0.2 GB) * $3.50) = $6.30

Vertex AI Workbench, conteneurs de deep learning, Deep Learning VM et AI Platform Pipelines

La tarification des conteneurs de deep learning, de Deep Learning VM Image et d'AI Platform Pipelines est calculée en fonction des ressources de calcul que vous utilisez. Ces ressources sont facturées au même tarif que pour Compute Engine et Cloud Storage.

Pour Vertex AI Workbench, des frais de gestion sont facturés en plus de l'utilisation de l'infrastructure, tels que décrits dans les tableaux ci-dessous.

Sélectionnez les notebooks gérés ou les notebooks gérés par l'utilisateur pour afficher leurs tarifs.

Notebooks gérés

Aucuns frais de gestion pour les notebooks gérés en version bêta.

Notebooks gérés par l'utilisateur

Code SKU Frais de gestion par cœur-heure
vCPU 0,005 $
GPU T4, K80 et P4 0,035 $
GPU P100, V100 et A100 0,25 $

En plus des coûts de calcul, vous payez également les ressources Google Cloud que vous utilisez. Exemple :

  • Services d'analyse de données : des frais BigQuery vous sont facturés lors de l'envoi de requêtes SQL dans un notebook (consultez la page Tarifs de BigQuery).

  • Clés de chiffrement gérées par le client : l'utilisation de ces clés engendre des frais. Chaque fois que votre instance de notebooks gérés ou de notebooks gérés par l'utilisateur utilise une clé Cloud Key Management Service, cette opération est facturée selon les tarifs des opérations de clé Cloud KMS (consultez les tarifs de Cloud Key Management Service).

Ajout d'étiquettes aux données

Vertex AI vous permet de demander l'ajout manuel d'étiquettes sur une collection de données que vous prévoyez d'utiliser pour entraîner un modèle de machine learning personnalisé. Les prix applicables à ce service sont calculés en fonction de la tâche d'étiquetage.

  • Pour les tâches d'étiquetage standards, les prix sont déterminés par le nombre d'unités d'annotation.
    • Pour une tâche de classification d'image, les unités sont déterminées par le nombre d'images et le nombre d'étiqueteurs manuels. Par exemple, une image avec trois étiqueteurs manuels compte pour 1 x 3 = 3 unités. Le prix est le même pour une classification à étiquette unique et une classification multi-étiquette.
    • Pour une tâche de cadre de délimitation d'image, les unités sont déterminées par le nombre de cadres de délimitation identifiés dans les images et le nombre d'étiqueteurs manuels. Par exemple, une image avec deux cadres de délimitation et trois étiqueteurs humains compte pour 2 * 3 = 6 unités. Les images sans cadre de délimitation ne sont pas facturées.
    • Pour une tâche de segmentation/cadre en rotation/polyligne/polygone d'image, les unités sont déterminées de la même manière qu'une tâche de cadre de délimitation d'image.
    • Pour une tâche de classification de vidéo, les unités sont déterminées par la durée de la vidéo (une unité tarifaire correspond à environ cinq secondes) et le nombre d'étiqueteurs manuels. Par exemple, une vidéo de 25 secondes avec 3 étiqueteurs manuels compte pour 25 / 5 x 3 = 15 unités. Le prix est le même pour une classification à étiquette unique et une classification multi-étiquette.
    • Pour une tâche de suivi d'objet vidéo, les unités sont déterminées par le nombre d'objets identifiés dans la vidéo et par le nombre d'étiqueteurs manuels. Par exemple, une vidéo comportant deux objets et trois étiqueteurs manuels compte pour 2 x 3 = 6 unités. Une vidéo sans objet n'est pas facturée.
    • Pour une tâche d'événement vidéo, les unités sont déterminées de la même manière qu'une tâche de suivi d'objet vidéo.
    • Pour une tâche de classification de texte, les unités sont déterminées par la longueur du texte (une unité tarifaire correspond à environ 50 mots) et le nombre d'étiqueteurs manuels. Par exemple, un texte avec 100 mots et 3 étiqueteurs manuels compte pour 100 / 50 x 3 = 6 unités. Le prix est le même pour une classification à étiquette unique et une classification multi-étiquette.
    • Pour une tâche d'analyse de sentiment d'un texte, les unités sont déterminées de la même manière qu'une tâche de classification de texte.
    • Pour une tâche d'extraction d'entité de texte, les unités sont déterminées par la longueur du texte (une unité tarifaire correspond à environ 50 mots), le nombre d'entités identifiées et le nombre d'étiqueteurs manuels. Par exemple, un texte contenant 100 mots, 2 entités identifiées et 3 étiqueteurs manuels compte pour 100 / 50 x 2 x 3 = 12 unités. Les textes sans entité ne sont pas facturés.
  • Pour les tâches d'analyse de sentiment d'un texte et de classification d'images, de vidéos et de texte, les étiqueteurs humains peuvent perdre la trace des classes si la taille de l'ensemble d'étiquettes est trop importante. Par conséquent, nous envoyons au maximum 20 classes à la fois aux étiqueteurs manuels. Par exemple, si la taille de l'ensemble d'étiquettes d'une tâche d'étiquetage est de 40, chaque élément de données est envoyé 40 / 20 = 2 fois pour examen manuel, et nous vous facturons deux fois le prix ( calculé ci-dessus).

  • Pour une tâche d'étiquetage qui active la fonctionnalité d'étiqueteur personnalisé, chaque élément de données est comptabilisé comme une unité d'étiqueteur personnalisé.

  • Pour une tâche d'ajout d'étiquettes d'apprentissage actif pour les éléments de données comportant des annotations générées par des modèles (sans l'aide d'un étiqueteur manuel), chaque élément de données est comptabilisé comme une unité d'apprentissage actif.

  • Pour une tâche d'ajout d'étiquettes d'apprentissage actif pour les éléments de données comportant des annotations générées par des étiqueteurs manuels, chaque élément de données est comptabilisé comme une tâche d'ajout d'étiquettes standard, comme décrit ci-dessus.

Le tableau ci-dessous présente les tarifs pour 1 000 unités par étiqueteur manuel, en fonction de l'unité indiquée pour chaque objectif. La tarification de niveau 1 s'applique aux 50 000 premières unités comptabilisées par mois pour chaque projet Google Cloud. La tarification de niveau 2 s'applique aux 950 000 unités suivantes comptabilisées par mois pour le projet (dans la limite de 1 000 000 d'unités). Contactez-nous pour connaître les tarifs au-delà de 1 000 000 d'unités par mois.

Type de données Objectif Unité Niveau 1 Niveau 2
Image Classification Image 35 $ 25 $
Cadre de délimitation Cadre de délimitation 63 $ 49 $
Segmentation Segment 870 $ 850 $
Cadre en rotation Cadre de délimitation 86 $ 60 $
Polygone/Polyligne Polygone/Polyligne 257 $ 180 $
Vidéo Classification Vidéo de 5 secondes 86 $ 60 $
Suivi des objets Cadre de délimitation 86 $ 60 $
Reconnaissance des actions Événement d'une vidéo de 30 secondes 214 $ 150 $
Texte Classification 50 mots 129 $ 90 $
Sentiment 50 mots 200 $ 140 $
Extraction d'entités Entité 86 $ 60 $
Apprentissage actif All Élément de données 80 $ 56 $
Étiqueteur personnalisé All Élément de données 80 $ 56 $

Utilisation obligatoire de Cloud Storage

En plus des coûts décrits dans ce document, vous devez stocker vos données et vos fichiers de programme dans des buckets Cloud Storage pendant le cycle de vie de Vertex AI. Ce stockage est soumis aux règles de tarification de Cloud Storage.

L'utilisation obligatoire de Cloud Storage comprend ce qui suit :

  • Préproduction de votre package d'application d'entraînement pour des modèles entraînés personnalisés

  • Stockage des données d'entrée d'entraînement

  • Stockage des résultats de vos tâches d'entraînement Vertex AI ne nécessite pas le stockage à long terme de ces éléments. vous pouvez supprimer les fichiers dès que l'opération est terminée)

Opérations gratuites pour la gestion de vos ressources

Les opérations de gestion des ressources proposées par AI Platform sont disponibles gratuitement. Les règles relatives aux quotas d'AI Platform limitent certaines de ces opérations.

Ressource Opérations gratuites
modèles create, get, list et delete
versions create, get, list, delete et setDefault
tâches get, list et cancel
opérations get, list, cancel et delete

Frais liés à Google Cloud

Si vous stockez des images à analyser dans Cloud Storage ou si vous utilisez d'autres ressources Google Cloud avec Vertex AI, l'utilisation de ces services vous sera également facturée.

Pour consulter votre état de facturation, y compris votre utilisation et votre facture actuelle, consultez la page Facturation dans Cloud Console. Pour en savoir plus sur la gestion de votre compte, consultez la documentation Cloud Billing ou contactez l'assistance pour la facturation et les paiements.

Étape suivante