Lorsque vous entraînez un modèle à l'aide d'un workflow tabulaire, vous êtes facturé en fonction du coût de l'infrastructure et des services dépendants. Lorsque vous effectuez des prédictions avec ce modèle, vous êtes facturé en fonction du coût de l'infrastructure.
Le coût de l'infrastructure dépend des facteurs suivants :
- Nombre de machines que vous utilisez. Vous pouvez définir des paramètres associés lors de l'entraînement de modèle, de prédictions par lots ou de prédictions en ligne.
- Type de machine que vous utilisez. Vous pouvez définir ce paramètre lors de l'entraînement de modèle, de prédictions par lots ou de prédictions en ligne.
- Durée d'utilisation des machines.
- Si vous entraînez un modèle ou effectuez des prédictions par lots, il s'agit d'une mesure du temps de traitement total de l'opération.
- Si vous effectuez des prédictions en ligne, il s'agit d'une mesure de la durée pendant laquelle votre modèle est déployé sur un point de terminaison.
Le workflow tabulaire exécute plusieurs services dépendants dans votre projet en votre nom : Dataflow, BigQuery, Cloud Storage, Vertex AI Pipelines, Vertex AI Training. Ces services vous seront facturés directement.
Exemples de calculs des coûts d'entraînement
Exemple 1 : Ensemble de données de 110 Mo au format CSV, entraîné pendant une heure avec la configuration matérielle par défaut.
La répartition des coûts pour le workflow par défaut avec la recherche d'architecture et l'entraînement est la suivante :
Service | Coût |
---|---|
Exemple Dataflow et génération de statistiques | 2 $ (Dataflow exécuté pendant 7 min) |
Données Dataflow et transformations de caractéristiques | 3 $ (Dataflow exécuté pendant 10 minutes) |
Vertex AI Training | 0,8 h x 20 $ + 0,2 h x 20 $ + 3,3 $ de coût SSD + coût du conteneur de pipeline = 24 $ (48 minutes de réglage, 12 minutes d'entraînement) |
Vertex AI Pipelines | 1 exécution x 0,03 $= 0,03 $ |
Total, hors distillation de modèle | 27,03 $ |
Vous pouvez éventuellement activer la distillation du modèle pour réduire la taille du modèle obtenu. La répartition des coûts est la suivante :
Service | Coût |
---|---|
Total, hors distillation de modèle | 27,03 $ |
Vertex AI Training pour la distillation de modèle | 1 $ |
Données Dataflow, transformations de caractéristiques pour la distillation de modèle | 3 $ (Dataflow exécuté pendant 10 minutes) |
Prédiction par lot pour la distillation de modèle | 7 $ |
Total, y compris la distillation de modèle | 38,03 $ |
Exemple 2 : Ensemble de données de 1,84 To dans BigQuery, entraîné pendant 20 heures avec remplacement de matériel.
La configuration matérielle de cet exemple est la suivante :
Nom de la configuration matérielle | Valeur |
---|---|
stats_and_example_gen_dataflow_machine_type | n1-standard-16 |
stats_and_example_gen_dataflow_max_num_workers | 100 |
stats_and_example_gen_dataflow_disk_size_gb | 40 |
transform_dataflow_machine_type | n1-standard-16 |
transform_dataflow_max_num_workers | 100 |
transform_dataflow_disk_size_gb | 200 |
distill_batch_predict_machine_type | n1-standard-2 |
distill_batch_predict_starting_replica_count | 200 |
distill_batch_predict_max_replica_count | 200 |
La répartition des coûts pour le workflow par défaut avec la recherche d'architecture et l'entraînement est la suivante :
Service | Coût |
---|---|
Exemple Dataflow et génération de statistiques | 518 $ (Dataflow exécuté pendant 6 heures) |
Données Dataflow, transformations de caractéristiques | 471 $ (Dataflow exécuté pendant 6 heures) |
Vertex AI Training | 17 h x 20 $ + 3 h x 20 $ + 41,5 $ de coût SSD + coût du conteneur de pipeline = 555 $ (17 heures de réglage, 3 heures d'entraînement) |
Vertex AI Pipelines | 1 exécution x 0,03 $= 0,03 $ |
Total | 1544,03 $ |