Présentation des ressources persistantes

Une ressource persistante Vertex AI est un cluster de longue durée que vous pouvez créer pour exécuter des tâches d'entraînement personnalisées. Une fois un job d'entraînement terminé, la ressource persistante reste disponible pour exécuter d'autres jobs d'entraînement jusqu'à ce que vous la supprimiez. Vous pouvez utiliser une ressource persistante pour garantir la disponibilité des ressources de calcul et pour réduire le temps de démarrage du job normalement nécessaire à la création de ressources de calcul. Les ressources persistantes sont compatibles avec toutes les VM et tous les GPU compatibles avec les tâches d'entraînement personnalisé. Cette page explique quand utiliser une ressource persistante et fournit des informations sur la facturation et les quotas.

Quand utiliser une ressource persistante ?

Nous vous recommandons d'utiliser des ressources persistantes dans les scénarios suivants :

  • Vous souhaitez garantir la disponibilité de la capacité pour les charges de travail de ML critiques ou pendant les périodes de pics. Contrairement aux tâches personnalisées, où le service d'entraînement libère la ressource une fois la tâche terminée, la ressource persistante reste disponible jusqu'à sa suppression.
  • Vous envoyez le même job de nombreuses fois et pouvez bénéficier de la mise en cache des données et des images en exécutant les jobs sur la même ressource persistante.
  • Vous exécutez de nombreux jobs d'entraînement de courte durée pour lesquels le temps d'entraînement réel est plus court que temps de démarrage des jobs.

Pour savoir quand et pourquoi utiliser une ressource persistante, consultez l'article de blog Optimiser la capacité et les temps de démarrage de Vertex AI Training.

Informations de facturation

Vous êtes facturé(e) pour la durée totale d'exécution d'une ressource persistante, qu'une tâche soit exécutée sur cette ressource ou non. Pour chaque instance du pool de ressources persistantes, vous êtes facturé(e) à l'heure d'utilisation du cœur. Les tâches exécutées sur une ressource persistante ne sont pas facturées séparément. Vous êtes facturé(e) uniquement pour la ressource persistante.

Si vous configurez l'autoscaling pour votre ressource persistante, vous ne payez que pour les instances provisionnées. Par exemple, si min-replica-count est défini sur 4, les instances 4 sont toujours provisionnées et cela correspond au montant minimal qui vous est facturé. Lorsque votre charge de travail augmente, le pool de ressources peut évoluer jusqu'à 6 pour répondre à la demande accrue. Les instances provisionnées pour 6 vous sont facturées jusqu'à ce que votre pool de ressources évolue à nouveau. Pour éviter de payer pour les nœuds inactifs, utilisez l'autoscaling pour votre ressource persistante ou supprimez-la lorsque vous n'en avez plus besoin. Pour en savoir plus sur la tarification, consultez la section Modèles entraînés personnalisés de la page "Tarifs de Vertex AI".

Quotas

Les ressources persistantes utilisent votre quota d'entraînement. Par conséquent, vérifiez que vous disposez d'un quota suffisant pour créer des ressources persistantes. Pour en savoir plus sur les quotas, consultez la page Quotas et limites d'entraînement.

Étapes suivantes