Cette page a été traduite par l'API Cloud Translation.

Présentation du débit provisionné

Cette page explique ce qu'est le débit provisionné et quand l'utiliser.

Présentation du débit provisionné

Le débit provisionné est un abonnement à coût et durée fixes, disponible en plusieurs durées, qui réserve du débit pour les modèles d'IA générative compatibles sur Vertex AI. Pour réserver votre débit, vous devez spécifier le modèle et les emplacements disponibles dans lesquels il est exécuté.

Quand utiliser le débit provisionné ?

Si l'un des critères suivants s'applique à votre cas d'utilisation, envisagez d'utiliser le débit provisionné :

Vous créez des applications de production d'IA générative en temps réel, telles que des chatbots et des agents.
Vos charges de travail critiques nécessitent systématiquement un débit élevé. La mesure du débit dépend du modèle.
Vous souhaitez offrir une expérience cohérente et prévisible aux utilisateurs de vos applications.
Vous souhaitez avoir des coûts d'IA générative déterministes, en payant un prix mensuel ou hebdomadaire fixe avec un contrôle des dépassements.

Le débit provisionné est l'une des deux méthodes de consommation de vos modèles d'IA générative. La seconde méthode est le paiement à l'usage, également appelé paiement à la demande.

Étapes suivantes

Modèles compatibles avec le débit provisionné.