Cette page fournit des informations à prendre en compte avant de vous abonner au débit provisionné, les autorisations dont vous devez disposer pour passer ou afficher une commande de débit provisionné, ainsi que les instructions pour passer et afficher vos commandes.
Éléments à prendre en compte avant de s'abonner
Pour vous aider à décider si vous souhaitez vous abonner au débit provisionné, consultez cette liste d'informations sur l'abonnement :
Vous ne pouvez pas annuler votre commande.
Votre achat de débit provisionné est un engagement, ce qui signifie que vous ne pouvez pas annuler la commande. Toutefois, vous pouvez augmenter le nombre de GSU achetés. Si vous souscrivez un engagement par accident ou si votre configuration pose problème, contactez votre Google Cloud responsable de compte pour obtenir de l'aide.
Vous pouvez renouveler automatiquement votre abonnement.
Lorsque vous envoyez votre commande, vous pouvez choisir de renouveler automatiquement votre abonnement une fois arrivé à échéance ou de le laisser expirer. Vous pouvez annuler le processus de renouvellement automatique. Pour annuler votre abonnement avant son renouvellement automatique, annulez le renouvellement automatique 30 jours avant le début de la période suivante.
Vous pouvez configurer les abonnements mensuels pour qu'ils soient renouvelés automatiquement chaque mois. Les conditions hebdomadaires ne sont pas compatibles avec le renouvellement automatique.
Si vous avez besoin d'aide pour effectuer cette procédure, contactez votre Google Cloud représentant de compte.
Vous pouvez modifier la version ou la région de votre modèle avec préavis.
Une fois votre commande approuvée, le débit provisionné est activé après avoir choisi votre projet, votre région, votre modèle et votre version. Dans les 10 jours ouvrés suivant l'approbation de votre commande, vous pouvez modifier la version de votre modèle dans la région ou auprès du même diffuseur de modèle à l'aide de la console Google Cloud pour les modèles Google. Pour en savoir plus, consultez Modifier l'ordre du débit provisionné. Vous pouvez également contacter votre Google Cloud responsable de compte pour obtenir de l'aide.
Vous ne pouvez passer d'un modèle à un autre que pour un même fournisseur. Par exemple, vous pouvez basculer entre les modèles Google ou entre les modèles du partenaire A. Toutefois, vous ne pouvez pas basculer entre les modèles de Google et ceux du partenaire A.
Il n'y a pas de temps d'arrêt lorsque vous passez du paiement à l'usage au débit provisionné.
Il n'y a pas de temps d'arrêt lorsque vous passez d'un modèle à un autre pour une commande de débit provisionné. Toutefois, le délai de livraison du débit reste nécessaire.
Par défaut, le dépassement est facturé au tarif de paiement à l'usage.
Si votre débit dépasse le montant de votre commande de débit provisionné, les dépassements sont traités et facturés sous forme de paiement à l'usage. Vous pouvez contrôler les dépassements par requête. Pour en savoir plus, consultez la page Utiliser l'API REST.
Les requêtes ont la priorité.
Les requêtes des clients de débit provisionné ont la priorité et sont traitées avant les requêtes à la demande.
Vous devez vous engager pour une utilisation minimum et un paiement.
L'utilisation minimum dépend du modèle d'IA générative que vous sélectionnez. Toute utilisation excédant le taux de débit souscrit n'est pas garantie et sera prise en charge sur la base d'efforts raisonnables.
Le débit ne s'accumule pas.
Les débits inutilisés ne sont pas cumulatifs ni reportés sur le mois suivant.
Le débit provisionné est mesuré en caractères ou en jetons par seconde.
Le débit provisionné est mesuré en caractères ou en jetons par seconde, et non en requêtes par minute (RPM). Par conséquent, la mesure du débit provisionné dépend de la taille des requêtes et du nombre de requêtes par minute de votre cas d'utilisation.
Le débit provisionné vérifie votre quota.
Votre quota de débit provisionné est vérifié chaque fois que vous effectuez une requête dans la période de quota. Pour les modèles
gemini-1.5-flash-002
etgemini-1.5-pro-002
, la période de quota est de 30 secondes. Cela signifie que vous pouvez temporairement constater un trafic prioritaire qui dépasse votre quota par seconde dans certains cas, mais vous ne devez pas dépasser votre quota toutes les 30 secondes. La période de quota pour les autres modèles est d'une minute.Les points de terminaison de modèles affinés supervisés et leur modèle de base correspondant sont comptabilisés dans le même quota de débit provisionné. Il s'agit d'une fonctionnalité en preview. Remplissez et envoyez le formulaire de contrôle des accès au débit provisionné.
Par exemple, le débit provisionné acheté pour
gemini-1.5-pro-002
pour un projet spécifique donne la priorité aux requêtes effectuées à partir de versions affinées supervisées degemini-1.5-pro-002
créées dans ce projet. Utilisez l'en-tête approprié pour contrôler le comportement du trafic.
Autorisations
Pour vous abonner au débit provisionné, vous devez disposer de l'une des autorisations suivantes pour votre projet afin de pouvoir afficher et passer de nouvelles commandes.
aiplatform.googleapis.com/provisionedThroughputAdmin
: spécifique au débit provisionné.aiplatform.googleapis.com/admin
: accorde des droits d'administrateur sur chaque ressource Vertex AI.
Ce rôle vous permet uniquement d'afficher vos commandes :
aiplatform.googleapis.com/viewer
Passer une commande de débit provisionné
Avant de passer votre commande pour utiliser les modèles Imagen, remplissez le formulaire de demande d'octroi d'autorisations pour obtenir les autorisations nécessaires.
Avant de passer une commande pour utiliser MedLM-large-1.5, contactez votre Google Cloud représentant du compte pour demander l'accès. Si vous prévoyez que votre nombre de requêtes par minute dépassera 30 000, pour maximiser votre commande de débit provisionné, demandez une augmentation de votre quota système Vertex AI par défaut à l'aide des informations suivantes:
- Service: API Vertex AI.
- Nom :
Online prediction requests per minute per region
- Type de service: quota.
- Dimensions: région dans laquelle vous avez commandé le débit provisionné.
- Valeur: limite de trafic de prédiction en ligne que vous avez choisie.
Pour acheter du débit provisionné, procédez comme suit:
Console
- Dans la console Google Cloud, accédez à la page du débit provisionné.
- Pour créer une commande, cliquez sur Créer.
- Indiquez un nom de commande.
- Sélectionnez le modèle.
- Sélectionnez la Région.
- Saisissez le nombre d'unités d'échelle d'IA générative (GSU) que vous devez acheter. Si vous devez estimer le nombre de GSU, cliquez sur l'outil d'estimation.
- Sélectionnez votre modèle.
- Saisissez le nombre de requêtes par seconde.
- Saisissez le nombre de caractères d'entrée par requête.
- Saisissez le nombre d'images d'entrée par requête.
- Saisissez le nombre de secondes de vidéo par requête.
- Saisissez le nombre de secondes d'audio par requête.
- Saisissez le nombre de caractères de sortie par requête.
- Si vous souhaitez utiliser les valeurs que vous avez saisies dans l'outil d'estimation, cliquez sur Utiliser les valeurs calculées.
- Sélectionnez la durée.
Si vous choisissez une semaine, vous pouvez indiquer une date et une heure de début dans les deux semaines suivant la date de passation de la commande. Si vous ne fournissez pas de date et d'heure de début, nous traitons la commande dès que nous pouvons nous assurer que la capacité est disponible. Les dates et heures de début demandées sont respectées dans la mesure du possible. Il n'est pas garanti qu'une commande soit honorée en fonction de ces valeurs tant que l'état de la commande n'est pas défini sur Approuvé.
Si la date de début souhaitée est trop proche de la date actuelle, votre commande peut être approuvée et activée après la date de début souhaitée. Cela signifie que votre date de fin reste sept jours après la date d'activation.
- Sélectionnez l'option de renouvellement.
- Cliquez sur Continuer.
- Dans la section Résumé, vérifiez les estimations de prix et de débit de votre commande. Lisez les conditions indiquées et accessibles dans les liens du formulaire.
- Pour finaliser votre commande, cliquez sur Confirmer.
Modifier la commande de débit provisionné
Ce tableau explique comment modifier vos commandes de débit provisionné via la console Google Cloud en fonction de l'état de votre commande et des conditions existantes. Pour demander l'accès à ces fonctionnalités en preview, remplissez et envoyez le formulaire de contrôle des accès au débit provisionné.
État de la commande | Action | Remarque | Étapes dans la console Google Cloud |
---|---|---|---|
En attente d'examen | Vous pouvez annuler votre commande. |
Si vous souhaitez apporter d'autres modifications à votre commande, annulez-la et passez-en une nouvelle. Si vous avez plusieurs modèles, chaque modèle ne peut avoir qu'une seule révision de commande ou commande en attente à la fois. |
Pour annuler votre commande en attente dans la console Google Cloud, procédez comme suit:
|
Actif |
Vous pouvez augmenter le nombre de GSU sur les commandes existantes. Vous pouvez activer ou désactiver les renouvellements automatiques. Vous pouvez modifier la version du modèle. |
Si ces deux conditions sont remplies, vous ne pouvez pas modifier votre commande:
|
Pour modifier votre commande active dans la console Google Cloud, utilisez l'une des méthodes suivantes:
|
Suivi de la commande
Une fois que vous avez envoyé votre commande de débit provisionné, l'état de la commande peut apparaître comme suit :
- En attente d'examen : vous avez passé votre commande. L'approbation dépend de la capacité disponible pour provisionner votre commande. Votre commande est donc en attente d'examen et d'approbation. Pour en savoir plus sur l'état de votre commande en attente, contactez votre Google Cloud responsable de compte.
- Approuvé: Google a approuvé votre commande.
- Actif: Google a activé votre commande, et la facturation commence.
- Expiré : votre commande a expiré.
Afficher les commandes de débit provisionné
Pour afficher vos commandes de débit provisionné, procédez comme suit :
Console
- Dans la console Google Cloud, accédez à la page du débit provisionné.
- Sélectionnez la Région. Votre liste de commandes s'affiche.