Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Un quota limite la quantité d'une ressource Google Cloud partagée que votre projet Google Cloud peut utiliser, y compris les composants matériels, logiciels et réseau. Par conséquent, les quotas font partie d'un système qui effectue les opérations suivantes :
Surveille votre utilisation ou votre consommation des produits et services Google Cloud
Limite la consommation de ces ressources pour des raisons telles que l'équité et la réduction des pics d'utilisation.
Gère des configurations qui appliquent automatiquement des restrictions recommandées.
Fournit un moyen de demander ou d'effectuer des modifications de quota.
Dans la plupart des cas, lorsqu'un quota est dépassé, le système bloque immédiatement l'accès à la ressource Google concernée et la tâche que vous essayez d'effectuer échoue. Dans la plupart des cas, les quotas s'appliquent à chaque projet Google Cloud. Ils sont partagés entre toutes les applications et adresses IP qui utilisent ce projet.
Des limites s'appliquent également aux ressources Vertex AI. Ces limites ne sont pas liées au système de quotas. Les limites ne peuvent pas être modifiées.
Quotas de requêtes
Les quotas suivants s'appliquent aux requêtes de Vertex AI pour un projet et une région compatible donnés. Par exemple, pour un seul et même projet, vous pouvez envoyer jusqu'à 30 000 requêtes de prédiction en ligne par minute dans une région et 30 000 requêtes de prédiction en ligne par minute dans une autre région compatible.
Type de demande
Requêtes par minute
Requêtes de gestion des ressources (CRUD)1
600
Requêtes d'envoi de jobs ou d'opérations de longue durée (LRO)
Requêtes de diffusion en ligne Vertex AI Feature Store
300 000
Requêtes Vertex ML Metadata
12 000
Nombre de requêtes de jetons de décompte ou de jetons de calcul
3 000
1 Les requêtes de gestion de ressources incluent toute requête qui n'est pas un job, une opération de longue durée, une requête de prédiction en ligne, une requête Vertex AI Vizier, une requête de métadonnées de ML, une requête de lecture de l'API Timeseries Insights Vertex AI TensorBoard, une requête Vertex AI Feature Store, une requête de streaming Vertex AI Feature Store ou requête de recherche vectorielle.
2 Ce quota s'applique uniquement aux points de terminaison publics. Les points de terminaison privés ont un nombre illimité de requêtes par minute.
Les jobs ou opérations de longue durée incluent les requêtes suivantes :
Créer ou supprimer un ensemble de données.
Importer ou exporter des données vers ou depuis un ensemble de données.
Créer un point de terminaison.
Créer ou supprimer un job personnalisé.
Créer ou supprimer un job d'étiquetage de données.
Créer ou supprimer un job de réglage d'hyperparamètres.
Créer ou supprimer un job de prédiction par lot.
Créer ou supprimer un modèle.
Importer, supprimer ou exporter un modèle.
Créer ou supprimer un modèle d'environnement d'exécution de notebook.
Attribuer, supprimer, démarrer ou mettre à niveau un environnement d'exécution de notebook.
Créer, supprimer ou mettre à jour une surveillance de modèle.
Créer ou supprimer une tâche de surveillance de modèle.
Les quotas suivants s'appliquent à chaque type de données et chaque objectif pour un projet et une région donnés. Par exemple, dans un projet et une région donnés, vous pouvez déployer 10 modèles de classification d'images AutoML et 10 modèles de détection d'objets image AutoML, soit un total de 20 modèles.
Les quotas suivants s'appliquent à un projet et à une région donnés. Par exemple, dans un seul projet, vous pouvez avoir 200 nœuds de diffusion en ligne dans us-central1 et 50 nœuds dans us-east4.
Quotas
Valeur
Requêtes de diffusion en ligne par minute
300 000
Nombre maximal d'instances FeatureOnlineStore
10
Nombre maximal de requêtes de recherche par minute
6 000 000
Nombre maximal de nœuds de diffusion en ligne sur toutes les instances FeatureOnlineStore optimisées du projet
80
Nombre maximal d'instances FeatureView sur toutes les instances FeatureOnlineStore
30
Vertex AI Feature Store peut également présenter les limites suivantes. Vous ne pouvez pas demander d'augmentation de ces limites dans le tableau suivant :
Limite
Valeur
Nombre maximal de ressources FeatureGroup dans un projet et un emplacement
250
Nombre maximal de ressources Feature dans un FeatureGroup
10 000
Taille maximale des données de caractéristique par entité
5 Mo
Nombre d'ID d'entité par requête de diffusion en ligne (FetchFeatureValues)
1
Vertex AI Feature Store (ancien)
Les quotas suivants s'appliquent à un projet et à une région donnés. Par exemple, dans un seul projet, vous pouvez avoir 75 tâches par lot simultanées dans us-central1 et 75 autres tâches dans europe-west4.
Quota
Valeur
Requêtes de diffusion en ligne par minute
300 000
Requêtes d'ingestion en flux continu par minute
60,000
Débit d'écriture par minute pour l'ingestion en flux continu
1,2 Go
Requêtes de création de caractéristiques par minute
100
Nœuds de diffusion en ligne dans tous les featurestores
30
Tâches par lot simultanées (ingestion, diffusion et suppression des valeurs de caractéristiques combinées)
75
Requêtes simultanées pour supprimer les valeurs de caractéristiques
1
Types d'entités dans tous les featurestores
75
Vertex AI Feature Store (ancien) présente également les limites suivantes. Vous ne pouvez pas demander d'augmentation de ces limites dans le tableau suivant :
Limite
Valeur
Limite de stockage pour un nœud de diffusion en ligne
5 To
Quantité totale de données dans le magasin hors connexion
Illimité
Fonctionnalités par type d'entité
5 000
Nombre de requêtes de création, de mise à jour et de suppression de featurestore par jour, par projet et par région
500
Taille par requête pour l'ingestion en flux continu
1 Mo
Nombre d'entités pouvant être incluses par requête en lecture en streaming
100
Nombre de fichiers pouvant être inclus par requête pour l'importation par lot
5 000 pour Avro ou 500 pour CSV
Nombre de caractéristiques pouvant être demandées pour la diffusion et l'exportation par lots
5 000
Pour l'ingestion par lots et l'ingestion en flux continu, code temporel le plus ancien pour lequel des données de caractéristiques peuvent être ingérées
4 000 jours à compter de la date actuelle
La limite de conservation des données par défaut de Vertex AI Feature Store (ancien) (pouvant être ignorée) est la suivante :
Valeurs par défaut de conservation des données
Valeur par défaut
Conservation des données dans l'espace de stockage hors ligne (ancien code temporel de la valeur de caractéristique après lequel les valeurs sont supprimées)
4 000 jours à partir de la date actuelle
Conservation des données dans l'espace de stockage en ligne (ancien code temporel de la valeur de caractéristique après lequel les valeurs sont supprimées)
4 000 jours à partir de la date actuelle
Vous pouvez remplacer la limite de conservation des données de différentes manières :
Pour ignorer la limite de conservation des données de l'espace de stockage en ligne, définissez le paramètre online_storage_ttl_days lors de la création ou de la mise à jour d'un magasin de caractéristiques.
Pour ignorer la limite de conservation des données du magasin hors connexion, définissez le paramètre offline_storage_ttl_days lors de la création ou de la mise à jour d'un type d'entité.
Vector Search
Les quotas suivants s'appliquent à Vector Search pour un projet donné dans chaque région.
Quotas
Valeur
Opérations simultanées de création d'index
5
Opérations simultanées de mise à jour d'index
5
Nombre de nœuds d'index déployés
50
Nombre de nœuds N2D d'index déployés
5
Numéro d'index
100
Requêtes de mise à jour en flux continu par minute
6 000
Débit par minute (en Ko) pour la mise à jour en flux continu
120 000
Vertex AI Pipelines
Les quotas et limites suivants s'appliquent à Vertex AI Pipelines pour un projet donné dans chaque région.
Quota
Valeur
Exécuter des tâches de pipeline en parallèle*
600
Exécutions simultanées du pipeline*
300
* Les exécutions de pipeline / les requêtes de tâche dépassant cette limite sont mises en file d'attente jusqu'à ce que des ressources soient disponibles.
Vertex AI Pipelines est soumis aux limites suivantes. Notez que, contrairement aux quotas, vous ne pouvez pas demander d'augmentation de limite.
Limite
Valeur
Nombre de tâches de pipeline par tâche
10 000
Artefacts d'entrée et de sortie par tâche de pipeline
100
Artefacts d'entrée et de sortie par tâche de pipeline
10 000
Taille maximale de la charge utile JSON contenant des paramètres de sortie et des artefacts par tâche de pipeline
131 072 octets
Optimisation des décisions Vertex AI
Les quotas et limites suivants s'appliquent à l'optimisation des décisions Vertex AI pour un projet donné dans chaque région.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2024/04/18 (UTC).
[{
"type": "thumb-down",
"id": "hardToUnderstand",
"label":"Hard to understand"
},{
"type": "thumb-down",
"id": "incorrectInformationOrSampleCode",
"label":"Incorrect information or sample code"
},{
"type": "thumb-down",
"id": "missingTheInformationSamplesINeed",
"label":"Missing the information/samples I need"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"Problème de traduction"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"Autre"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"Facile à comprendre"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"J'ai pu résoudre mon problème"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"Autre"
}]