prediction.aiplatform.gdc.goog/v1
Le package v1 contient des définitions de schéma d'API pour le groupe d'API prediction.aiplatform.gdc.goog v1.
Autoscaling
Définit les paramètres d'autoscaling pour un déploiement.
Apparaît dans :
Champ | Description |
---|---|
Entier minReplica |
Nombre minimal d'instances répliquées. La valeur par défaut est 1 . La prochaine balise est 5 . |
Entier maxReplica |
Nombre maximal d'instances répliquées. |
Entier cpuTarget |
Seuil d'utilisation du processeur pour le scaling à la hausse d'un pod. |
Entier gpuDutyCycleTarget |
Seuil d'utilisation du cycle d'utilisation du GPU pour effectuer un scaling à la hausse d'un pod. |
DedicatedResources
Définit les ressources dédiées à un pool de ressources. Le prochain ID est 8
.
Apparaît dans :
Champ | Description |
---|---|
machineSpec |
Facultatif. Spécifie la configuration d'une seule machine à l'aide de la valeur machineType . Si aucune valeur n'est fournie, une valeur par défaut est utilisée. Pour la prédiction, le type de machine par défaut pour un déploiement est n1-standard-2 (modèles basés sur GKE) ou n2-standard-2-gdc (modèles basés sur le processeur). |
autoscaling Autoscaling |
Spécifie les paramètres d'autoscaling pour les charges de travail utilisateur, par exemple, le déploiement du prédicteur pour la prédiction. |
DeployedModel
Définit le schéma de l'API DeployedModels
.
Apparaît dans :
Champ | Description |
---|---|
chaîne apiVersion |
prediction.aiplatform.gdc.goog/v1 |
chaîne kind |
DeployedModel |
metadata ObjectMeta |
Reportez-vous à la documentation de l'API Kubernetes pour connaître les champs de metadata . |
spec DeployedModelSpec |
|
status DeployedModelStatus |
DeployedModelList
Contient une liste de ressources DeployedModel
.
Champ | Description |
---|---|
chaîne apiVersion |
prediction.aiplatform.gdc.goog/v1 |
chaîne kind |
DeployedModelList |
metadata ListMeta |
Reportez-vous à la documentation de l'API Kubernetes pour connaître les champs de metadata . |
items Tableau DeployedModel |
DeployedModelSpec
Définit l'état attendu des ressources DeployedModel
.
Apparaît dans :
Champ | Description |
---|---|
chaîne endpointPath |
Spécifie le nom de ressource du point de terminaison. Il a le format suivant : projects/{project}/locations/{location}/endpoints/{endpoint-id} . La prochaine balise est 6 . |
modelSpec type non valide |
Définit la spécification du modèle nécessaire lors de son déploiement. |
resourcePoolRef ObjectReference |
Spécifie la référence du pool de ressources avec les spécifications de ressources requises pour cette DeployedModel . |
sharesResourcePool booléen |
Indique si le DeployedModel partage un pool de ressources avec d'autres modèles. |
DeployedModelStatus
Définit l'état observé de la ressource DeployedModel
.
Apparaît dans :
Champ | Description |
---|---|
ready booléen |
Indique si la ressource est prête. |
primaryCondition |
Représente la condition principale d'une ressource. Si la ressource est prête, la condition l'indique. Sinon, la condition est la principale raison pour laquelle la ressource n'est pas prête. |
tableau resourceConditions |
Représente un ensemble de conditions pour une ressource et ses sous-ressources. Vous pouvez l'utiliser pour déterminer l'état général d'une ressource et de ses sous-ressources. |
Tableau Condition conditions |
Représente les conditions de ressources brutes issues des ressources Kubernetes à des fins de débogage. |
routes Routes |
Représente les routes de conteneur ou de système pour la prédiction ou la vérification de l'état du modèle déployé. |
ports Ports |
Représente les ports HTTP ou gRPC du conteneur. |
rpcStatus RpcStatus |
Indique une représentation RPC canonique de la condition principale du modèle déployé. |
Entier observedGeneration |
Indique la révision de la ressource qui a été rapprochée le plus récemment. |
Ports
Apparaît dans :
Champ | Description |
---|---|
Tableau d'entiers predictorPorts |
Liste les ports HTTP à exposer à partir du prédicteur. Les requêtes ne sont pas transférées vers des ports autres que le premier de la liste. Ce champ correspond au champ ports de l'API v1 Core des conteneurs Kubernetes. |
Tableau d'entiers predictorGRPCPorts |
Liste les ports gRPC à exposer à partir du prédicteur. Si ce champ est omis, les requêtes gRPC envoyées au conteneur sont désactivées. Les requêtes ne sont pas transférées vers des ports autres que le premier de la liste. Ce champ correspond au champ ports de l'API v1 Core des conteneurs Kubernetes. |
ReplicaStatus
Définit les informations sur les répliques de la ressource ResourcePool
.
Apparaît dans :
Champ | Description |
---|---|
resourceType ResourceType |
Spécifie le type de ressource. |
chaîne resourceName |
Indique le nom unique de la ressource dans l'espace de noms du type de ressource. Par exemple, un Deployment ResourceType a le nom de déploiement Kubernetes comme nom de ressource. |
chaîne resourceNamespace |
Indique l'espace de noms de la ressource. Ce champ ne s'applique pas aux ressources à l'échelle du cluster. |
chaîne appType |
Indique le type d'application de la ressource, défini par un produit spécifique. Par exemple, Prediction accepte predictor et explainer comme appType . |
Entier availableReplicas |
Indique le nombre total d'instances répliquées disponibles. Pour le type de ressource de déploiement Kubernetes, ce champ représente le nombre total de pods disponibles, prêts pendant au moins un nombre minimal de secondes, ciblés par ce déploiement. |
Entier unavailableReplicas |
Indique le nombre total d'instances répliquées indisponibles. Pour le type de ressource de déploiement Kubernetes, il représente le nombre total de pods indisponibles ciblés par le déploiement. |
Pool de ressources
Définit le schéma de l'API ResourcePools
.
Apparaît dans :
Champ | Description |
---|---|
chaîne apiVersion |
prediction.aiplatform.gdc.goog/v1 |
chaîne kind |
ResourcePool |
metadata ObjectMeta |
Reportez-vous à la documentation de l'API Kubernetes pour connaître les champs de metadata . |
spec ResourcePoolSpec |
|
status ResourcePoolStatus |
ResourcePoolList
Contient une liste de ressources ResourcePool
.
Champ | Description |
---|---|
chaîne apiVersion |
prediction.aiplatform.gdc.goog/v1 |
chaîne kind |
ResourcePoolList |
metadata ListMeta |
Reportez-vous à la documentation de l'API Kubernetes pour connaître les champs de metadata . |
items Tableau ResourcePool |
ResourcePoolSpec
Définit l'état attendu des ressources ResourcePool
.
Apparaît dans :
Champ | Description |
---|---|
chaîne resourcePoolID |
Représente l'ID généré par le système pour la ressource ResourcePool . Ce champ ne s'applique qu'à Google Cloud et GDCE. La prochaine balise est 8 . |
chaîne userProvidedID |
Représente l'ID fourni par l'utilisateur pour la ressource ResourcePool . Ce champ ne s'applique qu'à Google Cloud et GDCE. |
dedicatedResources DedicatedResources |
Contient une description des ressources dédiées au pool de ressources. |
enableContainerLogging booléen |
Indique si la journalisation des conteneurs est activée pour ResourcePool . |
chaîne userGsa |
Indique le compte de service IAM fourni par l'utilisateur dans le projet utilisateur. Si aucun n'est spécifié, le compte de service de diffusion par défaut est utilisé. |
chaîne customKsaName |
Spécifie le nom personnalisé que l'opérateur crée et que la charge de travail de l'utilisateur utilise uniquement pour les cas d'utilisation de votre propre compte de service (BYOSA). Si ce champ est vide, le système utilise le modèle de dénomination par défaut. |
rolloutStrategy type non valide |
Indique si les modèles déployés dans ce pool doivent être déployés progressivement ou tous en même temps sur les répliques du serveur de modèles. |
ResourcePoolStatus
Définit l'état observé des ressources ResourcePool
.
Apparaît dans :
Champ | Description |
---|---|
ready booléen |
Indique si la ressource est prête. |
primaryCondition |
Représente la condition principale d'une ressource. Si la ressource est prête, la condition l'indique. Sinon, la condition est la principale raison pour laquelle la ressource n'est pas prête. |
resourceConditions |
Représente un ensemble de conditions pour une ressource et ses sous-ressources. Vous pouvez l'utiliser pour déterminer l'état général d'une ressource et de ses sous-ressources. |
Tableau Condition conditions |
Représente les conditions de ressources brutes issues des ressources Kubernetes à des fins de débogage. |
Tableau ReplicaStatus replicaStatuses |
|
rpcStatus RpcStatus |
Indique une représentation RPC canonique de la condition principale de ResourcePool. |
Entier observedGeneration |
Indique la révision de la ressource qui a été rapprochée le plus récemment. |
Routes
Apparaît dans :
Champ | Description |
---|---|
chaîne predictRoute |
Représente le chemin de routage sur le conteneur pour envoyer des requêtes de prédiction. Vertex AI transfère les requêtes à l'aide de projects.locations.endpoints.predict vers ce chemin sur l'adresse IP et le port du conteneur. Vertex AI renvoie ensuite la réponse du conteneur dans la réponse de l'API. |
chaîne predictSystemRoute |
Représente le chemin de routage système permettant d'envoyer des requêtes de prédiction à l'entrée du cluster. Ce champ n'est renseigné en interne que lorsqu'il est copié dans deployedModel lors du déploiement. |
chaîne healthRoute |
Représente le chemin de routage sur le conteneur pour envoyer des vérifications de l'état. Vertex AI envoie parfois des requêtes GET à ce chemin sur l'adresse IP et le port du conteneur pour vérifier que celui-ci est opérationnel. |
chaîne healthSystemRoute |
Représente le chemin de routage système permettant d'envoyer des requêtes de vérification de l'état'état à l'entrée du cluster. Ce champ n'est renseigné en interne que lorsqu'il est copié dans deployedModel lors du déploiement. |
RpcStatus
Encapsule un code RPC et un message.
Apparaît dans :
Champ | Description |
---|---|
code Code |
Représente le code RPC. La prochaine balise est 4 . |
chaîne message |
Contient une description de la condition visible par l'utilisateur. |
terminalState booléen |
Indique une valeur de true si la ressource a atteint un état final et ne peut pas devenir prête. |