KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

Le package v1 contient des définitions de schéma d'API pour le groupe d'API prediction.aiplatform.gdc.goog v1.

Autoscaling

Définit les paramètres d'autoscaling pour un déploiement.

Apparaît dans :

Champ Description
Entier minReplica Nombre minimal d'instances répliquées. La valeur par défaut est 1. La prochaine balise est 5.
Entier maxReplica Nombre maximal d'instances répliquées.
Entier cpuTarget Seuil d'utilisation du processeur pour le scaling à la hausse d'un pod.
Entier gpuDutyCycleTarget Seuil d'utilisation du cycle d'utilisation du GPU pour effectuer un scaling à la hausse d'un pod.

DedicatedResources

Définit les ressources dédiées à un pool de ressources. Le prochain ID est 8.

Apparaît dans :

Champ Description
machineSpec Facultatif. Spécifie la configuration d'une seule machine à l'aide de la valeur machineType. Si aucune valeur n'est fournie, une valeur par défaut est utilisée. Pour la prédiction, le type de machine par défaut pour un déploiement est n1-standard-2 (modèles basés sur GKE) ou n2-standard-2-gdc (modèles basés sur le processeur).
autoscaling Autoscaling Spécifie les paramètres d'autoscaling pour les charges de travail utilisateur, par exemple, le déploiement du prédicteur pour la prédiction.

DeployedModel

Définit le schéma de l'API DeployedModels.

Apparaît dans :

Champ Description
chaîne apiVersion prediction.aiplatform.gdc.goog/v1
chaîne kind DeployedModel
metadata ObjectMeta Reportez-vous à la documentation de l'API Kubernetes pour connaître les champs de metadata.
spec DeployedModelSpec
status DeployedModelStatus

DeployedModelList

Contient une liste de ressources DeployedModel.

Champ Description
chaîne apiVersion prediction.aiplatform.gdc.goog/v1
chaîne kind DeployedModelList
metadata ListMeta Reportez-vous à la documentation de l'API Kubernetes pour connaître les champs de metadata.
items Tableau DeployedModel

DeployedModelSpec

Définit l'état attendu des ressources DeployedModel.

Apparaît dans :

Champ Description
chaîne endpointPath Spécifie le nom de ressource du point de terminaison. Il a le format suivant : projects/{project}/locations/{location}/endpoints/{endpoint-id}. La prochaine balise est 6.
modelSpec type non valide Définit la spécification du modèle nécessaire lors de son déploiement.
resourcePoolRef ObjectReference Spécifie la référence du pool de ressources avec les spécifications de ressources requises pour cette DeployedModel.
sharesResourcePool booléen Indique si le DeployedModel partage un pool de ressources avec d'autres modèles.

DeployedModelStatus

Définit l'état observé de la ressource DeployedModel.

Apparaît dans :

Champ Description
ready booléen Indique si la ressource est prête.
primaryCondition Représente la condition principale d'une ressource. Si la ressource est prête, la condition l'indique. Sinon, la condition est la principale raison pour laquelle la ressource n'est pas prête.
tableau resourceConditions Représente un ensemble de conditions pour une ressource et ses sous-ressources. Vous pouvez l'utiliser pour déterminer l'état général d'une ressource et de ses sous-ressources.
Tableau Condition conditions Représente les conditions de ressources brutes issues des ressources Kubernetes à des fins de débogage.
routes Routes Représente les routes de conteneur ou de système pour la prédiction ou la vérification de l'état du modèle déployé.
ports Ports Représente les ports HTTP ou gRPC du conteneur.
rpcStatus RpcStatus Indique une représentation RPC canonique de la condition principale du modèle déployé.
Entier observedGeneration Indique la révision de la ressource qui a été rapprochée le plus récemment.

Ports

Apparaît dans :

Champ Description
Tableau d'entiers predictorPorts Liste les ports HTTP à exposer à partir du prédicteur. Les requêtes ne sont pas transférées vers des ports autres que le premier de la liste. Ce champ correspond au champ ports de l'API v1 Core des conteneurs Kubernetes.
Tableau d'entiers predictorGRPCPorts Liste les ports gRPC à exposer à partir du prédicteur. Si ce champ est omis, les requêtes gRPC envoyées au conteneur sont désactivées. Les requêtes ne sont pas transférées vers des ports autres que le premier de la liste. Ce champ correspond au champ ports de l'API v1 Core des conteneurs Kubernetes.

ReplicaStatus

Définit les informations sur les répliques de la ressource ResourcePool.

Apparaît dans :

Champ Description
resourceType ResourceType Spécifie le type de ressource.
chaîne resourceName Indique le nom unique de la ressource dans l'espace de noms du type de ressource. Par exemple, un Deployment ResourceType a le nom de déploiement Kubernetes comme nom de ressource.
chaîne resourceNamespace Indique l'espace de noms de la ressource. Ce champ ne s'applique pas aux ressources à l'échelle du cluster.
chaîne appType Indique le type d'application de la ressource, défini par un produit spécifique. Par exemple, Prediction accepte predictor et explainer comme appType.
Entier availableReplicas Indique le nombre total d'instances répliquées disponibles. Pour le type de ressource de déploiement Kubernetes, ce champ représente le nombre total de pods disponibles, prêts pendant au moins un nombre minimal de secondes, ciblés par ce déploiement.
Entier unavailableReplicas Indique le nombre total d'instances répliquées indisponibles. Pour le type de ressource de déploiement Kubernetes, il représente le nombre total de pods indisponibles ciblés par le déploiement.

Pool de ressources

Définit le schéma de l'API ResourcePools.

Apparaît dans :

Champ Description
chaîne apiVersion prediction.aiplatform.gdc.goog/v1
chaîne kind ResourcePool
metadata ObjectMeta Reportez-vous à la documentation de l'API Kubernetes pour connaître les champs de metadata.
spec ResourcePoolSpec
status ResourcePoolStatus

ResourcePoolList

Contient une liste de ressources ResourcePool.

Champ Description
chaîne apiVersion prediction.aiplatform.gdc.goog/v1
chaîne kind ResourcePoolList
metadata ListMeta Reportez-vous à la documentation de l'API Kubernetes pour connaître les champs de metadata.
items Tableau ResourcePool

ResourcePoolSpec

Définit l'état attendu des ressources ResourcePool.

Apparaît dans :

Champ Description
chaîne resourcePoolID Représente l'ID généré par le système pour la ressource ResourcePool. Ce champ ne s'applique qu'à Google Cloud et GDCE. La prochaine balise est 8.
chaîne userProvidedID Représente l'ID fourni par l'utilisateur pour la ressource ResourcePool. Ce champ ne s'applique qu'à Google Cloud et GDCE.
dedicatedResources DedicatedResources Contient une description des ressources dédiées au pool de ressources.
enableContainerLogging booléen Indique si la journalisation des conteneurs est activée pour ResourcePool.
chaîne userGsa Indique le compte de service IAM fourni par l'utilisateur dans le projet utilisateur. Si aucun n'est spécifié, le compte de service de diffusion par défaut est utilisé.
chaîne customKsaName Spécifie le nom personnalisé que l'opérateur crée et que la charge de travail de l'utilisateur utilise uniquement pour les cas d'utilisation de votre propre compte de service (BYOSA). Si ce champ est vide, le système utilise le modèle de dénomination par défaut.
rolloutStrategy type non valide Indique si les modèles déployés dans ce pool doivent être déployés progressivement ou tous en même temps sur les répliques du serveur de modèles.

ResourcePoolStatus

Définit l'état observé des ressources ResourcePool.

Apparaît dans :

Champ Description
ready booléen Indique si la ressource est prête.
primaryCondition Représente la condition principale d'une ressource. Si la ressource est prête, la condition l'indique. Sinon, la condition est la principale raison pour laquelle la ressource n'est pas prête.
resourceConditions Représente un ensemble de conditions pour une ressource et ses sous-ressources. Vous pouvez l'utiliser pour déterminer l'état général d'une ressource et de ses sous-ressources.
Tableau Condition conditions Représente les conditions de ressources brutes issues des ressources Kubernetes à des fins de débogage.
Tableau ReplicaStatus replicaStatuses
rpcStatus RpcStatus Indique une représentation RPC canonique de la condition principale de ResourcePool.
Entier observedGeneration Indique la révision de la ressource qui a été rapprochée le plus récemment.

Routes

Apparaît dans :

Champ Description
chaîne predictRoute Représente le chemin de routage sur le conteneur pour envoyer des requêtes de prédiction. Vertex AI transfère les requêtes à l'aide de projects.locations.endpoints.predict vers ce chemin sur l'adresse IP et le port du conteneur. Vertex AI renvoie ensuite la réponse du conteneur dans la réponse de l'API.
chaîne predictSystemRoute Représente le chemin de routage système permettant d'envoyer des requêtes de prédiction à l'entrée du cluster. Ce champ n'est renseigné en interne que lorsqu'il est copié dans deployedModel lors du déploiement.
chaîne healthRoute Représente le chemin de routage sur le conteneur pour envoyer des vérifications de l'état. Vertex AI envoie parfois des requêtes GET à ce chemin sur l'adresse IP et le port du conteneur pour vérifier que celui-ci est opérationnel.
chaîne healthSystemRoute Représente le chemin de routage système permettant d'envoyer des requêtes de vérification de l'état'état à l'entrée du cluster. Ce champ n'est renseigné en interne que lorsqu'il est copié dans deployedModel lors du déploiement.

RpcStatus

Encapsule un code RPC et un message.

Apparaît dans :

Champ Description
code Code Représente le code RPC. La prochaine balise est 4.
chaîne message Contient une description de la condition visible par l'utilisateur.
terminalState booléen Indique une valeur de true si la ressource a atteint un état final et ne peut pas devenir prête.