Cette page a été traduite par l'API Cloud Translation.

KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

Le package v1 contient des définitions de schéma d'API pour le groupe d'API prediction.aiplatform.gdc.goog v1.

Autoscaling

Définit les paramètres d'autoscaling pour un déploiement.

Apparaît dans :

DedicatedResources

Champ	Description
Entier `minReplica`	Nombre minimal d'instances répliquées. La valeur par défaut est `1`. La prochaine balise est `5`.
Entier `maxReplica`	Nombre maximal d'instances répliquées.
Entier `cpuTarget`	Seuil d'utilisation du processeur pour le scaling à la hausse d'un pod.
Entier `gpuDutyCycleTarget`	Seuil d'utilisation du cycle d'utilisation du GPU pour effectuer un scaling à la hausse d'un pod.

DedicatedResources

Définit les ressources dédiées à un pool de ressources. Le prochain ID est 8.

Apparaît dans :

ResourcePoolSpec

Champ	Description
`machineSpec`	Facultatif. Spécifie la configuration d'une seule machine à l'aide de la valeur `machineType`. Si aucune valeur n'est fournie, une valeur par défaut est utilisée. Pour la prédiction, le type de machine par défaut pour un déploiement est `n1-standard-2` (modèles basés sur GKE) ou `n2-standard-2-gdc` (modèles basés sur le processeur).
`autoscaling` Autoscaling	Spécifie les paramètres d'autoscaling pour les charges de travail utilisateur, par exemple, le déploiement du prédicteur pour la prédiction.

DeployedModel

Définit le schéma de l'API DeployedModels.

Apparaît dans :

DeployedModelList

Champ	Description
chaîne `apiVersion`	`prediction.aiplatform.gdc.goog/v1`
chaîne `kind`	`DeployedModel`
`metadata` ObjectMeta	Reportez-vous à la documentation de l'API Kubernetes pour connaître les champs de `metadata`.
`spec` DeployedModelSpec
`status` DeployedModelStatus

DeployedModelList

Contient une liste de ressources DeployedModel.

Champ	Description
chaîne `apiVersion`	`prediction.aiplatform.gdc.goog/v1`
chaîne `kind`	`DeployedModelList`
`metadata` ListMeta	Reportez-vous à la documentation de l'API Kubernetes pour connaître les champs de `metadata`.
`items` Tableau DeployedModel

DeployedModelSpec

Définit l'état attendu des ressources DeployedModel.

Apparaît dans :

DeployedModel

Champ	Description
chaîne `endpointPath`	Spécifie le nom de ressource du point de terminaison. Il a le format suivant : `projects/{project}/locations/{location}/endpoints/{endpoint-id}`. La prochaine balise est `6`.
`modelSpec` type non valide	Définit la spécification du modèle nécessaire lors de son déploiement.
`resourcePoolRef` ObjectReference	Spécifie la référence du pool de ressources avec les spécifications de ressources requises pour cette `DeployedModel`.
`sharesResourcePool` booléen	Indique si le `DeployedModel` partage un pool de ressources avec d'autres modèles.

DeployedModelStatus

Définit l'état observé de la ressource DeployedModel.

Apparaît dans :

DeployedModel

Champ	Description
`ready` booléen	Indique si la ressource est prête.
`primaryCondition`	Représente la condition principale d'une ressource. Si la ressource est prête, la condition l'indique. Sinon, la condition est la principale raison pour laquelle la ressource n'est pas prête.
tableau `resourceConditions`	Représente un ensemble de conditions pour une ressource et ses sous-ressources. Vous pouvez l'utiliser pour déterminer l'état général d'une ressource et de ses sous-ressources.
Tableau Condition `conditions`	Représente les conditions de ressources brutes issues des ressources Kubernetes à des fins de débogage.
`routes` Routes	Représente les routes de conteneur ou de système pour la prédiction ou la vérification de l'état du modèle déployé.
`ports` Ports	Représente les ports HTTP ou gRPC du conteneur.
`rpcStatus` RpcStatus	Indique une représentation RPC canonique de la condition principale du modèle déployé.
Entier `observedGeneration`	Indique la révision de la ressource qui a été rapprochée le plus récemment.

Ports

Apparaît dans :

DeployedModelStatus

Champ	Description
Tableau d'entiers `predictorPorts`	Liste les ports HTTP à exposer à partir du prédicteur. Les requêtes ne sont pas transférées vers des ports autres que le premier de la liste. Ce champ correspond au champ `ports` de l'API v1 Core des conteneurs Kubernetes.
Tableau d'entiers `predictorGRPCPorts`	Liste les ports gRPC à exposer à partir du prédicteur. Si ce champ est omis, les requêtes gRPC envoyées au conteneur sont désactivées. Les requêtes ne sont pas transférées vers des ports autres que le premier de la liste. Ce champ correspond au champ `ports` de l'API v1 Core des conteneurs Kubernetes.

ReplicaStatus

Définit les informations sur les répliques de la ressource ResourcePool.

Apparaît dans :

ResourcePoolStatus

Champ	Description
`resourceType` ResourceType	Spécifie le type de ressource.
chaîne `resourceName`	Indique le nom unique de la ressource dans l'espace de noms du type de ressource. Par exemple, un `Deployment` `ResourceType` a le nom de déploiement Kubernetes comme nom de ressource.
chaîne `resourceNamespace`	Indique l'espace de noms de la ressource. Ce champ ne s'applique pas aux ressources à l'échelle du cluster.
chaîne `appType`	Indique le type d'application de la ressource, défini par un produit spécifique. Par exemple, Prediction accepte `predictor` et `explainer` comme `appType`.
Entier `availableReplicas`	Indique le nombre total d'instances répliquées disponibles. Pour le type de ressource de déploiement Kubernetes, ce champ représente le nombre total de pods disponibles, prêts pendant au moins un nombre minimal de secondes, ciblés par ce déploiement.
Entier `unavailableReplicas`	Indique le nombre total d'instances répliquées indisponibles. Pour le type de ressource de déploiement Kubernetes, il représente le nombre total de pods indisponibles ciblés par le déploiement.

Pool de ressources

Définit le schéma de l'API ResourcePools.

Apparaît dans :

ResourcePoolList

Champ	Description
chaîne `apiVersion`	`prediction.aiplatform.gdc.goog/v1`
chaîne `kind`	`ResourcePool`
`metadata` ObjectMeta	Reportez-vous à la documentation de l'API Kubernetes pour connaître les champs de `metadata`.
`spec` ResourcePoolSpec
`status` ResourcePoolStatus

ResourcePoolList

Contient une liste de ressources ResourcePool.

Champ	Description
chaîne `apiVersion`	`prediction.aiplatform.gdc.goog/v1`
chaîne `kind`	`ResourcePoolList`
`metadata` ListMeta	Reportez-vous à la documentation de l'API Kubernetes pour connaître les champs de `metadata`.
`items` Tableau ResourcePool

ResourcePoolSpec

Définit l'état attendu des ressources ResourcePool.

Apparaît dans :

ResourcePool

Champ	Description
chaîne `resourcePoolID`	Représente l'ID généré par le système pour la ressource `ResourcePool`. Ce champ ne s'applique qu'à Google Cloud et GDCE. La prochaine balise est `8`.
chaîne `userProvidedID`	Représente l'ID fourni par l'utilisateur pour la ressource `ResourcePool`. Ce champ ne s'applique qu'à Google Cloud et GDCE.
`dedicatedResources` DedicatedResources	Contient une description des ressources dédiées au pool de ressources.
`enableContainerLogging` booléen	Indique si la journalisation des conteneurs est activée pour `ResourcePool`.
chaîne `userGsa`	Indique le compte de service IAM fourni par l'utilisateur dans le projet utilisateur. Si aucun n'est spécifié, le compte de service de diffusion par défaut est utilisé.
chaîne `customKsaName`	Spécifie le nom personnalisé que l'opérateur crée et que la charge de travail de l'utilisateur utilise uniquement pour les cas d'utilisation de votre propre compte de service (BYOSA). Si ce champ est vide, le système utilise le modèle de dénomination par défaut.
`rolloutStrategy` type non valide	Indique si les modèles déployés dans ce pool doivent être déployés progressivement ou tous en même temps sur les répliques du serveur de modèles.

ResourcePoolStatus

Définit l'état observé des ressources ResourcePool.

Apparaît dans :

ResourcePool

Champ	Description
`ready` booléen	Indique si la ressource est prête.
`primaryCondition`	Représente la condition principale d'une ressource. Si la ressource est prête, la condition l'indique. Sinon, la condition est la principale raison pour laquelle la ressource n'est pas prête.
`resourceConditions`	Représente un ensemble de conditions pour une ressource et ses sous-ressources. Vous pouvez l'utiliser pour déterminer l'état général d'une ressource et de ses sous-ressources.
Tableau Condition `conditions`	Représente les conditions de ressources brutes issues des ressources Kubernetes à des fins de débogage.
Tableau ReplicaStatus `replicaStatuses`
`rpcStatus` RpcStatus	Indique une représentation RPC canonique de la condition principale de ResourcePool.
Entier `observedGeneration`	Indique la révision de la ressource qui a été rapprochée le plus récemment.

Routes

Apparaît dans :

DeployedModelStatus

Champ	Description
chaîne `predictRoute`	Représente le chemin de routage sur le conteneur pour envoyer des requêtes de prédiction. Vertex AI transfère les requêtes à l'aide de `projects.locations.endpoints.predict` vers ce chemin sur l'adresse IP et le port du conteneur. Vertex AI renvoie ensuite la réponse du conteneur dans la réponse de l'API.
chaîne `predictSystemRoute`	Représente le chemin de routage système permettant d'envoyer des requêtes de prédiction à l'entrée du cluster. Ce champ n'est renseigné en interne que lorsqu'il est copié dans `deployedModel` lors du déploiement.
chaîne `healthRoute`	Représente le chemin de routage sur le conteneur pour envoyer des vérifications de l'état. Vertex AI envoie parfois des requêtes GET à ce chemin sur l'adresse IP et le port du conteneur pour vérifier que celui-ci est opérationnel.
chaîne `healthSystemRoute`	Représente le chemin de routage système permettant d'envoyer des requêtes de vérification de l'état'état à l'entrée du cluster. Ce champ n'est renseigné en interne que lorsqu'il est copié dans `deployedModel` lors du déploiement.

RpcStatus

Encapsule un code RPC et un message.

Apparaît dans :

DeployedModelStatus

Champ	Description
`code` Code	Représente le code RPC. La prochaine balise est `4`.
chaîne `message`	Contient une description de la condition visible par l'utilisateur.
`terminalState` booléen	Indique une valeur de `true` si la ressource a atteint un état final et ne peut pas devenir prête.