prediction.aiplatform.gdc.goog/v1
El paquete v1 contiene definiciones de esquemas de API para el grupo de APIs prediction.aiplatform.gdc.goog v1.
Autoescalado
Define los parámetros de autoescalado de un despliegue.
Aparece en:
Campo | Descripción |
---|---|
minReplica entero |
Número mínimo de réplicas. El valor predeterminado es 1 . La siguiente etiqueta es 5 . |
maxReplica entero |
Número máximo de réplicas. |
cpuTarget entero |
Umbral de uso de CPU para aumentar la escala de un pod. |
gpuDutyCycleTarget entero |
Umbral de uso del ciclo de actividad de la GPU para aumentar la escala de un pod. |
DedicatedResources
Define los recursos que se dedican a un grupo de recursos. El siguiente ID es 8
.
Aparece en:
Campo | Descripción |
---|---|
machineSpec |
No es obligatorio. Especifica la configuración de una sola máquina mediante el valor machineType . Si no se proporciona, se usa un valor predeterminado. En el caso de Prediction, el tipo de máquina predeterminado de un despliegue es n1-standard-2 (modelos basados en GKE) o n2-standard-2-gdc (modelos basados en CPU). |
autoscaling Autoescalado |
Especifica los parámetros de autoescalado de las cargas de trabajo de los usuarios, como el despliegue del predictor para la predicción. |
DeployedModel
Define el esquema de la API DeployedModels
.
Aparece en:
Campo | Descripción |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
DeployedModel |
metadata ObjectMeta |
Consulta la documentación de la API de Kubernetes para ver los campos de metadata . |
spec DeployedModelSpec |
|
status DeployedModelStatus |
DeployedModelList
Contiene una lista de recursos de DeployedModel
.
Campo | Descripción |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
DeployedModelList |
metadata ListMeta |
Consulta la documentación de la API de Kubernetes para ver los campos de metadata . |
items Matriz DeployedModel |
DeployedModelSpec
Define el estado esperado de los recursos DeployedModel
.
Aparece en:
Campo | Descripción |
---|---|
endpointPath string |
Especifica el nombre de recurso del endpoint. El formato es projects/{project}/locations/{location}/endpoints/{endpoint-id} . La siguiente etiqueta es 6 . |
modelSpec tipo no válido |
Define la especificación del modelo necesaria al desplegarlo. |
resourcePoolRef ObjectReference |
Especifica la referencia del grupo de recursos con las especificaciones de recursos necesarias para este DeployedModel . |
sharesResourcePool booleano |
Especifica si el DeployedModel comparte un grupo de recursos con otros modelos. |
DeployedModelStatus
Define el estado observado del recurso DeployedModel
.
Aparece en:
Campo | Descripción |
---|---|
ready booleano |
Indica si el recurso está en estado listo. |
primaryCondition |
Representa la condición principal de un recurso. Si el recurso está listo, la condición indica que el recurso está listo. De lo contrario, la condición es el motivo principal por el que el recurso no está listo. |
resourceConditions array |
Representa una colección de condiciones de un recurso y sus subrecursos. Puedes usarlo para determinar el estado general de un recurso y sus subrecursos. |
conditions Array de condiciones |
Representa las condiciones de recursos sin procesar rellenadas a partir de recursos de Kubernetes con fines de depuración. |
routes Rutas |
Representa las rutas de contenedor o de sistema de la predicción o la comprobación del estado del modelo implementado. |
ports Puertos |
Representa los puertos HTTP o gRPC del contenedor. |
rpcStatus RpcStatus |
Indica una representación canónica de RPC de la condición principal del modelo implementado. |
observedGeneration entero |
Indica la revisión del recurso que se ha conciliado más recientemente. |
Puertos
Aparece en:
Campo | Descripción |
---|---|
predictorPorts array de números enteros |
Lista los puertos HTTP que se van a exponer del predictor. Las solicitudes no se reenvían a puertos que no sean el primero de la lista. Este campo corresponde al campo ports de la API principal v1 de los contenedores de Kubernetes. |
predictorGRPCPorts array de números enteros |
Lista de los puertos gRPC que se van a exponer del predictor. Si se omite este campo, se inhabilitarán las solicitudes de gRPC al contenedor. Las solicitudes no se reenvían a puertos que no sean el primero de la lista. Este campo corresponde al campo ports de la API principal v1 de los contenedores de Kubernetes. |
ReplicaStatus
Define la información de la réplica del recurso ResourcePool
.
Aparece en:
Campo | Descripción |
---|---|
resourceType ResourceType |
Especifica el tipo de recurso. |
resourceName string |
Indica el nombre de recurso único en el espacio de nombres del tipo de recurso. Por ejemplo, un Deployment ResourceType tiene el nombre de despliegue de Kubernetes como nombre de recurso. |
resourceNamespace string |
Indica el espacio de nombres del recurso. Este campo no se aplica a los recursos con ámbito de clúster. |
appType string |
Indica el tipo de aplicación del recurso, definido por un producto específico. Por ejemplo, Predicción admite predictor y explainer como appType . |
availableReplicas entero |
Indica el número total de réplicas disponibles. En el caso del tipo de recurso de implementación de Kubernetes, este campo representa el número total de pods disponibles, listos durante al menos un mínimo de segundos, a los que se dirige esta implementación. |
unavailableReplicas entero |
Indica el número total de réplicas no disponibles. En el caso del tipo de recurso de implementación de Kubernetes, representa el número total de pods no disponibles a los que se dirige la implementación. |
ResourcePool
Define el esquema de la API ResourcePools
.
Aparece en:
Campo | Descripción |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
ResourcePool |
metadata ObjectMeta |
Consulta la documentación de la API de Kubernetes para ver los campos de metadata . |
spec ResourcePoolSpec |
|
status ResourcePoolStatus |
ResourcePoolList
Contiene una lista de recursos de ResourcePool
.
Campo | Descripción |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
ResourcePoolList |
metadata ListMeta |
Consulta la documentación de la API de Kubernetes para ver los campos de metadata . |
items Matriz ResourcePool |
ResourcePoolSpec
Define el estado esperado de los recursos ResourcePool
.
Aparece en:
Campo | Descripción |
---|---|
resourcePoolID string |
Representa el ID generado por el sistema del recurso ResourcePool . Este campo solo se aplica a Google Cloud y GDCE. La siguiente etiqueta es 8 . |
userProvidedID string |
Representa el ID proporcionado por el usuario del recurso ResourcePool . Este campo solo se aplica a Google Cloud y GDCE. |
dedicatedResources DedicatedResources |
Contiene una descripción de los recursos dedicados al grupo de recursos. |
enableContainerLogging booleano |
Indica si el registro de contenedores está habilitado para ResourcePool . |
userGsa string |
Indica la cuenta de servicio de IAM proporcionada por el usuario en el proyecto del usuario. Si no se especifica, se usa la cuenta de servicio de publicación predeterminada. |
customKsaName string |
Especifica el nombre personalizado que crea el operador y que usa la carga de trabajo del usuario solo en los casos de Bring Your Own Service Account (BYOSA). Si está vacío, el sistema utiliza el patrón de nomenclatura predeterminado. |
rolloutStrategy tipo no válido |
Especifica si los modelos implementados en este grupo deben implementarse en las réplicas del servidor de modelos de forma gradual o de una vez. |
ResourcePoolStatus
Define el estado observado de los recursos ResourcePool
.
Aparece en:
Campo | Descripción |
---|---|
ready booleano |
Indica si el recurso está en estado listo. |
primaryCondition |
Representa la condición principal de un recurso. Si el recurso está listo, la condición indica que el recurso está listo. De lo contrario, la condición es el motivo principal por el que el recurso no está listo. |
resourceConditions |
Representa una colección de condiciones de un recurso y sus subrecursos. Puedes usarlo para determinar el estado general de un recurso y sus subrecursos. |
conditions Array de condiciones |
Representa las condiciones de recursos sin procesar rellenadas a partir de recursos de Kubernetes con fines de depuración. |
replicaStatuses Matriz ReplicaStatus |
|
rpcStatus RpcStatus |
Indica una representación canónica de RPC de la condición principal de ResourcePool. |
observedGeneration entero |
Indica qué revisión del recurso se ha conciliado más recientemente. |
Rutas
Aparece en:
Campo | Descripción |
---|---|
predictRoute string |
Representa la ruta de enrutamiento del contenedor para enviar solicitudes de predicción. Vertex AI reenvía las solicitudes mediante projects.locations.endpoints.predict a esta ruta en la dirección IP y el puerto del contenedor. A continuación, Vertex AI devuelve la respuesta del contenedor en la respuesta de la API. |
predictSystemRoute string |
Representa la ruta de enrutamiento del sistema para enviar solicitudes de predicción al clúster de entrada. Este campo solo se rellena internamente cuando se copia en deployedModel durante la implementación. |
healthRoute string |
Representa la ruta de enrutamiento del contenedor para enviar comprobaciones del estado. Vertex AI envía de forma intermitente solicitudes GET a esta ruta en la dirección IP y el puerto del contenedor para comprobar que el contenedor está en buen estado. |
healthSystemRoute string |
Representa la ruta de enrutamiento del sistema para enviar solicitudes de comprobación del estado al ingress del clúster. Este campo solo se rellena internamente cuando se copia en deployedModel durante la implementación. |
RpcStatus
Encapsula un código de RPC y un mensaje.
Aparece en:
Campo | Descripción |
---|---|
code Código |
Representa el código RPC. La siguiente etiqueta es 4 . |
message string |
Contiene una descripción de la condición orientada al usuario. |
terminalState booleano |
Indica un valor de true si el recurso ha alcanzado un estado terminal y no puede estar listo. |