API KRM prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

El paquete v1 contiene definiciones de esquemas de API para el grupo de APIs prediction.aiplatform.gdc.goog v1.

Autoescalado

Define los parámetros de autoescalado de un despliegue.

Aparece en:

Campo Descripción
minReplica entero Número mínimo de réplicas. El valor predeterminado es 1. La siguiente etiqueta es 5.
maxReplica entero Número máximo de réplicas.
cpuTarget entero Umbral de uso de CPU para aumentar la escala de un pod.
gpuDutyCycleTarget entero Umbral de uso del ciclo de actividad de la GPU para aumentar la escala de un pod.

DedicatedResources

Define los recursos que se dedican a un grupo de recursos. El siguiente ID es 8.

Aparece en:

Campo Descripción
machineSpec No es obligatorio. Especifica la configuración de una sola máquina mediante el valor machineType. Si no se proporciona, se usa un valor predeterminado. En el caso de Prediction, el tipo de máquina predeterminado de un despliegue es n1-standard-2 (modelos basados en GKE) o n2-standard-2-gdc (modelos basados en CPU).
autoscaling Autoescalado Especifica los parámetros de autoescalado de las cargas de trabajo de los usuarios, como el despliegue del predictor para la predicción.

DeployedModel

Define el esquema de la API DeployedModels.

Aparece en:

Campo Descripción
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string DeployedModel
metadata ObjectMeta Consulta la documentación de la API de Kubernetes para ver los campos de metadata.
spec DeployedModelSpec
status DeployedModelStatus

DeployedModelList

Contiene una lista de recursos de DeployedModel.

Campo Descripción
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string DeployedModelList
metadata ListMeta Consulta la documentación de la API de Kubernetes para ver los campos de metadata.
items Matriz DeployedModel

DeployedModelSpec

Define el estado esperado de los recursos DeployedModel.

Aparece en:

Campo Descripción
endpointPath string Especifica el nombre de recurso del endpoint. El formato es projects/{project}/locations/{location}/endpoints/{endpoint-id}. La siguiente etiqueta es 6.
modelSpec tipo no válido Define la especificación del modelo necesaria al desplegarlo.
resourcePoolRef ObjectReference Especifica la referencia del grupo de recursos con las especificaciones de recursos necesarias para este DeployedModel.
sharesResourcePool booleano Especifica si el DeployedModel comparte un grupo de recursos con otros modelos.

DeployedModelStatus

Define el estado observado del recurso DeployedModel.

Aparece en:

Campo Descripción
ready booleano Indica si el recurso está en estado listo.
primaryCondition Representa la condición principal de un recurso. Si el recurso está listo, la condición indica que el recurso está listo. De lo contrario, la condición es el motivo principal por el que el recurso no está listo.
resourceConditions array Representa una colección de condiciones de un recurso y sus subrecursos. Puedes usarlo para determinar el estado general de un recurso y sus subrecursos.
conditions Array de condiciones Representa las condiciones de recursos sin procesar rellenadas a partir de recursos de Kubernetes con fines de depuración.
routes Rutas Representa las rutas de contenedor o de sistema de la predicción o la comprobación del estado del modelo implementado.
ports Puertos Representa los puertos HTTP o gRPC del contenedor.
rpcStatus RpcStatus Indica una representación canónica de RPC de la condición principal del modelo implementado.
observedGeneration entero Indica la revisión del recurso que se ha conciliado más recientemente.

Puertos

Aparece en:

Campo Descripción
predictorPorts array de números enteros Lista los puertos HTTP que se van a exponer del predictor. Las solicitudes no se reenvían a puertos que no sean el primero de la lista. Este campo corresponde al campo ports de la API principal v1 de los contenedores de Kubernetes.
predictorGRPCPorts array de números enteros Lista de los puertos gRPC que se van a exponer del predictor. Si se omite este campo, se inhabilitarán las solicitudes de gRPC al contenedor. Las solicitudes no se reenvían a puertos que no sean el primero de la lista. Este campo corresponde al campo ports de la API principal v1 de los contenedores de Kubernetes.

ReplicaStatus

Define la información de la réplica del recurso ResourcePool.

Aparece en:

Campo Descripción
resourceType ResourceType Especifica el tipo de recurso.
resourceName string Indica el nombre de recurso único en el espacio de nombres del tipo de recurso. Por ejemplo, un Deployment ResourceType tiene el nombre de despliegue de Kubernetes como nombre de recurso.
resourceNamespace string Indica el espacio de nombres del recurso. Este campo no se aplica a los recursos con ámbito de clúster.
appType string Indica el tipo de aplicación del recurso, definido por un producto específico. Por ejemplo, Predicción admite predictor y explainer como appType.
availableReplicas entero Indica el número total de réplicas disponibles. En el caso del tipo de recurso de implementación de Kubernetes, este campo representa el número total de pods disponibles, listos durante al menos un mínimo de segundos, a los que se dirige esta implementación.
unavailableReplicas entero Indica el número total de réplicas no disponibles. En el caso del tipo de recurso de implementación de Kubernetes, representa el número total de pods no disponibles a los que se dirige la implementación.

ResourcePool

Define el esquema de la API ResourcePools.

Aparece en:

Campo Descripción
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string ResourcePool
metadata ObjectMeta Consulta la documentación de la API de Kubernetes para ver los campos de metadata.
spec ResourcePoolSpec
status ResourcePoolStatus

ResourcePoolList

Contiene una lista de recursos de ResourcePool.

Campo Descripción
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string ResourcePoolList
metadata ListMeta Consulta la documentación de la API de Kubernetes para ver los campos de metadata.
items Matriz ResourcePool

ResourcePoolSpec

Define el estado esperado de los recursos ResourcePool.

Aparece en:

Campo Descripción
resourcePoolID string Representa el ID generado por el sistema del recurso ResourcePool. Este campo solo se aplica a Google Cloud y GDCE. La siguiente etiqueta es 8.
userProvidedID string Representa el ID proporcionado por el usuario del recurso ResourcePool. Este campo solo se aplica a Google Cloud y GDCE.
dedicatedResources DedicatedResources Contiene una descripción de los recursos dedicados al grupo de recursos.
enableContainerLogging booleano Indica si el registro de contenedores está habilitado para ResourcePool.
userGsa string Indica la cuenta de servicio de IAM proporcionada por el usuario en el proyecto del usuario. Si no se especifica, se usa la cuenta de servicio de publicación predeterminada.
customKsaName string Especifica el nombre personalizado que crea el operador y que usa la carga de trabajo del usuario solo en los casos de Bring Your Own Service Account (BYOSA). Si está vacío, el sistema utiliza el patrón de nomenclatura predeterminado.
rolloutStrategy tipo no válido Especifica si los modelos implementados en este grupo deben implementarse en las réplicas del servidor de modelos de forma gradual o de una vez.

ResourcePoolStatus

Define el estado observado de los recursos ResourcePool.

Aparece en:

Campo Descripción
ready booleano Indica si el recurso está en estado listo.
primaryCondition Representa la condición principal de un recurso. Si el recurso está listo, la condición indica que el recurso está listo. De lo contrario, la condición es el motivo principal por el que el recurso no está listo.
resourceConditions Representa una colección de condiciones de un recurso y sus subrecursos. Puedes usarlo para determinar el estado general de un recurso y sus subrecursos.
conditions Array de condiciones Representa las condiciones de recursos sin procesar rellenadas a partir de recursos de Kubernetes con fines de depuración.
replicaStatuses Matriz ReplicaStatus
rpcStatus RpcStatus Indica una representación canónica de RPC de la condición principal de ResourcePool.
observedGeneration entero Indica qué revisión del recurso se ha conciliado más recientemente.

Rutas

Aparece en:

Campo Descripción
predictRoute string Representa la ruta de enrutamiento del contenedor para enviar solicitudes de predicción. Vertex AI reenvía las solicitudes mediante projects.locations.endpoints.predict a esta ruta en la dirección IP y el puerto del contenedor. A continuación, Vertex AI devuelve la respuesta del contenedor en la respuesta de la API.
predictSystemRoute string Representa la ruta de enrutamiento del sistema para enviar solicitudes de predicción al clúster de entrada. Este campo solo se rellena internamente cuando se copia en deployedModel durante la implementación.
healthRoute string Representa la ruta de enrutamiento del contenedor para enviar comprobaciones del estado. Vertex AI envía de forma intermitente solicitudes GET a esta ruta en la dirección IP y el puerto del contenedor para comprobar que el contenedor está en buen estado.
healthSystemRoute string Representa la ruta de enrutamiento del sistema para enviar solicitudes de comprobación del estado al ingress del clúster. Este campo solo se rellena internamente cuando se copia en deployedModel durante la implementación.

RpcStatus

Encapsula un código de RPC y un mensaje.

Aparece en:

Campo Descripción
code Código Representa el código RPC. La siguiente etiqueta es 4.
message string Contiene una descripción de la condición orientada al usuario.
terminalState booleano Indica un valor de true si el recurso ha alcanzado un estado terminal y no puede estar listo.