API de KRM prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

El paquete v1 contiene definiciones de esquemas de API para el grupo de APIs de v1 de prediction.aiplatform.gdc.goog.

Ajuste de escala automático

Define los parámetros de ajuste de escala automático para una implementación.

Aparece en:

Campo Descripción
minReplica número entero Es la cantidad mínima de réplicas. El valor predeterminado es 1. La siguiente etiqueta es 5.
maxReplica número entero Cantidad máxima de réplicas.
cpuTarget número entero Es el umbral de uso de la CPU para escalar verticalmente un pod.
gpuDutyCycleTarget número entero Es el umbral de utilización del ciclo de trabajo de la GPU para escalar verticalmente un pod.

DedicatedResources

Define los recursos que se dedican a un grupo de recursos. El siguiente ID es 8.

Aparece en:

Campo Descripción
machineSpec No requerido. Especifica la configuración de una sola máquina con el valor machineType. Si no se proporciona, se usa un valor predeterminado. En el caso de la predicción, el tipo de máquina predeterminado para una implementación es n1-standard-2 (modelos basados en GKE) o n2-standard-2-gdc (modelos basados en CPU).
autoscaling Ajuste de escala automático Especifica los parámetros de ajuste de escala automático para las cargas de trabajo del usuario, por ejemplo, la implementación del predictor para la predicción.

DeployedModel

Define el esquema de la API de DeployedModels.

Aparece en:

Campo Descripción
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string DeployedModel
metadata ObjectMeta Consulta la documentación de la API de Kubernetes para conocer los campos de metadata.
spec DeployedModelSpec
status DeployedModelStatus

DeployedModelList

Contiene una lista de recursos DeployedModel.

Campo Descripción
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string DeployedModelList
metadata ListMeta Consulta la documentación de la API de Kubernetes para conocer los campos de metadata.
items DeployedModel

DeployedModelSpec

Define el estado esperado de los recursos DeployedModel.

Aparece en:

Campo Descripción
endpointPath string Especifica el nombre del recurso del extremo. El formato es projects/{project}/locations/{location}/endpoints/{endpoint-id}. La siguiente etiqueta es 6.
modelSpec tipo no válido Define la especificación del modelo necesaria cuando se implementa el modelo.
resourcePoolRef ObjectReference Especifica la referencia del grupo de recursos con las especificaciones de recursos requeridas para este DeployedModel.
sharesResourcePool booleano Especifica si el DeployedModel comparte un grupo de recursos con otros modelos.

DeployedModelStatus

Define el estado observado del recurso DeployedModel.

Aparece en:

Campo Descripción
ready booleano Indica si el recurso está en un estado listo.
primaryCondition Representa la condición principal de un recurso. Si el recurso está listo, la condición indica que lo está. De lo contrario, la condición es el motivo principal por el que el recurso no está listo.
resourceConditions array Representa una colección de condiciones para un recurso y sus subrecursos. Puedes usarlo para determinar el estado general de un recurso y sus subrecursos.
conditions arreglo de condiciones Representa las condiciones de recursos sin procesar propagadas desde los recursos de Kubernetes para fines de depuración.
routes Rutas Representa las rutas del contenedor o del sistema para la predicción del modelo implementado o la verificación de estado.
ports Puertos Representa los puertos HTTP o gRPC del contenedor.
rpcStatus RpcStatus Indica una representación canónica de RPC de la condición principal del modelo implementado.
observedGeneration número entero Indica la revisión del recurso que se concilió más recientemente.

Puertos

Aparece en:

Campo Descripción
predictorPorts arreglo de números enteros Enumera los puertos HTTP que se expondrán desde el predictor. Las solicitudes no se reenvían a puertos que no sean el primero de la lista. Este campo corresponde al campo ports de la API principal v1 de los contenedores de Kubernetes.
predictorGRPCPorts arreglo de números enteros Enumera los puertos de gRPC que se expondrán desde el predictor. Si se omite este campo, se inhabilitan las solicitudes de gRPC al contenedor. Las solicitudes no se reenvían a puertos que no sean el primero de la lista. Este campo corresponde al campo ports de la API principal v1 de los contenedores de Kubernetes.

ReplicaStatus

Define la información de la réplica del recurso ResourcePool.

Aparece en:

Campo Descripción
resourceType ResourceType Especifica el tipo de recurso.
resourceName string Indica el nombre único del recurso en el espacio de nombres del tipo de recurso. Por ejemplo, un Deployment ResourceType tiene el nombre de la implementación de Kubernetes como nombre de recurso.
resourceNamespace string Indica el espacio de nombres del recurso. Este campo no se aplica a los recursos con permisos para clústeres.
appType string Indica el tipo de aplicación del recurso, definido por un producto específico. Por ejemplo, la predicción admite predictor y explainer como appType.
availableReplicas número entero Indica la cantidad total de réplicas disponibles. En el caso del tipo de recurso de implementación de Kubernetes, este campo representa la cantidad total de Pods disponibles, listos durante al menos una cantidad mínima de segundos de preparación, a los que se segmenta esta implementación.
unavailableReplicas número entero Indica la cantidad total de réplicas no disponibles. Para el tipo de recurso de implementación de Kubernetes, representa la cantidad total de Pods no disponibles a los que se dirige la implementación.

Grupo de recursos

Define el esquema de la API de ResourcePools.

Aparece en:

Campo Descripción
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string ResourcePool
metadata ObjectMeta Consulta la documentación de la API de Kubernetes para conocer los campos de metadata.
spec ResourcePoolSpec
status ResourcePoolStatus

ResourcePoolList

Contiene una lista de recursos ResourcePool.

Campo Descripción
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string ResourcePoolList
metadata ListMeta Consulta la documentación de la API de Kubernetes para conocer los campos de metadata.
items arreglo de ResourcePool

ResourcePoolSpec

Define el estado esperado de los recursos ResourcePool.

Aparece en:

Campo Descripción
resourcePoolID string Representa el ID generado por el sistema del recurso ResourcePool. Este campo solo se aplica a Google Cloud y GDCE. La siguiente etiqueta es 8.
userProvidedID string Representa el ID proporcionado por el usuario del recurso ResourcePool. Este campo solo se aplica a Google Cloud y GDCE.
dedicatedResources DedicatedResources Contiene una descripción de los recursos dedicados al grupo de recursos.
enableContainerLogging booleano Indica si el registro de contenedores está habilitado para ResourcePool.
userGsa string Indica la cuenta de servicio de IAM proporcionada por el usuario en el proyecto del usuario. Si no se especifica, se usa la cuenta de servicio de entrega predeterminada.
customKsaName string Especifica el nombre personalizado que crea el operador y que la carga de trabajo del usuario utiliza solo para los casos de Bring Your Own Service Account (BYOSA). Si está vacío, el sistema usa el patrón de nombres predeterminado.
rolloutStrategy tipo no válido Especifica si los modelos implementados en este grupo deben lanzarse en las réplicas del servidor de modelos de forma gradual o de una sola vez.

ResourcePoolStatus

Define el estado observado de los recursos de ResourcePool.

Aparece en:

Campo Descripción
ready booleano Indica si el recurso está en un estado listo.
primaryCondition Representa la condición principal de un recurso. Si el recurso está listo, la condición indica que lo está. De lo contrario, la condición es el motivo principal por el que el recurso no está listo.
resourceConditions Representa una colección de condiciones para un recurso y sus subrecursos. Puedes usarlo para determinar el estado general de un recurso y sus subrecursos.
conditions arreglo de condiciones Representa las condiciones de recursos sin procesar propagadas desde los recursos de Kubernetes para fines de depuración.
replicaStatuses ReplicaStatus array
rpcStatus RpcStatus Indica una representación canónica de RPC de la condición principal de ResourcePool.
observedGeneration número entero Indica qué revisión del recurso se concilió más recientemente.

Rutas

Aparece en:

Campo Descripción
predictRoute string Representa la ruta de enrutamiento en el contenedor para enviar solicitudes de predicción. Vertex AI reenvía solicitudes con projects.locations.endpoints.predict a esta ruta de acceso en el puerto y la dirección IP del contenedor. Luego, Vertex AI devuelve la respuesta del contenedor en la respuesta de la API.
predictSystemRoute string Representa la ruta de enrutamiento del sistema para enviar solicitudes de predicción a la entrada del clúster. Este campo solo se propaga de forma interna cuando se copia en deployedModel durante la implementación.
healthRoute string Representa la ruta de enrutamiento en el contenedor para enviar verificaciones de estado. Vertex AI envía solicitudes GET de forma intermitente a esta ruta de acceso en la dirección IP y el puerto del contenedor para verificar que esté en buen estado.
healthSystemRoute string Representa la ruta de enrutamiento del sistema para enviar solicitudes de verificación de estado a la entrada del clúster. Este campo solo se propaga de forma interna cuando se copia en deployedModel durante la implementación.

RpcStatus

Encapsula un código y un mensaje de RPC.

Aparece en:

Campo Descripción
code Código Representa el código de RPC. La siguiente etiqueta es 4.
message string Contiene una descripción de la condición que se muestra al usuario.
terminalState booleano Indica un valor de true si el recurso alcanzó un estado final y no puede estar listo.