Esta página se ha traducido con Cloud Translation API.

API KRM prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

El paquete v1 contiene definiciones de esquemas de API para el grupo de APIs prediction.aiplatform.gdc.goog v1.

Autoescalado

Define los parámetros de autoescalado de un despliegue.

Aparece en:

DedicatedResources

Campo	Descripción
`minReplica` entero	Número mínimo de réplicas. El valor predeterminado es `1`. La siguiente etiqueta es `5`.
`maxReplica` entero	Número máximo de réplicas.
`cpuTarget` entero	Umbral de uso de CPU para aumentar la escala de un pod.
`gpuDutyCycleTarget` entero	Umbral de uso del ciclo de actividad de la GPU para aumentar la escala de un pod.

DedicatedResources

Define los recursos que se dedican a un grupo de recursos. El siguiente ID es 8.

Aparece en:

ResourcePoolSpec

Campo	Descripción
`machineSpec`	No es obligatorio. Especifica la configuración de una sola máquina mediante el valor `machineType`. Si no se proporciona, se usa un valor predeterminado. En el caso de Prediction, el tipo de máquina predeterminado de un despliegue es `n1-standard-2` (modelos basados en GKE) o `n2-standard-2-gdc` (modelos basados en CPU).
`autoscaling` Autoescalado	Especifica los parámetros de autoescalado de las cargas de trabajo de los usuarios, como el despliegue del predictor para la predicción.

DeployedModel

Define el esquema de la API DeployedModels.

Aparece en:

DeployedModelList

Campo	Descripción
`apiVersion` string	`prediction.aiplatform.gdc.goog/v1`
`kind` string	`DeployedModel`
`metadata` ObjectMeta	Consulta la documentación de la API de Kubernetes para ver los campos de `metadata`.
`spec` DeployedModelSpec
`status` DeployedModelStatus

DeployedModelList

Contiene una lista de recursos de DeployedModel.

Campo	Descripción
`apiVersion` string	`prediction.aiplatform.gdc.goog/v1`
`kind` string	`DeployedModelList`
`metadata` ListMeta	Consulta la documentación de la API de Kubernetes para ver los campos de `metadata`.
`items` Matriz DeployedModel

DeployedModelSpec

Define el estado esperado de los recursos DeployedModel.

Aparece en:

DeployedModel

Campo	Descripción
`endpointPath` string	Especifica el nombre de recurso del endpoint. El formato es `projects/{project}/locations/{location}/endpoints/{endpoint-id}`. La siguiente etiqueta es `6`.
`modelSpec` tipo no válido	Define la especificación del modelo necesaria al desplegarlo.
`resourcePoolRef` ObjectReference	Especifica la referencia del grupo de recursos con las especificaciones de recursos necesarias para este `DeployedModel`.
`sharesResourcePool` booleano	Especifica si el `DeployedModel` comparte un grupo de recursos con otros modelos.

DeployedModelStatus

Define el estado observado del recurso DeployedModel.

Aparece en:

DeployedModel

Campo	Descripción
`ready` booleano	Indica si el recurso está en estado listo.
`primaryCondition`	Representa la condición principal de un recurso. Si el recurso está listo, la condición indica que el recurso está listo. De lo contrario, la condición es el motivo principal por el que el recurso no está listo.
`resourceConditions` array	Representa una colección de condiciones de un recurso y sus subrecursos. Puedes usarlo para determinar el estado general de un recurso y sus subrecursos.
`conditions` Array de condiciones	Representa las condiciones de recursos sin procesar rellenadas a partir de recursos de Kubernetes con fines de depuración.
`routes` Rutas	Representa las rutas de contenedor o de sistema de la predicción o la comprobación del estado del modelo implementado.
`ports` Puertos	Representa los puertos HTTP o gRPC del contenedor.
`rpcStatus` RpcStatus	Indica una representación canónica de RPC de la condición principal del modelo implementado.
`observedGeneration` entero	Indica la revisión del recurso que se ha conciliado más recientemente.

Puertos

Aparece en:

DeployedModelStatus

Campo	Descripción
`predictorPorts` array de números enteros	Lista los puertos HTTP que se van a exponer del predictor. Las solicitudes no se reenvían a puertos que no sean el primero de la lista. Este campo corresponde al campo `ports` de la API principal v1 de los contenedores de Kubernetes.
`predictorGRPCPorts` array de números enteros	Lista de los puertos gRPC que se van a exponer del predictor. Si se omite este campo, se inhabilitarán las solicitudes de gRPC al contenedor. Las solicitudes no se reenvían a puertos que no sean el primero de la lista. Este campo corresponde al campo `ports` de la API principal v1 de los contenedores de Kubernetes.

ReplicaStatus

Define la información de la réplica del recurso ResourcePool.

Aparece en:

ResourcePoolStatus

Campo	Descripción
`resourceType` ResourceType	Especifica el tipo de recurso.
`resourceName` string	Indica el nombre de recurso único en el espacio de nombres del tipo de recurso. Por ejemplo, un `Deployment` `ResourceType` tiene el nombre de despliegue de Kubernetes como nombre de recurso.
`resourceNamespace` string	Indica el espacio de nombres del recurso. Este campo no se aplica a los recursos con ámbito de clúster.
`appType` string	Indica el tipo de aplicación del recurso, definido por un producto específico. Por ejemplo, Predicción admite `predictor` y `explainer` como `appType`.
`availableReplicas` entero	Indica el número total de réplicas disponibles. En el caso del tipo de recurso de implementación de Kubernetes, este campo representa el número total de pods disponibles, listos durante al menos un mínimo de segundos, a los que se dirige esta implementación.
`unavailableReplicas` entero	Indica el número total de réplicas no disponibles. En el caso del tipo de recurso de implementación de Kubernetes, representa el número total de pods no disponibles a los que se dirige la implementación.

ResourcePool

Define el esquema de la API ResourcePools.

Aparece en:

ResourcePoolList

Campo	Descripción
`apiVersion` string	`prediction.aiplatform.gdc.goog/v1`
`kind` string	`ResourcePool`
`metadata` ObjectMeta	Consulta la documentación de la API de Kubernetes para ver los campos de `metadata`.
`spec` ResourcePoolSpec
`status` ResourcePoolStatus

ResourcePoolList

Contiene una lista de recursos de ResourcePool.

Campo	Descripción
`apiVersion` string	`prediction.aiplatform.gdc.goog/v1`
`kind` string	`ResourcePoolList`
`metadata` ListMeta	Consulta la documentación de la API de Kubernetes para ver los campos de `metadata`.
`items` Matriz ResourcePool

ResourcePoolSpec

Define el estado esperado de los recursos ResourcePool.

Aparece en:

ResourcePool

Campo	Descripción
`resourcePoolID` string	Representa el ID generado por el sistema del recurso `ResourcePool`. Este campo solo se aplica a Google Cloud y GDCE. La siguiente etiqueta es `8`.
`userProvidedID` string	Representa el ID proporcionado por el usuario del recurso `ResourcePool`. Este campo solo se aplica a Google Cloud y GDCE.
`dedicatedResources` DedicatedResources	Contiene una descripción de los recursos dedicados al grupo de recursos.
`enableContainerLogging` booleano	Indica si el registro de contenedores está habilitado para `ResourcePool`.
`userGsa` string	Indica la cuenta de servicio de IAM proporcionada por el usuario en el proyecto del usuario. Si no se especifica, se usa la cuenta de servicio de publicación predeterminada.
`customKsaName` string	Especifica el nombre personalizado que crea el operador y que usa la carga de trabajo del usuario solo en los casos de Bring Your Own Service Account (BYOSA). Si está vacío, el sistema utiliza el patrón de nomenclatura predeterminado.
`rolloutStrategy` tipo no válido	Especifica si los modelos implementados en este grupo deben implementarse en las réplicas del servidor de modelos de forma gradual o de una vez.

ResourcePoolStatus

Define el estado observado de los recursos ResourcePool.

Aparece en:

ResourcePool

Campo	Descripción
`ready` booleano	Indica si el recurso está en estado listo.
`primaryCondition`	Representa la condición principal de un recurso. Si el recurso está listo, la condición indica que el recurso está listo. De lo contrario, la condición es el motivo principal por el que el recurso no está listo.
`resourceConditions`	Representa una colección de condiciones de un recurso y sus subrecursos. Puedes usarlo para determinar el estado general de un recurso y sus subrecursos.
`conditions` Array de condiciones	Representa las condiciones de recursos sin procesar rellenadas a partir de recursos de Kubernetes con fines de depuración.
`replicaStatuses` Matriz ReplicaStatus
`rpcStatus` RpcStatus	Indica una representación canónica de RPC de la condición principal de ResourcePool.
`observedGeneration` entero	Indica qué revisión del recurso se ha conciliado más recientemente.

Rutas

Aparece en:

DeployedModelStatus

Campo	Descripción
`predictRoute` string	Representa la ruta de enrutamiento del contenedor para enviar solicitudes de predicción. Vertex AI reenvía las solicitudes mediante `projects.locations.endpoints.predict` a esta ruta en la dirección IP y el puerto del contenedor. A continuación, Vertex AI devuelve la respuesta del contenedor en la respuesta de la API.
`predictSystemRoute` string	Representa la ruta de enrutamiento del sistema para enviar solicitudes de predicción al clúster de entrada. Este campo solo se rellena internamente cuando se copia en `deployedModel` durante la implementación.
`healthRoute` string	Representa la ruta de enrutamiento del contenedor para enviar comprobaciones del estado. Vertex AI envía de forma intermitente solicitudes GET a esta ruta en la dirección IP y el puerto del contenedor para comprobar que el contenedor está en buen estado.
`healthSystemRoute` string	Representa la ruta de enrutamiento del sistema para enviar solicitudes de comprobación del estado al ingress del clúster. Este campo solo se rellena internamente cuando se copia en `deployedModel` durante la implementación.

RpcStatus

Encapsula un código de RPC y un mensaje.

Aparece en:

DeployedModelStatus

Campo	Descripción
`code` Código	Representa el código RPC. La siguiente etiqueta es `4`.
`message` string	Contiene una descripción de la condición orientada al usuario.
`terminalState` booleano	Indica un valor de `true` si el recurso ha alcanzado un estado terminal y no puede estar listo.