此页面由 Cloud Translation API 翻译。

KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

软件包 v1 包含 prediction.aiplatform.gdc.goog v1 API 组的 API 架构定义。

自动扩缩

定义部署的自动扩缩参数。

来源：

DedicatedResources

字段	说明
`minReplica` 整数	副本数下限。默认值为 `1`。下一个代码是 `5`。
`maxReplica` 整数	副本数上限。
`cpuTarget` 整数	用于纵向伸缩 pod 的 CPU 使用率阈值。
`gpuDutyCycleTarget` 整数	用于纵向伸缩 pod 的 GPU 工作周期利用率阈值。

DedicatedResources

定义专用于资源池的资源。下一个 ID 为 8。

来源：

ResourcePoolSpec

字段	说明
`machineSpec`	不需要。使用 `machineType` 值指定单台机器的配置。如果未提供，则使用默认值。对于预测，部署的默认机器类型为 `n1-standard-2`（基于 GKE 的模型）或 `n2-standard-2-gdc`（基于 CPU 的模型）。
`autoscaling` 自动扩缩	指定用户工作负载的自动扩缩参数，例如用于预测的预测器部署。

DeployedModel

定义 DeployedModels API 的架构。

来源：

DeployedModelList

字段	说明
`apiVersion` 字符串	`prediction.aiplatform.gdc.goog/v1`
`kind` 字符串	`DeployedModel`
`metadata` ObjectMeta	如需了解 `metadata` 的字段，请参阅 Kubernetes API 文档。
`spec` DeployedModelSpec
`status` DeployedModelStatus

DeployedModelList

包含 DeployedModel 资源的列表。

字段	说明
`apiVersion` 字符串	`prediction.aiplatform.gdc.goog/v1`
`kind` 字符串	`DeployedModelList`
`metadata` ListMeta	如需了解 `metadata` 的字段，请参阅 Kubernetes API 文档。
`items` DeployedModel 数组

DeployedModelSpec

定义 DeployedModel 资源的预期状态。

来源：

DeployedModel

字段	说明
`endpointPath` 字符串	指定端点的资源名称。格式为 `projects/{project}/locations/{location}/endpoints/{endpoint-id}`。下一个代码是 `6`。
`modelSpec` 类型无效	定义部署模型时所需的模型规范。
`resourcePoolRef` ObjectReference	指定资源池的引用，其中包含此 `DeployedModel` 所需的资源规范。
`sharesResourcePool` 布尔值	指定 `DeployedModel` 是否与其他模型共享资源池。

DeployedModelStatus

定义观察到的 DeployedModel 资源的状态。

来源：

DeployedModel

字段	说明
`ready` 布尔值	指示资源是否处于就绪状态。
`primaryCondition`	表示资源的主要条件。如果资源已准备就绪，则相应条件会指明资源已准备就绪。否则，该条件就是资源未就绪的主要原因。
`resourceConditions` 数组	表示资源及其子资源的一组条件。您可以使用此属性来确定资源及其子资源的整体运行状况。
`conditions` 条件数组	表示从 Kubernetes 资源填充的原始资源条件，用于调试。
`routes` 路线	表示已部署模型预测或健康检查的容器或系统路由。
`ports` 端口	表示容器 HTTP 或 gRPC 端口。
`rpcStatus` RpcStatus	表示已部署模型的主要条件的规范 RPC 表示形式。
`observedGeneration` 整数	表示最近协调的资源修订版本。

端口

来源：

DeployedModelStatus

字段	说明
`predictorPorts` 整数数组	列出要从预测器公开的 HTTP 端口。请求不会转发到列出的第一个端口以外的端口。此字段对应于 Kubernetes 容器 v1 核心 API 的 `ports` 字段。
`predictorGRPCPorts` 整数数组	列出要从预测器公开的 gRPC 端口。如果省略此字段，则会停用向容器发出的 gRPC 请求。请求不会转发到列出的第一个端口以外的端口。此字段对应于 Kubernetes 容器 v1 核心 API 的 `ports` 字段。

ReplicaStatus

定义 ResourcePool 资源的副本信息。

来源：

ResourcePoolStatus

字段	说明
`resourceType` ResourceType	指定资源的类型。
`resourceName` 字符串	表示资源类型命名空间中的唯一资源名称。例如，`Deployment` `ResourceType` 的资源名称是 Kubernetes 部署名称。
`resourceNamespace` 字符串	表示资源的命名空间。此字段不适用于集群范围内的资源。
`appType` 字符串	指明资源的应用类型，由特定产品定义。例如，预测功能支持将 `predictor` 和 `explainer` 作为 `appType`。
`availableReplicas` 整数	表示可用副本的总数。对于 Kubernetes 部署资源类型，此字段表示相应部署所面向的可用 pod 总数，这些 pod 已就绪至少达到最短就绪秒数。
`unavailableReplicas` 整数	表示不可用副本的总数。对于 Kubernetes 部署资源类型，它表示部署所针对的不可用 pod 的总数。

资源池

定义 ResourcePools API 的架构。

来源：

ResourcePoolList

字段	说明
`apiVersion` 字符串	`prediction.aiplatform.gdc.goog/v1`
`kind` 字符串	`ResourcePool`
`metadata` ObjectMeta	如需了解 `metadata` 的字段，请参阅 Kubernetes API 文档。
`spec` ResourcePoolSpec
`status` ResourcePoolStatus

ResourcePoolList

包含 ResourcePool 资源的列表。

字段	说明
`apiVersion` 字符串	`prediction.aiplatform.gdc.goog/v1`
`kind` 字符串	`ResourcePoolList`
`metadata` ListMeta	如需了解 `metadata` 的字段，请参阅 Kubernetes API 文档。
`items` ResourcePool 数组

ResourcePoolSpec

定义 ResourcePool 资源的预期状态。

来源：

ResourcePool

字段	说明
`resourcePoolID` 字符串	表示 `ResourcePool` 资源的系统生成的 ID。此字段仅适用于 Google Cloud 和 GDCE。下一个代码是 `8`。
`userProvidedID` 字符串	表示 `ResourcePool` 资源的用户提供 ID。此字段仅适用于 Google Cloud 和 GDCE。
`dedicatedResources` DedicatedResources	包含专用于资源池的资源的说明。
`enableContainerLogging` 布尔值	指示是否为 `ResourcePool` 启用了容器日志记录。
`userGsa` 字符串	表示用户项目中用户提供的 IAM 服务账号。如果未指定，则使用默认的提供服务服务账号。
`customKsaName` 字符串	指定运算符创建的自定义名称，用户工作负载仅在自带服务账号 (BYOSA) 方案中使用该名称。如果为空，系统会使用默认命名模式。
`rolloutStrategy` 类型无效	指定部署到此池的模型必须逐步还是全部同时部署到模型服务器副本。

ResourcePoolStatus

定义了 ResourcePool 资源的观测状态。

来源：

ResourcePool

字段	说明
`ready` 布尔值	指示资源是否处于就绪状态。
`primaryCondition`	表示资源的主要条件。如果资源已准备就绪，则相应条件会指明资源已准备就绪。否则，该条件就是资源未就绪的主要原因。
`resourceConditions`	表示资源及其子资源的一组条件。您可以使用此属性来确定资源及其子资源的整体运行状况。
`conditions` 条件数组	表示从 Kubernetes 资源填充的原始资源条件，用于调试。
`replicaStatuses` ReplicaStatus 数组
`rpcStatus` RpcStatus	表示 ResourcePool 的主要条件的规范 RPC 表示形式。
`observedGeneration` 整数	表示最近协调的资源修订版本。

路由

来源：

DeployedModelStatus

字段	说明
`predictRoute` 字符串	表示容器上用于发送预测请求的路由路径。Vertex AI 使用 `projects.locations.endpoints.predict` 将请求转发到容器 IP 地址和端口上的此路径。然后，Vertex AI 会在 API 响应中返回容器的响应。
`predictSystemRoute` 字符串	表示向集群入站发送预测请求的系统路由路径。仅当在部署期间将此字段复制到 `deployedModel` 时，系统才会内部填充此字段。
`healthRoute` 字符串	表示容器上用于发送健康检查的路由路径。Vertex AI 会间歇性地向容器的 IP 地址和端口上的此路径发送 GET 请求，以检查容器是否正常。
`healthSystemRoute` 字符串	表示向集群入站流量发送健康检查请求的系统路由路径。仅当在部署期间将此字段复制到 `deployedModel` 时，系统才会内部填充此字段。

RpcStatus

封装 RPC 代码和消息。

来源：

DeployedModelStatus

字段	说明
`code` 代码	表示 RPC 代码。下一个代码是 `4`。
`message` 字符串	包含面向用户的条件说明。
`terminalState` 布尔值	如果资源已达到最终状态且无法变为就绪状态，则指示值为 `true`。