KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

软件包 v1 包含 prediction.aiplatform.gdc.goog v1 API 组的 API 架构定义。

自动扩缩

定义部署的自动扩缩参数。

来源

字段 说明
minReplica 整数 副本数下限。默认值为 1。下一个代码是 5
maxReplica 整数 副本数上限。
cpuTarget 整数 用于纵向伸缩 pod 的 CPU 使用率阈值。
gpuDutyCycleTarget 整数 用于纵向伸缩 pod 的 GPU 工作周期利用率阈值。

DedicatedResources

定义专用于资源池的资源。下一个 ID 为 8

来源

字段 说明
machineSpec 不需要。使用 machineType 值指定单台机器的配置。如果未提供,则使用默认值。对于预测,部署的默认机器类型为 n1-standard-2(基于 GKE 的模型)或 n2-standard-2-gdc(基于 CPU 的模型)。
autoscaling 自动扩缩 指定用户工作负载的自动扩缩参数,例如用于预测的预测器部署。

DeployedModel

定义 DeployedModels API 的架构。

来源

字段 说明
apiVersion 字符串 prediction.aiplatform.gdc.goog/v1
kind 字符串 DeployedModel
metadata ObjectMeta 如需了解 metadata 的字段,请参阅 Kubernetes API 文档。
spec DeployedModelSpec
status DeployedModelStatus

DeployedModelList

包含 DeployedModel 资源的列表。

字段 说明
apiVersion 字符串 prediction.aiplatform.gdc.goog/v1
kind 字符串 DeployedModelList
metadata ListMeta 如需了解 metadata 的字段,请参阅 Kubernetes API 文档。
items DeployedModel 数组

DeployedModelSpec

定义 DeployedModel 资源的预期状态。

来源

字段 说明
endpointPath 字符串 指定端点的资源名称。格式为 projects/{project}/locations/{location}/endpoints/{endpoint-id}。下一个代码是 6
modelSpec 类型无效 定义部署模型时所需的模型规范。
resourcePoolRef ObjectReference 指定资源池的引用,其中包含此 DeployedModel 所需的资源规范。
sharesResourcePool 布尔值 指定 DeployedModel 是否与其他模型共享资源池。

DeployedModelStatus

定义观察到的 DeployedModel 资源的状态。

来源

字段 说明
ready 布尔值 指示资源是否处于就绪状态。
primaryCondition 表示资源的主要条件。如果资源已准备就绪,则相应条件会指明资源已准备就绪。否则,该条件就是资源未就绪的主要原因。
resourceConditions 数组 表示资源及其子资源的一组条件。您可以使用此属性来确定资源及其子资源的整体运行状况。
conditions 条件数组 表示从 Kubernetes 资源填充的原始资源条件,用于调试。
routes 路线 表示已部署模型预测或健康检查的容器或系统路由。
ports 端口 表示容器 HTTP 或 gRPC 端口。
rpcStatus RpcStatus 表示已部署模型的主要条件的规范 RPC 表示形式。
observedGeneration 整数 表示最近协调的资源修订版本。

端口

来源

字段 说明
predictorPorts 整数数组 列出要从预测器公开的 HTTP 端口。请求不会转发到列出的第一个端口以外的端口。此字段对应于 Kubernetes 容器 v1 核心 APIports 字段。
predictorGRPCPorts 整数数组 列出要从预测器公开的 gRPC 端口。如果省略此字段,则会停用向容器发出的 gRPC 请求。请求不会转发到列出的第一个端口以外的端口。此字段对应于 Kubernetes 容器 v1 核心 APIports 字段。

ReplicaStatus

定义 ResourcePool 资源的副本信息。

来源

字段 说明
resourceType ResourceType 指定资源的类型。
resourceName 字符串 表示资源类型命名空间中的唯一资源名称。例如,Deployment ResourceType 的资源名称是 Kubernetes 部署名称。
resourceNamespace 字符串 表示资源的命名空间。此字段不适用于集群范围内的资源。
appType 字符串 指明资源的应用类型,由特定产品定义。例如,预测功能支持将 predictorexplainer 作为 appType
availableReplicas 整数 表示可用副本的总数。对于 Kubernetes 部署资源类型,此字段表示相应部署所面向的可用 pod 总数,这些 pod 已就绪至少达到最短就绪秒数。
unavailableReplicas 整数 表示不可用副本的总数。对于 Kubernetes 部署资源类型,它表示部署所针对的不可用 pod 的总数。

资源池

定义 ResourcePools API 的架构。

来源

字段 说明
apiVersion 字符串 prediction.aiplatform.gdc.goog/v1
kind 字符串 ResourcePool
metadata ObjectMeta 如需了解 metadata 的字段,请参阅 Kubernetes API 文档。
spec ResourcePoolSpec
status ResourcePoolStatus

ResourcePoolList

包含 ResourcePool 资源的列表。

字段 说明
apiVersion 字符串 prediction.aiplatform.gdc.goog/v1
kind 字符串 ResourcePoolList
metadata ListMeta 如需了解 metadata 的字段,请参阅 Kubernetes API 文档。
items ResourcePool 数组

ResourcePoolSpec

定义 ResourcePool 资源的预期状态。

来源

字段 说明
resourcePoolID 字符串 表示 ResourcePool 资源的系统生成的 ID。此字段仅适用于 Google Cloud 和 GDCE。下一个代码是 8
userProvidedID 字符串 表示 ResourcePool 资源的用户提供 ID。此字段仅适用于 Google Cloud 和 GDCE。
dedicatedResources DedicatedResources 包含专用于资源池的资源的说明。
enableContainerLogging 布尔值 指示是否为 ResourcePool 启用了容器日志记录。
userGsa 字符串 表示用户项目中用户提供的 IAM 服务账号。如果未指定,则使用默认的提供服务服务账号。
customKsaName 字符串 指定运算符创建的自定义名称,用户工作负载仅在自带服务账号 (BYOSA) 方案中使用该名称。如果为空,系统会使用默认命名模式。
rolloutStrategy 类型无效 指定部署到此池的模型必须逐步还是全部同时部署到模型服务器副本。

ResourcePoolStatus

定义了 ResourcePool 资源的观测状态。

来源

字段 说明
ready 布尔值 指示资源是否处于就绪状态。
primaryCondition 表示资源的主要条件。如果资源已准备就绪,则相应条件会指明资源已准备就绪。否则,该条件就是资源未就绪的主要原因。
resourceConditions 表示资源及其子资源的一组条件。您可以使用此属性来确定资源及其子资源的整体运行状况。
conditions 条件数组 表示从 Kubernetes 资源填充的原始资源条件,用于调试。
replicaStatuses ReplicaStatus 数组
rpcStatus RpcStatus 表示 ResourcePool 的主要条件的规范 RPC 表示形式。
observedGeneration 整数 表示最近协调的资源修订版本。

路由

来源

字段 说明
predictRoute 字符串 表示容器上用于发送预测请求的路由路径。Vertex AI 使用 projects.locations.endpoints.predict 将请求转发到容器 IP 地址和端口上的此路径。然后,Vertex AI 会在 API 响应中返回容器的响应。
predictSystemRoute 字符串 表示向集群入站发送预测请求的系统路由路径。仅当在部署期间将此字段复制到 deployedModel 时,系统才会内部填充此字段。
healthRoute 字符串 表示容器上用于发送健康检查的路由路径。Vertex AI 会间歇性地向容器的 IP 地址和端口上的此路径发送 GET 请求,以检查容器是否正常。
healthSystemRoute 字符串 表示向集群入站流量发送健康检查请求的系统路由路径。仅当在部署期间将此字段复制到 deployedModel 时,系统才会内部填充此字段。

RpcStatus

封装 RPC 代码和消息。

来源

字段 说明
code 代码 表示 RPC 代码。下一个代码是 4
message 字符串 包含面向用户的条件说明。
terminalState 布尔值 如果资源已达到最终状态且无法变为就绪状态,则指示值为 true