KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

套件 v1 包含 prediction.aiplatform.gdc.goog v1 API 群組的 API 結構定義。

自動調度資源

定義部署項目的自動調度資源參數。

顯示位置:

欄位 說明
minReplica 整數 備用資源數量下限。預設值為 1。下一個標記是 5
maxReplica 整數 備用資源數量上限。
cpuTarget 整數 Pod 向上擴充的 CPU 用量門檻。
gpuDutyCycleTarget 整數 Pod 向上擴充的 GPU 任務週期使用率門檻。

DedicatedResources

定義專用於資源集區的資源。下一個 ID 是 8

顯示位置:

欄位 說明
machineSpec 非必要。使用 machineType 值指定單一機器的設定。如未提供,系統會使用預設值。如果是預測,部署作業的預設機器類型為 n1-standard-2 (以 GKE 為基礎的模型) 或 n2-standard-2-gdc (以 CPU 為基礎的模型)。
autoscaling 自動調度資源 指定使用者工作負載的自動調度資源參數,例如用於預測的預測器部署作業。

DeployedModel

定義 DeployedModels API 的結構定義。

顯示位置:

欄位 說明
apiVersion 字串 prediction.aiplatform.gdc.goog/v1
kind 字串 DeployedModel
metadata ObjectMeta 如需 metadata 的欄位,請參閱 Kubernetes API 說明文件。
spec DeployedModelSpec
status DeployedModelStatus

DeployedModelList

包含 DeployedModel 資源清單。

欄位 說明
apiVersion 字串 prediction.aiplatform.gdc.goog/v1
kind 字串 DeployedModelList
metadata ListMeta 如需 metadata 的欄位,請參閱 Kubernetes API 說明文件。
items DeployedModel 陣列

DeployedModelSpec

定義 DeployedModel 資源的預期狀態。

顯示位置:

欄位 說明
endpointPath 字串 指定端點的資源名稱。格式為 projects/{project}/locations/{location}/endpoints/{endpoint-id}。下一個標記是 6
modelSpec 類型無效 定義部署模型時所需的模型規格。
resourcePoolRef ObjectReference 指定資源集區的參照,以及此 DeployedModel 必須具備的資源規格。
sharesResourcePool boolean 指定 DeployedModel 是否與其他模型共用資源集區。

DeployedModelStatus

定義 DeployedModel 資源的觀察狀態。

顯示位置:

欄位 說明
ready boolean 指出資源是否處於就緒狀態。
primaryCondition 代表資源的主要條件。如果資源已準備就緒,條件就會指出資源已準備就緒。否則,該條件就是資源尚未準備就緒的主要原因。
resourceConditions array 代表資源及其子資源的條件集合。您可以使用這項功能判斷資源及其子資源的整體健康狀態。
conditions Condition 陣列 代表從 Kubernetes 資源填入的原始資源條件,用於偵錯。
routes Routes 代表已部署模型預測或健康狀態檢查的容器或系統路徑。
ports 連接埠 代表容器 HTTP 或 gRPC 通訊埠。
rpcStatus RpcStatus 指出已部署模型主要條件的標準 RPC 表示法。
observedGeneration 整數 指出最近一次完成資源協調作業的修訂版本。

通訊埠

顯示位置:

欄位 說明
predictorPorts 整數陣列 列出要從預測器公開的 HTTP 通訊埠。系統不會將要求轉送至第一個列出通訊埠以外的通訊埠。這個欄位對應 Kubernetes Containers v1 核心 APIports 欄位。
predictorGRPCPorts 整數陣列 列出要從預測器公開的 gRPC 通訊埠。如果省略這個欄位,系統會停用傳送至容器的 gRPC 要求。系統不會將要求轉送至第一個列出通訊埠以外的通訊埠。這個欄位對應 Kubernetes Containers v1 核心 APIports 欄位。

ReplicaStatus

定義 ResourcePool 資源的副本資訊。

顯示位置:

欄位 說明
resourceType ResourceType 指定資源類型。
resourceName 字串 指出資源類型命名空間中的專屬資源名稱。舉例來說,Deployment ResourceType 的資源名稱是 Kubernetes 部署名稱。
resourceNamespace 字串 指出資源的命名空間。這個欄位不適用於叢集範圍內的資源。
appType 字串 指出資源的應用程式類型,由特定產品定義。舉例來說,預測功能支援 predictorexplainer 做為 appType
availableReplicas 整數 指出可用備用資源的總數。如果是 Kubernetes 部署資源類型,這個欄位代表此部署作業鎖定的可用 Pod 總數,且這些 Pod 至少已準備完成最短秒數。
unavailableReplicas 整數 指出無法使用的備用資源總數。如果是 Kubernetes 部署資源類型,則代表部署作業鎖定的不可用 Pod 總數。

ResourcePool

定義 ResourcePools API 的結構定義。

顯示位置:

欄位 說明
apiVersion 字串 prediction.aiplatform.gdc.goog/v1
kind 字串 ResourcePool
metadata ObjectMeta 如需 metadata 的欄位,請參閱 Kubernetes API 說明文件。
spec ResourcePoolSpec
status ResourcePoolStatus

ResourcePoolList

包含 ResourcePool 資源清單。

欄位 說明
apiVersion 字串 prediction.aiplatform.gdc.goog/v1
kind 字串 ResourcePoolList
metadata ListMeta 如需 metadata 的欄位,請參閱 Kubernetes API 說明文件。
items ResourcePool 陣列

ResourcePoolSpec

定義 ResourcePool 資源的預期狀態。

顯示位置:

欄位 說明
resourcePoolID 字串 代表 ResourcePool 資源的系統產生 ID。這個欄位僅適用於 Google Cloud 和 GDCE。下一個標記是 8
userProvidedID 字串 代表使用者提供的 ResourcePool 資源 ID。這個欄位僅適用於 Google Cloud 和 GDCE。
dedicatedResources DedicatedResources 包含專用於資源集區的資源說明。
enableContainerLogging boolean 指出是否已為 ResourcePool 啟用容器記錄。
userGsa 字串 表示使用者專案中使用者提供的 IAM 服務帳戶。如未指定,系統會使用預設的服務服務帳戶。
customKsaName 字串 指定運算子建立的自訂名稱,使用者工作負載僅適用於自備服務帳戶 (BYOSA) 案例。如果為空白,系統會使用預設命名模式。
rolloutStrategy 類型無效 指定部署至這個集區的模型是否必須逐步推出至模型伺服器副本,或是一次全部推出。

ResourcePoolStatus

定義 ResourcePool 資源的觀察狀態。

顯示位置:

欄位 說明
ready boolean 指出資源是否處於就緒狀態。
primaryCondition 代表資源的主要條件。如果資源已準備就緒,條件就會指出資源已準備就緒。否則,該條件就是資源尚未準備就緒的主要原因。
resourceConditions 代表資源及其子資源的條件集合。您可以使用這項功能判斷資源及其子資源的整體健康狀態。
conditions Condition 陣列 代表從 Kubernetes 資源填入的原始資源條件,用於偵錯。
replicaStatuses ReplicaStatus 陣列
rpcStatus RpcStatus 表示 ResourcePool 主要條件的標準 RPC 表示法。
observedGeneration 整數 指出最近一次對帳的資源修訂版本。

路徑

顯示位置:

欄位 說明
predictRoute 字串 代表容器上用於傳送預測要求的路徑。Vertex AI 會使用 projects.locations.endpoints.predict,將要求轉送至容器 IP 位址和通訊埠上的這個路徑。接著,Vertex AI 會在 API 回應中傳回容器的回應。
predictSystemRoute 字串 代表將預測要求傳送至叢集 Ingress 的系統路徑。只有在部署期間複製到 deployedModel 時,系統才會在內部填入這個欄位。
healthRoute 字串 代表容器上的路由路徑,用於傳送健康狀態檢查。這個路徑必須位於容器的 IP 位址和通訊埠,Vertex AI 偶爾會將 GET 要求傳送至這個路徑,以便檢查容器的健康狀態是否良好。
healthSystemRoute 字串 代表將健康狀態檢查要求傳送至叢集輸入的系統路由路徑。只有在部署期間複製到 deployedModel 時,系統才會在內部填入這個欄位。

RpcStatus

封裝 RPC 代碼和訊息。

顯示位置:

欄位 說明
code 程式碼 表示 RPC 代碼。下一個標記是 4
message 字串 包含條件的說明,可供使用者查看。
terminalState boolean 如果資源已達到終止狀態,且無法進入就緒狀態,則表示值為 true