prediction.aiplatform.gdc.goog/v1
套件 v1 包含 prediction.aiplatform.gdc.goog v1 API 群組的 API 結構定義。
自動調度資源
定義部署項目的自動調度資源參數。
顯示位置:
欄位 | 說明 |
---|---|
minReplica 整數 |
備用資源數量下限。預設值為 1 。下一個標記是 5 。 |
maxReplica 整數 |
備用資源數量上限。 |
cpuTarget 整數 |
Pod 向上擴充的 CPU 用量門檻。 |
gpuDutyCycleTarget 整數 |
Pod 向上擴充的 GPU 任務週期使用率門檻。 |
DedicatedResources
定義專用於資源集區的資源。下一個 ID 是 8
。
顯示位置:
欄位 | 說明 |
---|---|
machineSpec |
非必要。使用 machineType 值指定單一機器的設定。如未提供,系統會使用預設值。如果是預測,部署作業的預設機器類型為 n1-standard-2 (以 GKE 為基礎的模型) 或 n2-standard-2-gdc (以 CPU 為基礎的模型)。 |
autoscaling 自動調度資源 |
指定使用者工作負載的自動調度資源參數,例如用於預測的預測器部署作業。 |
DeployedModel
定義 DeployedModels
API 的結構定義。
顯示位置:
欄位 | 說明 |
---|---|
apiVersion 字串 |
prediction.aiplatform.gdc.goog/v1 |
kind 字串 |
DeployedModel |
metadata ObjectMeta |
如需 metadata 的欄位,請參閱 Kubernetes API 說明文件。 |
spec DeployedModelSpec |
|
status DeployedModelStatus |
DeployedModelList
包含 DeployedModel
資源清單。
欄位 | 說明 |
---|---|
apiVersion 字串 |
prediction.aiplatform.gdc.goog/v1 |
kind 字串 |
DeployedModelList |
metadata ListMeta |
如需 metadata 的欄位,請參閱 Kubernetes API 說明文件。 |
items DeployedModel 陣列 |
DeployedModelSpec
定義 DeployedModel
資源的預期狀態。
顯示位置:
欄位 | 說明 |
---|---|
endpointPath 字串 |
指定端點的資源名稱。格式為 projects/{project}/locations/{location}/endpoints/{endpoint-id} 。下一個標記是 6 。 |
modelSpec 類型無效 |
定義部署模型時所需的模型規格。 |
resourcePoolRef ObjectReference |
指定資源集區的參照,以及此 DeployedModel 必須具備的資源規格。 |
sharesResourcePool boolean |
指定 DeployedModel 是否與其他模型共用資源集區。 |
DeployedModelStatus
定義 DeployedModel
資源的觀察狀態。
顯示位置:
欄位 | 說明 |
---|---|
ready boolean |
指出資源是否處於就緒狀態。 |
primaryCondition |
代表資源的主要條件。如果資源已準備就緒,條件就會指出資源已準備就緒。否則,該條件就是資源尚未準備就緒的主要原因。 |
resourceConditions array |
代表資源及其子資源的條件集合。您可以使用這項功能判斷資源及其子資源的整體健康狀態。 |
conditions Condition 陣列 |
代表從 Kubernetes 資源填入的原始資源條件,用於偵錯。 |
routes Routes |
代表已部署模型預測或健康狀態檢查的容器或系統路徑。 |
ports 連接埠 |
代表容器 HTTP 或 gRPC 通訊埠。 |
rpcStatus RpcStatus |
指出已部署模型主要條件的標準 RPC 表示法。 |
observedGeneration 整數 |
指出最近一次完成資源協調作業的修訂版本。 |
通訊埠
顯示位置:
欄位 | 說明 |
---|---|
predictorPorts 整數陣列 |
列出要從預測器公開的 HTTP 通訊埠。系統不會將要求轉送至第一個列出通訊埠以外的通訊埠。這個欄位對應 Kubernetes Containers v1 核心 API 的 ports 欄位。 |
predictorGRPCPorts 整數陣列 |
列出要從預測器公開的 gRPC 通訊埠。如果省略這個欄位,系統會停用傳送至容器的 gRPC 要求。系統不會將要求轉送至第一個列出通訊埠以外的通訊埠。這個欄位對應 Kubernetes Containers v1 核心 API 的 ports 欄位。 |
ReplicaStatus
定義 ResourcePool
資源的副本資訊。
顯示位置:
欄位 | 說明 |
---|---|
resourceType ResourceType |
指定資源類型。 |
resourceName 字串 |
指出資源類型命名空間中的專屬資源名稱。舉例來說,Deployment ResourceType 的資源名稱是 Kubernetes 部署名稱。 |
resourceNamespace 字串 |
指出資源的命名空間。這個欄位不適用於叢集範圍內的資源。 |
appType 字串 |
指出資源的應用程式類型,由特定產品定義。舉例來說,預測功能支援 predictor 和 explainer 做為 appType 。 |
availableReplicas 整數 |
指出可用備用資源的總數。如果是 Kubernetes 部署資源類型,這個欄位代表此部署作業鎖定的可用 Pod 總數,且這些 Pod 至少已準備完成最短秒數。 |
unavailableReplicas 整數 |
指出無法使用的備用資源總數。如果是 Kubernetes 部署資源類型,則代表部署作業鎖定的不可用 Pod 總數。 |
ResourcePool
定義 ResourcePools
API 的結構定義。
顯示位置:
欄位 | 說明 |
---|---|
apiVersion 字串 |
prediction.aiplatform.gdc.goog/v1 |
kind 字串 |
ResourcePool |
metadata ObjectMeta |
如需 metadata 的欄位,請參閱 Kubernetes API 說明文件。 |
spec ResourcePoolSpec |
|
status ResourcePoolStatus |
ResourcePoolList
包含 ResourcePool
資源清單。
欄位 | 說明 |
---|---|
apiVersion 字串 |
prediction.aiplatform.gdc.goog/v1 |
kind 字串 |
ResourcePoolList |
metadata ListMeta |
如需 metadata 的欄位,請參閱 Kubernetes API 說明文件。 |
items ResourcePool 陣列 |
ResourcePoolSpec
定義 ResourcePool
資源的預期狀態。
顯示位置:
欄位 | 說明 |
---|---|
resourcePoolID 字串 |
代表 ResourcePool 資源的系統產生 ID。這個欄位僅適用於 Google Cloud 和 GDCE。下一個標記是 8 。 |
userProvidedID 字串 |
代表使用者提供的 ResourcePool 資源 ID。這個欄位僅適用於 Google Cloud 和 GDCE。 |
dedicatedResources DedicatedResources |
包含專用於資源集區的資源說明。 |
enableContainerLogging boolean |
指出是否已為 ResourcePool 啟用容器記錄。 |
userGsa 字串 |
表示使用者專案中使用者提供的 IAM 服務帳戶。如未指定,系統會使用預設的服務服務帳戶。 |
customKsaName 字串 |
指定運算子建立的自訂名稱,使用者工作負載僅適用於自備服務帳戶 (BYOSA) 案例。如果為空白,系統會使用預設命名模式。 |
rolloutStrategy 類型無效 |
指定部署至這個集區的模型是否必須逐步推出至模型伺服器副本,或是一次全部推出。 |
ResourcePoolStatus
定義 ResourcePool
資源的觀察狀態。
顯示位置:
欄位 | 說明 |
---|---|
ready boolean |
指出資源是否處於就緒狀態。 |
primaryCondition |
代表資源的主要條件。如果資源已準備就緒,條件就會指出資源已準備就緒。否則,該條件就是資源尚未準備就緒的主要原因。 |
resourceConditions |
代表資源及其子資源的條件集合。您可以使用這項功能判斷資源及其子資源的整體健康狀態。 |
conditions Condition 陣列 |
代表從 Kubernetes 資源填入的原始資源條件,用於偵錯。 |
replicaStatuses ReplicaStatus 陣列 |
|
rpcStatus RpcStatus |
表示 ResourcePool 主要條件的標準 RPC 表示法。 |
observedGeneration 整數 |
指出最近一次對帳的資源修訂版本。 |
路徑
顯示位置:
欄位 | 說明 |
---|---|
predictRoute 字串 |
代表容器上用於傳送預測要求的路徑。Vertex AI 會使用 projects.locations.endpoints.predict ,將要求轉送至容器 IP 位址和通訊埠上的這個路徑。接著,Vertex AI 會在 API 回應中傳回容器的回應。 |
predictSystemRoute 字串 |
代表將預測要求傳送至叢集 Ingress 的系統路徑。只有在部署期間複製到 deployedModel 時,系統才會在內部填入這個欄位。 |
healthRoute 字串 |
代表容器上的路由路徑,用於傳送健康狀態檢查。這個路徑必須位於容器的 IP 位址和通訊埠,Vertex AI 偶爾會將 GET 要求傳送至這個路徑,以便檢查容器的健康狀態是否良好。 |
healthSystemRoute 字串 |
代表將健康狀態檢查要求傳送至叢集輸入的系統路由路徑。只有在部署期間複製到 deployedModel 時,系統才會在內部填入這個欄位。 |
RpcStatus
封裝 RPC 代碼和訊息。
顯示位置:
欄位 | 說明 |
---|---|
code 程式碼 |
表示 RPC 代碼。下一個標記是 4 。 |
message 字串 |
包含條件的說明,可供使用者查看。 |
terminalState boolean |
如果資源已達到終止狀態,且無法進入就緒狀態,則表示值為 true 。 |