KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

v1 패키지에는 prediction.aiplatform.gdc.goog v1 API 그룹의 API 스키마 정의가 포함되어 있습니다.

자동 확장

배포의 자동 확장 매개변수를 정의합니다.

표시 위치:

필드 설명
minReplica 정수 최소 복제본 수입니다. 기본값은 1입니다. 다음 태그는 5입니다.
maxReplica 정수 최대 복제본 수입니다.
cpuTarget 정수 포드를 스케일 업하기 위한 CPU 사용량의 기준점입니다.
gpuDutyCycleTarget 정수 포드를 확장하기 위한 GPU 가동 주기 사용률의 기준입니다.

DedicatedResources

리소스 풀에 전용으로 사용되는 리소스를 정의합니다. 다음 ID는 8입니다.

표시 위치:

필드 설명
machineSpec 필수 항목이 아닙니다. machineType 값을 사용하여 단일 머신의 구성을 지정합니다. 제공되지 않으면 기본값이 사용됩니다. 예측의 경우 배포의 기본 머신 유형은 n1-standard-2 (GKE 기반 모델) 또는 n2-standard-2-gdc (CPU 기반 모델)입니다.
autoscaling 자동 확장 사용자 워크로드의 자동 확장 매개변수(예: 예측을 위한 예측 변수 배포)를 지정합니다.

DeployedModel

DeployedModels API의 스키마를 정의합니다.

표시 위치:

필드 설명
apiVersion 문자열 prediction.aiplatform.gdc.goog/v1
kind 문자열 DeployedModel
metadata ObjectMeta metadata 필드는 Kubernetes API 문서를 참고하세요.
spec DeployedModelSpec
status DeployedModelStatus

DeployedModelList

DeployedModel 리소스 목록이 포함됩니다.

필드 설명
apiVersion 문자열 prediction.aiplatform.gdc.goog/v1
kind 문자열 DeployedModelList
metadata ListMeta metadata 필드는 Kubernetes API 문서를 참고하세요.
items DeployedModel 배열

DeployedModelSpec

DeployedModel 리소스의 예상 상태를 정의합니다.

표시 위치:

필드 설명
endpointPath 문자열 엔드포인트의 리소스 이름을 지정합니다. 형식은 projects/{project}/locations/{location}/endpoints/{endpoint-id}입니다. 다음 태그는 6입니다.
modelSpec 잘못된 유형 모델을 배포할 때 필요한 모델 사양을 정의합니다.
resourcePoolRef ObjectReference DeployedModel에 필요한 리소스 사양이 있는 리소스 풀의 참조를 지정합니다.
sharesResourcePool 불리언 DeployedModel가 다른 모델과 리소스 풀을 공유하는지 여부를 지정합니다.

DeployedModelStatus

DeployedModel 리소스의 관찰된 상태를 정의합니다.

표시 위치:

필드 설명
ready 불리언 리소스가 준비 상태인지 여부를 나타냅니다.
primaryCondition 리소스의 기본 조건을 나타냅니다. 리소스가 준비되면 조건은 리소스가 준비되었음을 나타냅니다. 그렇지 않으면 조건이 리소스가 준비되지 않은 기본 이유입니다.
resourceConditions 배열 리소스 및 하위 리소스의 조건 모음을 나타냅니다. 이를 사용하여 리소스와 하위 리소스의 전반적인 상태를 확인할 수 있습니다.
conditions Condition 배열 디버깅 목적으로 Kubernetes 리소스에서 채워진 원시 리소스 조건을 나타냅니다.
routes 경로 배포된 모델 예측 또는 상태 점검의 컨테이너 또는 시스템 경로를 나타냅니다.
ports 포트 컨테이너 HTTP 또는 gRPC 포트를 나타냅니다.
rpcStatus RpcStatus 배포된 모델의 기본 조건에 대한 표준 RPC 표현을 나타냅니다.
observedGeneration 정수 가장 최근에 조정된 리소스의 버전을 나타냅니다.

포트

표시 위치:

필드 설명
predictorPorts 정수 배열 예측 변수에서 노출할 HTTP 포트를 나열합니다. 요청은 나열된 첫 번째 포트 이외의 포트로 전달되지 않습니다. 이 필드는 Kubernetes 컨테이너 v1 핵심 APIports 필드에 해당합니다.
predictorGRPCPorts 정수 배열 예측 변수에서 노출할 gRPC 포트를 나열합니다. 이 필드가 생략되면 컨테이너에 대한 gRPC 요청이 사용 중지됩니다. 요청은 나열된 첫 번째 포트 이외의 포트로 전달되지 않습니다. 이 필드는 Kubernetes 컨테이너 v1 핵심 APIports 필드에 해당합니다.

ReplicaStatus

ResourcePool 리소스의 복제본 정보를 정의합니다.

표시 위치:

필드 설명
resourceType ResourceType 리소스의 유형을 지정합니다.
resourceName 문자열 리소스 유형의 네임스페이스에 있는 고유한 리소스 이름을 나타냅니다. 예를 들어 Deployment ResourceType의 리소스 이름은 Kubernetes 배포 이름입니다.
resourceNamespace 문자열 리소스의 네임스페이스를 나타냅니다. 이 필드는 클러스터 범위 리소스에는 적용되지 않습니다.
appType 문자열 특정 제품에 의해 정의된 리소스의 애플리케이션 유형을 나타냅니다. 예를 들어 예측은 predictorexplainerappType로 지원합니다.
availableReplicas 정수 사용 가능한 복제본의 총수를 나타냅니다. Kubernetes 배포 리소스 유형의 경우 이 필드는 이 배포의 타겟이며 최소한 최소 준비 시간 동안 준비된 사용 가능한 총 포드 수를 나타냅니다.
unavailableReplicas 정수 사용할 수 없는 복제본의 총수를 나타냅니다. Kubernetes 배포 리소스 유형의 경우 배포에서 타겟팅한 사용할 수 없는 포드의 총수를 나타냅니다.

리소스 풀

ResourcePools API의 스키마를 정의합니다.

표시 위치:

필드 설명
apiVersion 문자열 prediction.aiplatform.gdc.goog/v1
kind 문자열 ResourcePool
metadata ObjectMeta metadata 필드는 Kubernetes API 문서를 참고하세요.
spec ResourcePoolSpec
status ResourcePoolStatus

ResourcePoolList

ResourcePool 리소스 목록이 포함됩니다.

필드 설명
apiVersion 문자열 prediction.aiplatform.gdc.goog/v1
kind 문자열 ResourcePoolList
metadata ListMeta metadata 필드는 Kubernetes API 문서를 참고하세요.
items ResourcePool 배열

ResourcePoolSpec

ResourcePool 리소스의 예상 상태를 정의합니다.

표시 위치:

필드 설명
resourcePoolID 문자열 ResourcePool 리소스의 시스템 생성 ID를 나타냅니다. 이 필드는 Google Cloud 및 GDCE에만 적용됩니다. 다음 태그는 8입니다.
userProvidedID 문자열 ResourcePool 리소스의 사용자 제공 ID를 나타냅니다. 이 필드는 Google Cloud 및 GDCE에만 적용됩니다.
dedicatedResources DedicatedResources 리소스 풀 전용 리소스의 설명을 포함합니다.
enableContainerLogging 불리언 ResourcePool에 컨테이너 로깅이 사용 설정되어 있는지 여부를 나타냅니다.
userGsa 문자열 사용자 프로젝트에서 사용자가 제공한 IAM 서비스 계정을 나타냅니다. 지정하지 않으면 기본 제공 서비스 계정이 사용됩니다.
customKsaName 문자열 운영자가 만들고 사용자 워크로드가 사용자 서비스 계정 사용 (BYOSA) 사례에만 사용하는 맞춤 이름을 지정합니다. 비어 있으면 시스템에서 기본 이름 지정 패턴을 사용합니다.
rolloutStrategy 잘못된 유형 이 풀에 배포된 모델을 모델 서버 복제본에 점진적으로 또는 한 번에 모두 출시해야 하는지 여부를 지정합니다.

ResourcePoolStatus

ResourcePool 리소스의 관찰된 상태를 정의합니다.

표시 위치:

필드 설명
ready 불리언 리소스가 준비 상태인지 여부를 나타냅니다.
primaryCondition 리소스의 기본 조건을 나타냅니다. 리소스가 준비되면 조건은 리소스가 준비되었음을 나타냅니다. 그렇지 않으면 조건이 리소스가 준비되지 않은 기본 이유입니다.
resourceConditions 리소스 및 하위 리소스의 조건 모음을 나타냅니다. 이를 사용하여 리소스와 하위 리소스의 전반적인 상태를 확인할 수 있습니다.
conditions Condition 배열 디버깅 목적으로 Kubernetes 리소스에서 채워진 원시 리소스 조건을 나타냅니다.
replicaStatuses ReplicaStatus 배열
rpcStatus RpcStatus ResourcePool의 기본 조건의 표준 RPC 표현을 나타냅니다.
observedGeneration 정수 가장 최근에 조정된 리소스의 버전을 나타냅니다.

경로

표시 위치:

필드 설명
predictRoute 문자열 예측 요청을 전송할 컨테이너의 라우팅 경로를 나타냅니다. Vertex AI는 projects.locations.endpoints.predict를 사용하여 컨테이너의 IP 주소 및 포트에서 이 경로로 요청을 전달합니다. 그런 다음 Vertex AI는 API 응답에서 컨테이너의 응답을 반환합니다.
predictSystemRoute 문자열 클러스터 인그레스로 예측 요청을 전송하는 시스템 라우팅 경로를 나타냅니다. 이 필드는 배포 중에 deployedModel에 복사되는 경우에만 내부적으로 채워집니다.
healthRoute 문자열 상태 점검을 전송할 컨테이너의 라우팅 경로를 나타냅니다. Vertex AI는 컨테이너의 IP 주소 및 포트에서 이 경로로 GET 요청을 간헐적으로 보내 컨테이너가 정상인지 확인합니다.
healthSystemRoute 문자열 클러스터 인그레스로 상태 확인 요청을 전송하는 시스템 라우팅 경로를 나타냅니다. 이 필드는 배포 중에 deployedModel에 복사되는 경우에만 내부적으로 채워집니다.

RpcStatus

RPC 코드와 메시지를 캡슐화합니다.

표시 위치:

필드 설명
code 코드 RPC 코드를 나타냅니다. 다음 태그는 4입니다.
message 문자열 조건에 관한 사용자 대상 설명을 포함합니다.
terminalState 불리언 리소스가 최종 상태에 도달하여 준비 상태가 될 수 없는 경우 true 값을 나타냅니다.