prediction.aiplatform.gdc.goog/v1
v1 패키지에는 prediction.aiplatform.gdc.goog v1 API 그룹의 API 스키마 정의가 포함되어 있습니다.
자동 확장
배포의 자동 확장 매개변수를 정의합니다.
표시 위치:
필드 | 설명 |
---|---|
minReplica 정수 |
최소 복제본 수입니다. 기본값은 1 입니다. 다음 태그는 5 입니다. |
maxReplica 정수 |
최대 복제본 수입니다. |
cpuTarget 정수 |
포드를 스케일 업하기 위한 CPU 사용량의 기준점입니다. |
gpuDutyCycleTarget 정수 |
포드를 확장하기 위한 GPU 가동 주기 사용률의 기준입니다. |
DedicatedResources
리소스 풀에 전용으로 사용되는 리소스를 정의합니다. 다음 ID는 8
입니다.
표시 위치:
필드 | 설명 |
---|---|
machineSpec |
필수 항목이 아닙니다. machineType 값을 사용하여 단일 머신의 구성을 지정합니다. 제공되지 않으면 기본값이 사용됩니다. 예측의 경우 배포의 기본 머신 유형은 n1-standard-2 (GKE 기반 모델) 또는 n2-standard-2-gdc (CPU 기반 모델)입니다. |
autoscaling 자동 확장 |
사용자 워크로드의 자동 확장 매개변수(예: 예측을 위한 예측 변수 배포)를 지정합니다. |
DeployedModel
DeployedModels
API의 스키마를 정의합니다.
표시 위치:
필드 | 설명 |
---|---|
apiVersion 문자열 |
prediction.aiplatform.gdc.goog/v1 |
kind 문자열 |
DeployedModel |
metadata ObjectMeta |
metadata 필드는 Kubernetes API 문서를 참고하세요. |
spec DeployedModelSpec |
|
status DeployedModelStatus |
DeployedModelList
DeployedModel
리소스 목록이 포함됩니다.
필드 | 설명 |
---|---|
apiVersion 문자열 |
prediction.aiplatform.gdc.goog/v1 |
kind 문자열 |
DeployedModelList |
metadata ListMeta |
metadata 필드는 Kubernetes API 문서를 참고하세요. |
items DeployedModel 배열 |
DeployedModelSpec
DeployedModel
리소스의 예상 상태를 정의합니다.
표시 위치:
필드 | 설명 |
---|---|
endpointPath 문자열 |
엔드포인트의 리소스 이름을 지정합니다. 형식은 projects/{project}/locations/{location}/endpoints/{endpoint-id} 입니다. 다음 태그는 6 입니다. |
modelSpec 잘못된 유형 |
모델을 배포할 때 필요한 모델 사양을 정의합니다. |
resourcePoolRef ObjectReference |
이 DeployedModel 에 필요한 리소스 사양이 있는 리소스 풀의 참조를 지정합니다. |
sharesResourcePool 불리언 |
DeployedModel 가 다른 모델과 리소스 풀을 공유하는지 여부를 지정합니다. |
DeployedModelStatus
DeployedModel
리소스의 관찰된 상태를 정의합니다.
표시 위치:
필드 | 설명 |
---|---|
ready 불리언 |
리소스가 준비 상태인지 여부를 나타냅니다. |
primaryCondition |
리소스의 기본 조건을 나타냅니다. 리소스가 준비되면 조건은 리소스가 준비되었음을 나타냅니다. 그렇지 않으면 조건이 리소스가 준비되지 않은 기본 이유입니다. |
resourceConditions 배열 |
리소스 및 하위 리소스의 조건 모음을 나타냅니다. 이를 사용하여 리소스와 하위 리소스의 전반적인 상태를 확인할 수 있습니다. |
conditions Condition 배열 |
디버깅 목적으로 Kubernetes 리소스에서 채워진 원시 리소스 조건을 나타냅니다. |
routes 경로 |
배포된 모델 예측 또는 상태 점검의 컨테이너 또는 시스템 경로를 나타냅니다. |
ports 포트 |
컨테이너 HTTP 또는 gRPC 포트를 나타냅니다. |
rpcStatus RpcStatus |
배포된 모델의 기본 조건에 대한 표준 RPC 표현을 나타냅니다. |
observedGeneration 정수 |
가장 최근에 조정된 리소스의 버전을 나타냅니다. |
포트
표시 위치:
필드 | 설명 |
---|---|
predictorPorts 정수 배열 |
예측 변수에서 노출할 HTTP 포트를 나열합니다. 요청은 나열된 첫 번째 포트 이외의 포트로 전달되지 않습니다. 이 필드는 Kubernetes 컨테이너 v1 핵심 API의 ports 필드에 해당합니다. |
predictorGRPCPorts 정수 배열 |
예측 변수에서 노출할 gRPC 포트를 나열합니다. 이 필드가 생략되면 컨테이너에 대한 gRPC 요청이 사용 중지됩니다. 요청은 나열된 첫 번째 포트 이외의 포트로 전달되지 않습니다. 이 필드는 Kubernetes 컨테이너 v1 핵심 API의 ports 필드에 해당합니다. |
ReplicaStatus
ResourcePool
리소스의 복제본 정보를 정의합니다.
표시 위치:
필드 | 설명 |
---|---|
resourceType ResourceType |
리소스의 유형을 지정합니다. |
resourceName 문자열 |
리소스 유형의 네임스페이스에 있는 고유한 리소스 이름을 나타냅니다. 예를 들어 Deployment ResourceType 의 리소스 이름은 Kubernetes 배포 이름입니다. |
resourceNamespace 문자열 |
리소스의 네임스페이스를 나타냅니다. 이 필드는 클러스터 범위 리소스에는 적용되지 않습니다. |
appType 문자열 |
특정 제품에 의해 정의된 리소스의 애플리케이션 유형을 나타냅니다. 예를 들어 예측은 predictor 및 explainer 을 appType 로 지원합니다. |
availableReplicas 정수 |
사용 가능한 복제본의 총수를 나타냅니다. Kubernetes 배포 리소스 유형의 경우 이 필드는 이 배포의 타겟이며 최소한 최소 준비 시간 동안 준비된 사용 가능한 총 포드 수를 나타냅니다. |
unavailableReplicas 정수 |
사용할 수 없는 복제본의 총수를 나타냅니다. Kubernetes 배포 리소스 유형의 경우 배포에서 타겟팅한 사용할 수 없는 포드의 총수를 나타냅니다. |
리소스 풀
ResourcePools
API의 스키마를 정의합니다.
표시 위치:
필드 | 설명 |
---|---|
apiVersion 문자열 |
prediction.aiplatform.gdc.goog/v1 |
kind 문자열 |
ResourcePool |
metadata ObjectMeta |
metadata 필드는 Kubernetes API 문서를 참고하세요. |
spec ResourcePoolSpec |
|
status ResourcePoolStatus |
ResourcePoolList
ResourcePool
리소스 목록이 포함됩니다.
필드 | 설명 |
---|---|
apiVersion 문자열 |
prediction.aiplatform.gdc.goog/v1 |
kind 문자열 |
ResourcePoolList |
metadata ListMeta |
metadata 필드는 Kubernetes API 문서를 참고하세요. |
items ResourcePool 배열 |
ResourcePoolSpec
ResourcePool
리소스의 예상 상태를 정의합니다.
표시 위치:
필드 | 설명 |
---|---|
resourcePoolID 문자열 |
ResourcePool 리소스의 시스템 생성 ID를 나타냅니다. 이 필드는 Google Cloud 및 GDCE에만 적용됩니다. 다음 태그는 8 입니다. |
userProvidedID 문자열 |
ResourcePool 리소스의 사용자 제공 ID를 나타냅니다. 이 필드는 Google Cloud 및 GDCE에만 적용됩니다. |
dedicatedResources DedicatedResources |
리소스 풀 전용 리소스의 설명을 포함합니다. |
enableContainerLogging 불리언 |
ResourcePool 에 컨테이너 로깅이 사용 설정되어 있는지 여부를 나타냅니다. |
userGsa 문자열 |
사용자 프로젝트에서 사용자가 제공한 IAM 서비스 계정을 나타냅니다. 지정하지 않으면 기본 제공 서비스 계정이 사용됩니다. |
customKsaName 문자열 |
운영자가 만들고 사용자 워크로드가 사용자 서비스 계정 사용 (BYOSA) 사례에만 사용하는 맞춤 이름을 지정합니다. 비어 있으면 시스템에서 기본 이름 지정 패턴을 사용합니다. |
rolloutStrategy 잘못된 유형 |
이 풀에 배포된 모델을 모델 서버 복제본에 점진적으로 또는 한 번에 모두 출시해야 하는지 여부를 지정합니다. |
ResourcePoolStatus
ResourcePool
리소스의 관찰된 상태를 정의합니다.
표시 위치:
필드 | 설명 |
---|---|
ready 불리언 |
리소스가 준비 상태인지 여부를 나타냅니다. |
primaryCondition |
리소스의 기본 조건을 나타냅니다. 리소스가 준비되면 조건은 리소스가 준비되었음을 나타냅니다. 그렇지 않으면 조건이 리소스가 준비되지 않은 기본 이유입니다. |
resourceConditions |
리소스 및 하위 리소스의 조건 모음을 나타냅니다. 이를 사용하여 리소스와 하위 리소스의 전반적인 상태를 확인할 수 있습니다. |
conditions Condition 배열 |
디버깅 목적으로 Kubernetes 리소스에서 채워진 원시 리소스 조건을 나타냅니다. |
replicaStatuses ReplicaStatus 배열 |
|
rpcStatus RpcStatus |
ResourcePool의 기본 조건의 표준 RPC 표현을 나타냅니다. |
observedGeneration 정수 |
가장 최근에 조정된 리소스의 버전을 나타냅니다. |
경로
표시 위치:
필드 | 설명 |
---|---|
predictRoute 문자열 |
예측 요청을 전송할 컨테이너의 라우팅 경로를 나타냅니다. Vertex AI는 projects.locations.endpoints.predict 를 사용하여 컨테이너의 IP 주소 및 포트에서 이 경로로 요청을 전달합니다. 그런 다음 Vertex AI는 API 응답에서 컨테이너의 응답을 반환합니다. |
predictSystemRoute 문자열 |
클러스터 인그레스로 예측 요청을 전송하는 시스템 라우팅 경로를 나타냅니다. 이 필드는 배포 중에 deployedModel 에 복사되는 경우에만 내부적으로 채워집니다. |
healthRoute 문자열 |
상태 점검을 전송할 컨테이너의 라우팅 경로를 나타냅니다. Vertex AI는 컨테이너의 IP 주소 및 포트에서 이 경로로 GET 요청을 간헐적으로 보내 컨테이너가 정상인지 확인합니다. |
healthSystemRoute 문자열 |
클러스터 인그레스로 상태 확인 요청을 전송하는 시스템 라우팅 경로를 나타냅니다. 이 필드는 배포 중에 deployedModel 에 복사되는 경우에만 내부적으로 채워집니다. |
RpcStatus
RPC 코드와 메시지를 캡슐화합니다.
표시 위치:
필드 | 설명 |
---|---|
code 코드 |
RPC 코드를 나타냅니다. 다음 태그는 4 입니다. |
message 문자열 |
조건에 관한 사용자 대상 설명을 포함합니다. |
terminalState 불리언 |
리소스가 최종 상태에 도달하여 준비 상태가 될 수 없는 경우 true 값을 나타냅니다. |