이 페이지는 Cloud Translation API를 통해 번역되었습니다.

KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

v1 패키지에는 prediction.aiplatform.gdc.goog v1 API 그룹의 API 스키마 정의가 포함되어 있습니다.

자동 확장

배포의 자동 확장 매개변수를 정의합니다.

표시 위치:

DedicatedResources

필드	설명
`minReplica` 정수	최소 복제본 수입니다. 기본값은 `1`입니다. 다음 태그는 `5`입니다.
`maxReplica` 정수	최대 복제본 수입니다.
`cpuTarget` 정수	포드를 스케일 업하기 위한 CPU 사용량의 기준점입니다.
`gpuDutyCycleTarget` 정수	포드를 확장하기 위한 GPU 가동 주기 사용률의 기준입니다.

DedicatedResources

리소스 풀에 전용으로 사용되는 리소스를 정의합니다. 다음 ID는 8입니다.

표시 위치:

ResourcePoolSpec

필드	설명
`machineSpec`	필수 항목이 아닙니다. `machineType` 값을 사용하여 단일 머신의 구성을 지정합니다. 제공되지 않으면 기본값이 사용됩니다. 예측의 경우 배포의 기본 머신 유형은 `n1-standard-2` (GKE 기반 모델) 또는 `n2-standard-2-gdc` (CPU 기반 모델)입니다.
`autoscaling` 자동 확장	사용자 워크로드의 자동 확장 매개변수(예: 예측을 위한 예측 변수 배포)를 지정합니다.

DeployedModel

DeployedModels API의 스키마를 정의합니다.

표시 위치:

DeployedModelList

필드	설명
`apiVersion` 문자열	`prediction.aiplatform.gdc.goog/v1`
`kind` 문자열	`DeployedModel`
`metadata` ObjectMeta	`metadata` 필드는 Kubernetes API 문서를 참고하세요.
`spec` DeployedModelSpec
`status` DeployedModelStatus

DeployedModelList

DeployedModel 리소스 목록이 포함됩니다.

필드	설명
`apiVersion` 문자열	`prediction.aiplatform.gdc.goog/v1`
`kind` 문자열	`DeployedModelList`
`metadata` ListMeta	`metadata` 필드는 Kubernetes API 문서를 참고하세요.
`items` DeployedModel 배열

DeployedModelSpec

DeployedModel 리소스의 예상 상태를 정의합니다.

표시 위치:

DeployedModel

필드	설명
`endpointPath` 문자열	엔드포인트의 리소스 이름을 지정합니다. 형식은 `projects/{project}/locations/{location}/endpoints/{endpoint-id}`입니다. 다음 태그는 `6`입니다.
`modelSpec` 잘못된 유형	모델을 배포할 때 필요한 모델 사양을 정의합니다.
`resourcePoolRef` ObjectReference	이 `DeployedModel`에 필요한 리소스 사양이 있는 리소스 풀의 참조를 지정합니다.
`sharesResourcePool` 불리언	`DeployedModel`가 다른 모델과 리소스 풀을 공유하는지 여부를 지정합니다.

DeployedModelStatus

DeployedModel 리소스의 관찰된 상태를 정의합니다.

표시 위치:

DeployedModel

필드	설명
`ready` 불리언	리소스가 준비 상태인지 여부를 나타냅니다.
`primaryCondition`	리소스의 기본 조건을 나타냅니다. 리소스가 준비되면 조건은 리소스가 준비되었음을 나타냅니다. 그렇지 않으면 조건이 리소스가 준비되지 않은 기본 이유입니다.
`resourceConditions` 배열	리소스 및 하위 리소스의 조건 모음을 나타냅니다. 이를 사용하여 리소스와 하위 리소스의 전반적인 상태를 확인할 수 있습니다.
`conditions` Condition 배열	디버깅 목적으로 Kubernetes 리소스에서 채워진 원시 리소스 조건을 나타냅니다.
`routes` 경로	배포된 모델 예측 또는 상태 점검의 컨테이너 또는 시스템 경로를 나타냅니다.
`ports` 포트	컨테이너 HTTP 또는 gRPC 포트를 나타냅니다.
`rpcStatus` RpcStatus	배포된 모델의 기본 조건에 대한 표준 RPC 표현을 나타냅니다.
`observedGeneration` 정수	가장 최근에 조정된 리소스의 버전을 나타냅니다.

포트

표시 위치:

DeployedModelStatus

필드	설명
`predictorPorts` 정수 배열	예측 변수에서 노출할 HTTP 포트를 나열합니다. 요청은 나열된 첫 번째 포트 이외의 포트로 전달되지 않습니다. 이 필드는 Kubernetes 컨테이너 v1 핵심 API의 `ports` 필드에 해당합니다.
`predictorGRPCPorts` 정수 배열	예측 변수에서 노출할 gRPC 포트를 나열합니다. 이 필드가 생략되면 컨테이너에 대한 gRPC 요청이 사용 중지됩니다. 요청은 나열된 첫 번째 포트 이외의 포트로 전달되지 않습니다. 이 필드는 Kubernetes 컨테이너 v1 핵심 API의 `ports` 필드에 해당합니다.

ReplicaStatus

ResourcePool 리소스의 복제본 정보를 정의합니다.

표시 위치:

ResourcePoolStatus

필드	설명
`resourceType` ResourceType	리소스의 유형을 지정합니다.
`resourceName` 문자열	리소스 유형의 네임스페이스에 있는 고유한 리소스 이름을 나타냅니다. 예를 들어 `Deployment` `ResourceType`의 리소스 이름은 Kubernetes 배포 이름입니다.
`resourceNamespace` 문자열	리소스의 네임스페이스를 나타냅니다. 이 필드는 클러스터 범위 리소스에는 적용되지 않습니다.
`appType` 문자열	특정 제품에 의해 정의된 리소스의 애플리케이션 유형을 나타냅니다. 예를 들어 예측은 `predictor` 및 `explainer`을 `appType`로 지원합니다.
`availableReplicas` 정수	사용 가능한 복제본의 총수를 나타냅니다. Kubernetes 배포 리소스 유형의 경우 이 필드는 이 배포의 타겟이며 최소한 최소 준비 시간 동안 준비된 사용 가능한 총 포드 수를 나타냅니다.
`unavailableReplicas` 정수	사용할 수 없는 복제본의 총수를 나타냅니다. Kubernetes 배포 리소스 유형의 경우 배포에서 타겟팅한 사용할 수 없는 포드의 총수를 나타냅니다.

리소스 풀

ResourcePools API의 스키마를 정의합니다.

표시 위치:

ResourcePoolList

필드	설명
`apiVersion` 문자열	`prediction.aiplatform.gdc.goog/v1`
`kind` 문자열	`ResourcePool`
`metadata` ObjectMeta	`metadata` 필드는 Kubernetes API 문서를 참고하세요.
`spec` ResourcePoolSpec
`status` ResourcePoolStatus

ResourcePoolList

ResourcePool 리소스 목록이 포함됩니다.

필드	설명
`apiVersion` 문자열	`prediction.aiplatform.gdc.goog/v1`
`kind` 문자열	`ResourcePoolList`
`metadata` ListMeta	`metadata` 필드는 Kubernetes API 문서를 참고하세요.
`items` ResourcePool 배열

ResourcePoolSpec

ResourcePool 리소스의 예상 상태를 정의합니다.

표시 위치:

ResourcePool

필드	설명
`resourcePoolID` 문자열	`ResourcePool` 리소스의 시스템 생성 ID를 나타냅니다. 이 필드는 Google Cloud 및 GDCE에만 적용됩니다. 다음 태그는 `8`입니다.
`userProvidedID` 문자열	`ResourcePool` 리소스의 사용자 제공 ID를 나타냅니다. 이 필드는 Google Cloud 및 GDCE에만 적용됩니다.
`dedicatedResources` DedicatedResources	리소스 풀 전용 리소스의 설명을 포함합니다.
`enableContainerLogging` 불리언	`ResourcePool`에 컨테이너 로깅이 사용 설정되어 있는지 여부를 나타냅니다.
`userGsa` 문자열	사용자 프로젝트에서 사용자가 제공한 IAM 서비스 계정을 나타냅니다. 지정하지 않으면 기본 제공 서비스 계정이 사용됩니다.
`customKsaName` 문자열	운영자가 만들고 사용자 워크로드가 사용자 서비스 계정 사용 (BYOSA) 사례에만 사용하는 맞춤 이름을 지정합니다. 비어 있으면 시스템에서 기본 이름 지정 패턴을 사용합니다.
`rolloutStrategy` 잘못된 유형	이 풀에 배포된 모델을 모델 서버 복제본에 점진적으로 또는 한 번에 모두 출시해야 하는지 여부를 지정합니다.

ResourcePoolStatus

ResourcePool 리소스의 관찰된 상태를 정의합니다.

표시 위치:

ResourcePool

필드	설명
`ready` 불리언	리소스가 준비 상태인지 여부를 나타냅니다.
`primaryCondition`	리소스의 기본 조건을 나타냅니다. 리소스가 준비되면 조건은 리소스가 준비되었음을 나타냅니다. 그렇지 않으면 조건이 리소스가 준비되지 않은 기본 이유입니다.
`resourceConditions`	리소스 및 하위 리소스의 조건 모음을 나타냅니다. 이를 사용하여 리소스와 하위 리소스의 전반적인 상태를 확인할 수 있습니다.
`conditions` Condition 배열	디버깅 목적으로 Kubernetes 리소스에서 채워진 원시 리소스 조건을 나타냅니다.
`replicaStatuses` ReplicaStatus 배열
`rpcStatus` RpcStatus	ResourcePool의 기본 조건의 표준 RPC 표현을 나타냅니다.
`observedGeneration` 정수	가장 최근에 조정된 리소스의 버전을 나타냅니다.

경로

표시 위치:

DeployedModelStatus

필드	설명
`predictRoute` 문자열	예측 요청을 전송할 컨테이너의 라우팅 경로를 나타냅니다. Vertex AI는 `projects.locations.endpoints.predict`를 사용하여 컨테이너의 IP 주소 및 포트에서 이 경로로 요청을 전달합니다. 그런 다음 Vertex AI는 API 응답에서 컨테이너의 응답을 반환합니다.
`predictSystemRoute` 문자열	클러스터 인그레스로 예측 요청을 전송하는 시스템 라우팅 경로를 나타냅니다. 이 필드는 배포 중에 `deployedModel`에 복사되는 경우에만 내부적으로 채워집니다.
`healthRoute` 문자열	상태 점검을 전송할 컨테이너의 라우팅 경로를 나타냅니다. Vertex AI는 컨테이너의 IP 주소 및 포트에서 이 경로로 GET 요청을 간헐적으로 보내 컨테이너가 정상인지 확인합니다.
`healthSystemRoute` 문자열	클러스터 인그레스로 상태 확인 요청을 전송하는 시스템 라우팅 경로를 나타냅니다. 이 필드는 배포 중에 `deployedModel`에 복사되는 경우에만 내부적으로 채워집니다.

RpcStatus

RPC 코드와 메시지를 캡슐화합니다.

표시 위치:

DeployedModelStatus

필드	설명
`code` 코드	RPC 코드를 나타냅니다. 다음 태그는 `4`입니다.
`message` 문자열	조건에 관한 사용자 대상 설명을 포함합니다.
`terminalState` 불리언	리소스가 최종 상태에 도달하여 준비 상태가 될 수 없는 경우 `true` 값을 나타냅니다.