KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

O pacote v1 contém definições de esquema de API para o grupo de APIs v1 prediction.aiplatform.gdc.goog.

Escalonamento automático

Define os parâmetros de escalonamento automático para uma implantação.

Aparece em:

Campo Descrição
minReplica número inteiro Número mínimo de réplicas. O valor padrão é 1. A próxima tag é 5.
maxReplica número inteiro Número máximo de réplicas.
cpuTarget número inteiro O limite de uso da CPU para escalonar um pod.
gpuDutyCycleTarget número inteiro O limite de utilização do ciclo de trabalho da GPU para escalonar um pod.

DedicatedResources

Define os recursos dedicados a um pool de recursos. O próximo ID é 8.

Aparece em:

Campo Descrição
machineSpec Não é obrigatório. Especifica a configuração de uma única máquina usando o valor machineType. Se não for fornecido, um valor padrão será usado. Para previsão, o tipo de máquina padrão de uma implantação é n1-standard-2 (modelos baseados no GKE) ou n2-standard-2-gdc (modelos baseados em CPU).
autoscaling Escalonamento automático Especifica os parâmetros de escalonamento automático para as cargas de trabalho do usuário, por exemplo, a implantação do preditor para previsão.

DeployedModel

Define o esquema da API DeployedModels.

Aparece em:

Campo Descrição
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string DeployedModel
metadata ObjectMeta Consulte a documentação da API Kubernetes para saber mais sobre os campos de metadata.
spec DeployedModelSpec
status DeployedModelStatus

DeployedModelList

Contém uma lista de recursos DeployedModel.

Campo Descrição
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string DeployedModelList
metadata ListMeta Consulte a documentação da API Kubernetes para saber mais sobre os campos de metadata.
items DeployedModel

DeployedModelSpec

Define o estado esperado dos recursos DeployedModel.

Aparece em:

Campo Descrição
endpointPath string Especifica o nome do recurso do endpoint. O formato é projects/{project}/locations/{location}/endpoints/{endpoint-id}. A próxima tag é 6.
modelSpec tipo inválido Define a especificação do modelo necessária ao implantar o modelo.
resourcePoolRef ObjectReference Especifica a referência do pool de recursos com as especificações necessárias para este DeployedModel.
sharesResourcePool booleano Especifica se o DeployedModel compartilha um pool de recursos com outros modelos.

DeployedModelStatus

Define o estado observado do recurso DeployedModel.

Aparece em:

Campo Descrição
ready booleano Indica se o recurso está pronto.
primaryCondition Representa a condição principal de um recurso. Se o recurso estiver pronto, a condição vai indicar isso. Caso contrário, a condição é o motivo principal de o recurso não estar pronto.
resourceConditions matriz Representa uma coleção de condições para um recurso e seus sub-recursos. É possível usar esse recurso para determinar a integridade geral de um recurso e dos sub-recursos dele.
conditions Matriz de condição Representa condições de recursos brutos preenchidas com recursos do Kubernetes para fins de depuração.
routes Rotas Representa as rotas de contêiner ou sistema para a previsão ou verificação de integridade do modelo implantado.
ports Portas Representa as portas HTTP ou gRPC do contêiner.
rpcStatus RpcStatus Indica uma representação RPC canônica da condição principal do modelo implantado.
observedGeneration número inteiro Indica a revisão do recurso que foi reconciliada mais recentemente.

Portas

Aparece em:

Campo Descrição
predictorPorts matriz de números inteiros Lista as portas HTTP a serem expostas do preditor. As solicitações não são encaminhadas para portas diferentes da primeira listada. Esse campo corresponde ao campo ports da API principal v1 de contêineres do Kubernetes.
predictorGRPCPorts matriz de números inteiros Lista as portas gRPC a serem expostas do preditor. Se esse campo for omitido, as solicitações gRPC ao contêiner serão desativadas. As solicitações não são encaminhadas para portas diferentes da primeira listada. Esse campo corresponde ao campo ports da API principal v1 de contêineres do Kubernetes.

ReplicaStatus

Define as informações de réplica do recurso ResourcePool.

Aparece em:

Campo Descrição
resourceType ResourceType Especifica o tipo do recurso.
resourceName string Indica o nome exclusivo do recurso no namespace do tipo de recurso. Por exemplo, um Deployment ResourceType tem o nome da implantação do Kubernetes como nome do recurso.
resourceNamespace string Indica o namespace do recurso. Esse campo não se aplica a recursos com escopo no cluster.
appType string Indica o tipo de aplicativo do recurso, definido por um produto específico. Por exemplo, Prediction aceita predictor e explainer como appType.
availableReplicas número inteiro Indica o número total de réplicas disponíveis. Para o tipo de recurso de implantação do Kubernetes, esse campo representa o número total de pods disponíveis, prontos por pelo menos um mínimo de segundos, segmentados por essa implantação.
unavailableReplicas número inteiro Indica o número total de réplicas indisponíveis. Para o tipo de recurso de implantação do Kubernetes, ele representa o número total de pods indisponíveis segmentados pela implantação.

ResourcePool

Define o esquema da API ResourcePools.

Aparece em:

Campo Descrição
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string ResourcePool
metadata ObjectMeta Consulte a documentação da API Kubernetes para saber mais sobre os campos de metadata.
spec ResourcePoolSpec
status ResourcePoolStatus

ResourcePoolList

Contém uma lista de recursos ResourcePool.

Campo Descrição
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string ResourcePoolList
metadata ListMeta Consulte a documentação da API Kubernetes para saber mais sobre os campos de metadata.
items Matriz ResourcePool

ResourcePoolSpec

Define o estado esperado dos recursos ResourcePool.

Aparece em:

Campo Descrição
resourcePoolID string Representa o ID gerado pelo sistema do recurso ResourcePool. Esse campo só é aplicável ao Google Cloud e ao GDCE. A próxima tag é 8.
userProvidedID string Representa o ID fornecido pelo usuário do recurso ResourcePool. Esse campo só é aplicável ao Google Cloud e ao GDCE.
dedicatedResources DedicatedResources Contém uma descrição dos recursos dedicados ao pool de recursos.
enableContainerLogging booleano Indica se a geração de registros de contêineres está ativada para o ResourcePool.
userGsa string Indica a conta de serviço do IAM fornecida pelo usuário no projeto dele. Se não for especificada, a conta de serviço padrão será usada.
customKsaName string Especifica o nome personalizado que o operador cria e que a carga de trabalho do usuário usa apenas para casos de conta de serviço do usuário (BYOSA, na sigla em inglês). Se estiver vazio, o sistema usará o padrão de nomenclatura padrão.
rolloutStrategy tipo inválido Especifica se os modelos implantados nesse pool precisam ser lançados gradualmente ou de uma só vez para as réplicas do servidor de modelos.

ResourcePoolStatus

Define o estado observado dos recursos ResourcePool.

Aparece em:

Campo Descrição
ready booleano Indica se o recurso está pronto.
primaryCondition Representa a condição principal de um recurso. Se o recurso estiver pronto, a condição vai indicar isso. Caso contrário, a condição é o motivo principal de o recurso não estar pronto.
resourceConditions Representa uma coleção de condições para um recurso e seus sub-recursos. É possível usar esse recurso para determinar a integridade geral de um recurso e dos sub-recursos dele.
conditions Matriz de condição Representa condições de recursos brutos preenchidas com recursos do Kubernetes para fins de depuração.
replicaStatuses Matriz de ReplicaStatus
rpcStatus RpcStatus Indica uma representação RPC canônica da condição principal do ResourcePool.
observedGeneration número inteiro Indica qual revisão do recurso foi reconciliada mais recentemente.

Rotas

Aparece em:

Campo Descrição
predictRoute string Representa o caminho de roteamento no contêiner para enviar solicitações de previsão. A Vertex AI encaminha solicitações usando projects.locations.endpoints.predict para esse caminho no endereço IP e na porta do contêiner. Em seguida, a Vertex AI retorna a resposta do contêiner na resposta da API.
predictSystemRoute string Representa o caminho de roteamento do sistema para enviar solicitações de previsão para a entrada do cluster. Esse campo é preenchido internamente apenas quando é copiado para o deployedModel durante a implantação.
healthRoute string Representa o caminho de roteamento no contêiner para enviar verificações de integridade. A Vertex AI envia solicitações GET intermitentes para esse caminho no endereço IP e na porta do contêiner para verificar se ele está íntegro.
healthSystemRoute string Representa o caminho de roteamento do sistema para enviar solicitações de verificação de integridade à entrada do cluster. Esse campo é preenchido internamente apenas quando é copiado para o deployedModel durante a implantação.

RpcStatus

Encapsula um código RPC e uma mensagem.

Aparece em:

Campo Descrição
code Código Representa o código RPC. A próxima tag é 4.
message string Contém uma descrição da condição voltada para o usuário.
terminalState booleano Indica um valor de true se o recurso atingiu um estado final e não pode ficar pronto.