prediction.aiplatform.gdc.goog/v1
O pacote v1 contém definições de esquema de API para o grupo de APIs v1 prediction.aiplatform.gdc.goog.
Escalonamento automático
Define os parâmetros de escalonamento automático para uma implantação.
Aparece em:
Campo | Descrição |
---|---|
minReplica número inteiro |
Número mínimo de réplicas. O valor padrão é 1 . A próxima tag é 5 . |
maxReplica número inteiro |
Número máximo de réplicas. |
cpuTarget número inteiro |
O limite de uso da CPU para escalonar um pod. |
gpuDutyCycleTarget número inteiro |
O limite de utilização do ciclo de trabalho da GPU para escalonar um pod. |
DedicatedResources
Define os recursos dedicados a um pool de recursos. O próximo ID é 8
.
Aparece em:
Campo | Descrição |
---|---|
machineSpec |
Não é obrigatório. Especifica a configuração de uma única máquina usando o valor machineType . Se não for fornecido, um valor padrão será usado. Para previsão, o tipo de máquina padrão de uma implantação é n1-standard-2 (modelos baseados no GKE) ou n2-standard-2-gdc (modelos baseados em CPU). |
autoscaling Escalonamento automático |
Especifica os parâmetros de escalonamento automático para as cargas de trabalho do usuário, por exemplo, a implantação do preditor para previsão. |
DeployedModel
Define o esquema da API DeployedModels
.
Aparece em:
Campo | Descrição |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
DeployedModel |
metadata ObjectMeta |
Consulte a documentação da API Kubernetes para saber mais sobre os campos de metadata . |
spec DeployedModelSpec |
|
status DeployedModelStatus |
DeployedModelList
Contém uma lista de recursos DeployedModel
.
Campo | Descrição |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
DeployedModelList |
metadata ListMeta |
Consulte a documentação da API Kubernetes para saber mais sobre os campos de metadata . |
items DeployedModel |
DeployedModelSpec
Define o estado esperado dos recursos DeployedModel
.
Aparece em:
Campo | Descrição |
---|---|
endpointPath string |
Especifica o nome do recurso do endpoint. O formato é projects/{project}/locations/{location}/endpoints/{endpoint-id} . A próxima tag é 6 . |
modelSpec tipo inválido |
Define a especificação do modelo necessária ao implantar o modelo. |
resourcePoolRef ObjectReference |
Especifica a referência do pool de recursos com as especificações necessárias para este DeployedModel . |
sharesResourcePool booleano |
Especifica se o DeployedModel compartilha um pool de recursos com outros modelos. |
DeployedModelStatus
Define o estado observado do recurso DeployedModel
.
Aparece em:
Campo | Descrição |
---|---|
ready booleano |
Indica se o recurso está pronto. |
primaryCondition |
Representa a condição principal de um recurso. Se o recurso estiver pronto, a condição vai indicar isso. Caso contrário, a condição é o motivo principal de o recurso não estar pronto. |
resourceConditions matriz |
Representa uma coleção de condições para um recurso e seus sub-recursos. É possível usar esse recurso para determinar a integridade geral de um recurso e dos sub-recursos dele. |
conditions Matriz de condição |
Representa condições de recursos brutos preenchidas com recursos do Kubernetes para fins de depuração. |
routes Rotas |
Representa as rotas de contêiner ou sistema para a previsão ou verificação de integridade do modelo implantado. |
ports Portas |
Representa as portas HTTP ou gRPC do contêiner. |
rpcStatus RpcStatus |
Indica uma representação RPC canônica da condição principal do modelo implantado. |
observedGeneration número inteiro |
Indica a revisão do recurso que foi reconciliada mais recentemente. |
Portas
Aparece em:
Campo | Descrição |
---|---|
predictorPorts matriz de números inteiros
|
Lista as portas HTTP a serem expostas do preditor. As solicitações não são encaminhadas para portas diferentes da primeira listada. Esse campo corresponde ao campo ports da API principal v1 de contêineres do Kubernetes. |
predictorGRPCPorts matriz de números inteiros
|
Lista as portas gRPC a serem expostas do preditor. Se esse campo for omitido, as solicitações gRPC ao contêiner serão desativadas. As solicitações não são encaminhadas para portas diferentes da primeira listada. Esse campo corresponde ao campo ports da API principal v1 de contêineres do Kubernetes. |
ReplicaStatus
Define as informações de réplica do recurso ResourcePool
.
Aparece em:
Campo | Descrição |
---|---|
resourceType ResourceType |
Especifica o tipo do recurso. |
resourceName string |
Indica o nome exclusivo do recurso no namespace do tipo de recurso. Por exemplo, um Deployment ResourceType tem o nome da implantação do Kubernetes como nome do recurso. |
resourceNamespace string |
Indica o namespace do recurso. Esse campo não se aplica a recursos com escopo no cluster. |
appType string |
Indica o tipo de aplicativo do recurso, definido por um produto específico. Por exemplo, Prediction aceita predictor e explainer como appType . |
availableReplicas número inteiro |
Indica o número total de réplicas disponíveis. Para o tipo de recurso de implantação do Kubernetes, esse campo representa o número total de pods disponíveis, prontos por pelo menos um mínimo de segundos, segmentados por essa implantação. |
unavailableReplicas número inteiro |
Indica o número total de réplicas indisponíveis. Para o tipo de recurso de implantação do Kubernetes, ele representa o número total de pods indisponíveis segmentados pela implantação. |
ResourcePool
Define o esquema da API ResourcePools
.
Aparece em:
Campo | Descrição |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
ResourcePool |
metadata ObjectMeta |
Consulte a documentação da API Kubernetes para saber mais sobre os campos de metadata . |
spec ResourcePoolSpec |
|
status ResourcePoolStatus |
ResourcePoolList
Contém uma lista de recursos ResourcePool
.
Campo | Descrição |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
ResourcePoolList |
metadata ListMeta |
Consulte a documentação da API Kubernetes para saber mais sobre os campos de metadata . |
items Matriz ResourcePool |
ResourcePoolSpec
Define o estado esperado dos recursos ResourcePool
.
Aparece em:
Campo | Descrição |
---|---|
resourcePoolID string |
Representa o ID gerado pelo sistema do recurso ResourcePool . Esse campo só é aplicável ao Google Cloud e ao GDCE. A próxima tag é 8 . |
userProvidedID string |
Representa o ID fornecido pelo usuário do recurso ResourcePool . Esse campo só é aplicável ao Google Cloud e ao GDCE. |
dedicatedResources DedicatedResources |
Contém uma descrição dos recursos dedicados ao pool de recursos. |
enableContainerLogging booleano |
Indica se a geração de registros de contêineres está ativada para o ResourcePool . |
userGsa string |
Indica a conta de serviço do IAM fornecida pelo usuário no projeto dele. Se não for especificada, a conta de serviço padrão será usada. |
customKsaName string |
Especifica o nome personalizado que o operador cria e que a carga de trabalho do usuário usa apenas para casos de conta de serviço do usuário (BYOSA, na sigla em inglês). Se estiver vazio, o sistema usará o padrão de nomenclatura padrão. |
rolloutStrategy tipo inválido |
Especifica se os modelos implantados nesse pool precisam ser lançados gradualmente ou de uma só vez para as réplicas do servidor de modelos. |
ResourcePoolStatus
Define o estado observado dos recursos ResourcePool
.
Aparece em:
Campo | Descrição |
---|---|
ready booleano |
Indica se o recurso está pronto. |
primaryCondition |
Representa a condição principal de um recurso. Se o recurso estiver pronto, a condição vai indicar isso. Caso contrário, a condição é o motivo principal de o recurso não estar pronto. |
resourceConditions |
Representa uma coleção de condições para um recurso e seus sub-recursos. É possível usar esse recurso para determinar a integridade geral de um recurso e dos sub-recursos dele. |
conditions Matriz de condição |
Representa condições de recursos brutos preenchidas com recursos do Kubernetes para fins de depuração. |
replicaStatuses Matriz de ReplicaStatus |
|
rpcStatus RpcStatus |
Indica uma representação RPC canônica da condição principal do ResourcePool. |
observedGeneration número inteiro |
Indica qual revisão do recurso foi reconciliada mais recentemente. |
Rotas
Aparece em:
Campo | Descrição |
---|---|
predictRoute string |
Representa o caminho de roteamento no contêiner para enviar solicitações de previsão. A Vertex AI encaminha solicitações usando projects.locations.endpoints.predict para esse caminho no endereço IP e na porta do contêiner. Em seguida, a Vertex AI retorna a resposta do contêiner na resposta da API. |
predictSystemRoute string |
Representa o caminho de roteamento do sistema para enviar solicitações de previsão para a entrada do cluster. Esse campo é preenchido internamente apenas quando é copiado para o deployedModel durante a implantação. |
healthRoute string |
Representa o caminho de roteamento no contêiner para enviar verificações de integridade. A Vertex AI envia solicitações GET intermitentes para esse caminho no endereço IP e na porta do contêiner para verificar se ele está íntegro. |
healthSystemRoute string |
Representa o caminho de roteamento do sistema para enviar solicitações de verificação de integridade à entrada do cluster. Esse campo é preenchido internamente apenas quando é copiado para o deployedModel durante a implantação. |
RpcStatus
Encapsula um código RPC e uma mensagem.
Aparece em:
Campo | Descrição |
---|---|
code Código |
Representa o código RPC. A próxima tag é 4 . |
message string |
Contém uma descrição da condição voltada para o usuário. |
terminalState booleano |
Indica um valor de true se o recurso atingiu um estado final e não pode ficar pronto. |