Esta página foi traduzida pela API Cloud Translation.

KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

O pacote v1 contém definições de esquema de API para o grupo de APIs v1 prediction.aiplatform.gdc.goog.

Escalonamento automático

Define os parâmetros de escalonamento automático para uma implantação.

Aparece em:

DedicatedResources

Campo	Descrição
`minReplica` número inteiro	Número mínimo de réplicas. O valor padrão é `1`. A próxima tag é `5`.
`maxReplica` número inteiro	Número máximo de réplicas.
`cpuTarget` número inteiro	O limite de uso da CPU para escalonar um pod.
`gpuDutyCycleTarget` número inteiro	O limite de utilização do ciclo de trabalho da GPU para escalonar um pod.

DedicatedResources

Define os recursos dedicados a um pool de recursos. O próximo ID é 8.

Aparece em:

ResourcePoolSpec

Campo	Descrição
`machineSpec`	Não é obrigatório. Especifica a configuração de uma única máquina usando o valor `machineType`. Se não for fornecido, um valor padrão será usado. Para previsão, o tipo de máquina padrão de uma implantação é `n1-standard-2` (modelos baseados no GKE) ou `n2-standard-2-gdc` (modelos baseados em CPU).
`autoscaling` Escalonamento automático	Especifica os parâmetros de escalonamento automático para as cargas de trabalho do usuário, por exemplo, a implantação do preditor para previsão.

DeployedModel

Define o esquema da API DeployedModels.

Aparece em:

DeployedModelList

Campo	Descrição
`apiVersion` string	`prediction.aiplatform.gdc.goog/v1`
`kind` string	`DeployedModel`
`metadata` ObjectMeta	Consulte a documentação da API Kubernetes para saber mais sobre os campos de `metadata`.
`spec` DeployedModelSpec
`status` DeployedModelStatus

DeployedModelList

Contém uma lista de recursos DeployedModel.

Campo	Descrição
`apiVersion` string	`prediction.aiplatform.gdc.goog/v1`
`kind` string	`DeployedModelList`
`metadata` ListMeta	Consulte a documentação da API Kubernetes para saber mais sobre os campos de `metadata`.
`items` DeployedModel

DeployedModelSpec

Define o estado esperado dos recursos DeployedModel.

Aparece em:

DeployedModel

Campo	Descrição
`endpointPath` string	Especifica o nome do recurso do endpoint. O formato é `projects/{project}/locations/{location}/endpoints/{endpoint-id}`. A próxima tag é `6`.
`modelSpec` tipo inválido	Define a especificação do modelo necessária ao implantar o modelo.
`resourcePoolRef` ObjectReference	Especifica a referência do pool de recursos com as especificações necessárias para este `DeployedModel`.
`sharesResourcePool` booleano	Especifica se o `DeployedModel` compartilha um pool de recursos com outros modelos.

DeployedModelStatus

Define o estado observado do recurso DeployedModel.

Aparece em:

DeployedModel

Campo	Descrição
`ready` booleano	Indica se o recurso está pronto.
`primaryCondition`	Representa a condição principal de um recurso. Se o recurso estiver pronto, a condição vai indicar isso. Caso contrário, a condição é o motivo principal de o recurso não estar pronto.
`resourceConditions` matriz	Representa uma coleção de condições para um recurso e seus sub-recursos. É possível usar esse recurso para determinar a integridade geral de um recurso e dos sub-recursos dele.
`conditions` Matriz de condição	Representa condições de recursos brutos preenchidas com recursos do Kubernetes para fins de depuração.
`routes` Rotas	Representa as rotas de contêiner ou sistema para a previsão ou verificação de integridade do modelo implantado.
`ports` Portas	Representa as portas HTTP ou gRPC do contêiner.
`rpcStatus` RpcStatus	Indica uma representação RPC canônica da condição principal do modelo implantado.
`observedGeneration` número inteiro	Indica a revisão do recurso que foi reconciliada mais recentemente.

Portas

Aparece em:

DeployedModelStatus

Campo	Descrição
`predictorPorts` matriz de números inteiros	Lista as portas HTTP a serem expostas do preditor. As solicitações não são encaminhadas para portas diferentes da primeira listada. Esse campo corresponde ao campo `ports` da API principal v1 de contêineres do Kubernetes.
`predictorGRPCPorts` matriz de números inteiros	Lista as portas gRPC a serem expostas do preditor. Se esse campo for omitido, as solicitações gRPC ao contêiner serão desativadas. As solicitações não são encaminhadas para portas diferentes da primeira listada. Esse campo corresponde ao campo `ports` da API principal v1 de contêineres do Kubernetes.

ReplicaStatus

Define as informações de réplica do recurso ResourcePool.

Aparece em:

ResourcePoolStatus

Campo	Descrição
`resourceType` ResourceType	Especifica o tipo do recurso.
`resourceName` string	Indica o nome exclusivo do recurso no namespace do tipo de recurso. Por exemplo, um `Deployment` `ResourceType` tem o nome da implantação do Kubernetes como nome do recurso.
`resourceNamespace` string	Indica o namespace do recurso. Esse campo não se aplica a recursos com escopo no cluster.
`appType` string	Indica o tipo de aplicativo do recurso, definido por um produto específico. Por exemplo, Prediction aceita `predictor` e `explainer` como `appType`.
`availableReplicas` número inteiro	Indica o número total de réplicas disponíveis. Para o tipo de recurso de implantação do Kubernetes, esse campo representa o número total de pods disponíveis, prontos por pelo menos um mínimo de segundos, segmentados por essa implantação.
`unavailableReplicas` número inteiro	Indica o número total de réplicas indisponíveis. Para o tipo de recurso de implantação do Kubernetes, ele representa o número total de pods indisponíveis segmentados pela implantação.

ResourcePool

Define o esquema da API ResourcePools.

Aparece em:

ResourcePoolList

Campo	Descrição
`apiVersion` string	`prediction.aiplatform.gdc.goog/v1`
`kind` string	`ResourcePool`
`metadata` ObjectMeta	Consulte a documentação da API Kubernetes para saber mais sobre os campos de `metadata`.
`spec` ResourcePoolSpec
`status` ResourcePoolStatus

ResourcePoolList

Contém uma lista de recursos ResourcePool.

Campo	Descrição
`apiVersion` string	`prediction.aiplatform.gdc.goog/v1`
`kind` string	`ResourcePoolList`
`metadata` ListMeta	Consulte a documentação da API Kubernetes para saber mais sobre os campos de `metadata`.
`items` Matriz ResourcePool

ResourcePoolSpec

Define o estado esperado dos recursos ResourcePool.

Aparece em:

ResourcePool

Campo	Descrição
`resourcePoolID` string	Representa o ID gerado pelo sistema do recurso `ResourcePool`. Esse campo só é aplicável ao Google Cloud e ao GDCE. A próxima tag é `8`.
`userProvidedID` string	Representa o ID fornecido pelo usuário do recurso `ResourcePool`. Esse campo só é aplicável ao Google Cloud e ao GDCE.
`dedicatedResources` DedicatedResources	Contém uma descrição dos recursos dedicados ao pool de recursos.
`enableContainerLogging` booleano	Indica se a geração de registros de contêineres está ativada para o `ResourcePool`.
`userGsa` string	Indica a conta de serviço do IAM fornecida pelo usuário no projeto dele. Se não for especificada, a conta de serviço padrão será usada.
`customKsaName` string	Especifica o nome personalizado que o operador cria e que a carga de trabalho do usuário usa apenas para casos de conta de serviço do usuário (BYOSA, na sigla em inglês). Se estiver vazio, o sistema usará o padrão de nomenclatura padrão.
`rolloutStrategy` tipo inválido	Especifica se os modelos implantados nesse pool precisam ser lançados gradualmente ou de uma só vez para as réplicas do servidor de modelos.

ResourcePoolStatus

Define o estado observado dos recursos ResourcePool.

Aparece em:

ResourcePool

Campo	Descrição
`ready` booleano	Indica se o recurso está pronto.
`primaryCondition`	Representa a condição principal de um recurso. Se o recurso estiver pronto, a condição vai indicar isso. Caso contrário, a condição é o motivo principal de o recurso não estar pronto.
`resourceConditions`	Representa uma coleção de condições para um recurso e seus sub-recursos. É possível usar esse recurso para determinar a integridade geral de um recurso e dos sub-recursos dele.
`conditions` Matriz de condição	Representa condições de recursos brutos preenchidas com recursos do Kubernetes para fins de depuração.
`replicaStatuses` Matriz de ReplicaStatus
`rpcStatus` RpcStatus	Indica uma representação RPC canônica da condição principal do ResourcePool.
`observedGeneration` número inteiro	Indica qual revisão do recurso foi reconciliada mais recentemente.

Rotas

Aparece em:

DeployedModelStatus

Campo	Descrição
`predictRoute` string	Representa o caminho de roteamento no contêiner para enviar solicitações de previsão. A Vertex AI encaminha solicitações usando `projects.locations.endpoints.predict` para esse caminho no endereço IP e na porta do contêiner. Em seguida, a Vertex AI retorna a resposta do contêiner na resposta da API.
`predictSystemRoute` string	Representa o caminho de roteamento do sistema para enviar solicitações de previsão para a entrada do cluster. Esse campo é preenchido internamente apenas quando é copiado para o `deployedModel` durante a implantação.
`healthRoute` string	Representa o caminho de roteamento no contêiner para enviar verificações de integridade. A Vertex AI envia solicitações GET intermitentes para esse caminho no endereço IP e na porta do contêiner para verificar se ele está íntegro.
`healthSystemRoute` string	Representa o caminho de roteamento do sistema para enviar solicitações de verificação de integridade à entrada do cluster. Esse campo é preenchido internamente apenas quando é copiado para o `deployedModel` durante a implantação.

RpcStatus

Encapsula um código RPC e uma mensagem.

Aparece em:

DeployedModelStatus

Campo	Descrição
`code` Código	Representa o código RPC. A próxima tag é `4`.
`message` string	Contém uma descrição da condição voltada para o usuário.
`terminalState` booleano	Indica um valor de `true` se o recurso atingiu um estado final e não pode ficar pronto.