Esta página foi traduzida pela API Cloud Translation.

KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

O pacote v1 contém definições do esquema da API para o grupo de APIs prediction.aiplatform.gdc.goog v1.

Escala automática

Define os parâmetros de escalabilidade automática para uma implementação.

Aparece em:

DedicatedResources

Campo	Descrição
`minReplica` número inteiro	Número mínimo de réplicas. O valor predefinido é `1`. A etiqueta seguinte é `5`.
`maxReplica` número inteiro	Número máximo de réplicas.
`cpuTarget` número inteiro	O limite de utilização da CPU para aumentar a escala de um pod.
`gpuDutyCycleTarget` número inteiro	O limite da utilização do ciclo de atividade da GPU para aumentar um pod.

DedicatedResources

Define os recursos dedicados a um conjunto de recursos. O próximo ID é 8.

Aparece em:

ResourcePoolSpec

Campo	Descrição
`machineSpec`	Não é obrigatório. Especifica a configuração de uma única máquina através do valor `machineType`. Se não for fornecido, é usado um valor predefinido. Para a previsão, o tipo de máquina predefinido para uma implementação é `n1-standard-2` (modelos baseados no GKE) ou `n2-standard-2-gdc` (modelos baseados na CPU).
`autoscaling` Ajuste de escala automático	Especifica os parâmetros de dimensionamento automático para as cargas de trabalho do utilizador, por exemplo, a implementação do preditor para a previsão.

DeployedModel

Define o esquema para a API DeployedModels.

Aparece em:

DeployedModelList

Campo	Descrição
`apiVersion` string	`prediction.aiplatform.gdc.goog/v1`
`kind` string	`DeployedModel`
`metadata` ObjectMeta	Consulte a documentação da API Kubernetes para os campos de `metadata`.
`spec` DeployedModelSpec
`status` DeployedModelStatus

DeployedModelList

Contém uma lista de recursos DeployedModel.

Campo	Descrição
`apiVersion` string	`prediction.aiplatform.gdc.goog/v1`
`kind` string	`DeployedModelList`
`metadata` ListMeta	Consulte a documentação da API Kubernetes para os campos de `metadata`.
`items` DeployedModel

DeployedModelSpec

Define o estado esperado dos recursos DeployedModel.

Aparece em:

DeployedModel

Campo	Descrição
`endpointPath` string	Especifica o nome do recurso do ponto final. O formato é `projects/{project}/locations/{location}/endpoints/{endpoint-id}`. A etiqueta seguinte é `6`.
`modelSpec` tipo inválido	Define a especificação do modelo necessária quando implementa o modelo.
`resourcePoolRef` ObjectReference	Especifica a referência do conjunto de recursos com as especificações de recursos necessárias para este `DeployedModel`.
`sharesResourcePool` booleano	Especifica se o `DeployedModel` partilha um conjunto de recursos com outros modelos.

DeployedModelStatus

Define o estado observado do recurso DeployedModel.

Aparece em:

DeployedModel

Campo	Descrição
`ready` booleano	Indica se o recurso está pronto.
`primaryCondition`	Representa a condição principal de um recurso. Se o recurso estiver pronto, a condição indica que o recurso está pronto. Caso contrário, a condição é o motivo principal pelo qual o recurso não está pronto.
`resourceConditions` array	Representa uma coleção de condições para um recurso e os respetivos sub-recursos. Pode usá-lo para determinar o estado geral de um recurso e dos respetivos sub-recursos.
`conditions` Matriz de condições	Representa as condições de recursos não processados preenchidas a partir de recursos do Kubernetes para fins de depuração.
`routes` Trajetos	Representa as rotas do contentor ou do sistema para a previsão do modelo implementado ou a verificação do estado de funcionamento.
`ports` Portas	Representa as portas HTTP ou gRPC do contentor.
`rpcStatus` RpcStatus	Indica uma representação RPC canónica da condição principal do modelo implementado.
`observedGeneration` número inteiro	Indica a revisão do recurso que foi reconciliada mais recentemente.

Portas

Aparece em:

DeployedModelStatus

Campo	Descrição
`predictorPorts` matriz de números inteiros	Lista as portas HTTP a expor do preditor. Os pedidos não são encaminhados para portas que não sejam a primeira da lista. Este campo corresponde ao campo `ports` da API principal v1 de contentores do Kubernetes.
`predictorGRPCPorts` matriz de números inteiros	Lista as portas gRPC a expor a partir do preditor. Se este campo for omitido, os pedidos gRPC para o contentor são desativados. Os pedidos não são encaminhados para portas que não sejam a primeira da lista. Este campo corresponde ao campo `ports` da API principal v1 de contentores do Kubernetes.

ReplicaStatus

Define as informações da réplica do recurso ResourcePool.

Aparece em:

ResourcePoolStatus

Campo	Descrição
`resourceType` ResourceType	Especifica o tipo de recurso.
`resourceName` string	Indica o nome de recurso exclusivo no espaço de nomes do tipo de recurso. Por exemplo, um `Deployment` `ResourceType` tem o nome da implementação do Kubernetes como nome do recurso.
`resourceNamespace` string	Indica o espaço de nomes do recurso. Este campo não é aplicável a recursos com âmbito de cluster.
`appType` string	Indica o tipo de aplicação do recurso, definido por um produto específico. Por exemplo, a previsão suporta `predictor` e `explainer` como `appType`.
`availableReplicas` número inteiro	Indica o número total de réplicas disponíveis. Para o tipo de recurso de implementação do Kubernetes, este campo representa o número total de pods disponíveis, prontos durante, pelo menos, um mínimo de segundos, segmentados por esta implementação.
`unavailableReplicas` número inteiro	Indica o número total de réplicas indisponíveis. Para o tipo de recurso de implementação do Kubernetes, representa o número total de pods indisponíveis segmentados pela implementação.

ResourcePool

Define o esquema para a API ResourcePools.

Aparece em:

ResourcePoolList

Campo	Descrição
`apiVersion` string	`prediction.aiplatform.gdc.goog/v1`
`kind` string	`ResourcePool`
`metadata` ObjectMeta	Consulte a documentação da API Kubernetes para os campos de `metadata`.
`spec` ResourcePoolSpec
`status` ResourcePoolStatus

ResourcePoolList

Contém uma lista de recursos ResourcePool.

Campo	Descrição
`apiVersion` string	`prediction.aiplatform.gdc.goog/v1`
`kind` string	`ResourcePoolList`
`metadata` ListMeta	Consulte a documentação da API Kubernetes para os campos de `metadata`.
`items` ResourcePool

ResourcePoolSpec

Define o estado esperado dos recursos ResourcePool.

Aparece em:

ResourcePool

Campo	Descrição
`resourcePoolID` string	Representa o ID gerado pelo sistema do recurso `ResourcePool`. Este campo só é aplicável ao Google Cloud e ao GDCE. A etiqueta seguinte é `8`.
`userProvidedID` string	Representa o ID fornecido pelo utilizador do recurso `ResourcePool`. Este campo só é aplicável ao Google Cloud e ao GDCE.
`dedicatedResources` DedicatedResources	Contém uma descrição dos recursos dedicados ao conjunto de recursos.
`enableContainerLogging` booleano	Indica se o registo do contentor está ativado para o `ResourcePool`.
`userGsa` string	Indica a conta de serviço do IAM fornecida pelo utilizador no projeto do utilizador. Se não for especificada, é usada a conta de serviço de publicação predefinida.
`customKsaName` string	Especifica o nome personalizado que o operador cria e a carga de trabalho do utilizador usa apenas para casos de trazer a sua própria conta de serviço (BYOSA). Se estiver vazio, o sistema usa o padrão de nomenclatura predefinido.
`rolloutStrategy` tipo inválido	Especifica se os modelos implementados neste conjunto têm de ser implementados nas réplicas do servidor de modelos gradualmente ou de uma só vez.

ResourcePoolStatus

Define o estado observado dos recursos ResourcePool.

Aparece em:

ResourcePool

Campo	Descrição
`ready` booleano	Indica se o recurso está pronto.
`primaryCondition`	Representa a condição principal de um recurso. Se o recurso estiver pronto, a condição indica que o recurso está pronto. Caso contrário, a condição é o motivo principal pelo qual o recurso não está pronto.
`resourceConditions`	Representa uma coleção de condições para um recurso e os respetivos sub-recursos. Pode usá-lo para determinar o estado geral de um recurso e dos respetivos sub-recursos.
`conditions` Matriz de condições	Representa as condições de recursos não processados preenchidas a partir de recursos do Kubernetes para fins de depuração.
`replicaStatuses` ReplicaStatus array
`rpcStatus` RpcStatus	Indica uma representação RPC canónica da condição principal do ResourcePool.
`observedGeneration` número inteiro	Indica que revisão do recurso foi reconciliada mais recentemente.

Trajetos

Aparece em:

DeployedModelStatus

Campo	Descrição
`predictRoute` string	Representa o caminho de encaminhamento no contentor para enviar pedidos de previsão. O Vertex AI encaminha pedidos através de `projects.locations.endpoints.predict` para este caminho no endereço IP e na porta do contentor. Em seguida, a Vertex AI devolve a resposta do contentor na resposta da API.
`predictSystemRoute` string	Representa o caminho de encaminhamento do sistema para enviar pedidos de previsão para a entrada do cluster. Este campo é preenchido apenas internamente quando é copiado para o `deployedModel` durante a implementação.
`healthRoute` string	Representa o caminho de encaminhamento no contentor para enviar verificações de funcionamento. O Vertex AI envia intermitentemente pedidos GET para este caminho no endereço IP e na porta do contentor para verificar se o contentor está em bom estado.
`healthSystemRoute` string	Representa o caminho de encaminhamento do sistema para enviar pedidos de verificação de estado ao ponto de entrada do cluster. Este campo é preenchido apenas internamente quando é copiado para o `deployedModel` durante a implementação.

RpcStatus

Encapsula um código RPC e uma mensagem.

Aparece em:

DeployedModelStatus

Campo	Descrição
`code` Código	Representa o código RPC. A etiqueta seguinte é `4`.
`message` string	Contém uma descrição da condição visível para o utilizador.
`terminalState` booleano	Indica um valor de `true` se o recurso tiver atingido um estado terminal e não puder ficar pronto.