KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

O pacote v1 contém definições do esquema da API para o grupo de APIs prediction.aiplatform.gdc.goog v1.

Escala automática

Define os parâmetros de escalabilidade automática para uma implementação.

Aparece em:

Campo Descrição
minReplica número inteiro Número mínimo de réplicas. O valor predefinido é 1. A etiqueta seguinte é 5.
maxReplica número inteiro Número máximo de réplicas.
cpuTarget número inteiro O limite de utilização da CPU para aumentar a escala de um pod.
gpuDutyCycleTarget número inteiro O limite da utilização do ciclo de atividade da GPU para aumentar um pod.

DedicatedResources

Define os recursos dedicados a um conjunto de recursos. O próximo ID é 8.

Aparece em:

Campo Descrição
machineSpec Não é obrigatório. Especifica a configuração de uma única máquina através do valor machineType. Se não for fornecido, é usado um valor predefinido. Para a previsão, o tipo de máquina predefinido para uma implementação é n1-standard-2 (modelos baseados no GKE) ou n2-standard-2-gdc (modelos baseados na CPU).
autoscaling Ajuste de escala automático Especifica os parâmetros de dimensionamento automático para as cargas de trabalho do utilizador, por exemplo, a implementação do preditor para a previsão.

DeployedModel

Define o esquema para a API DeployedModels.

Aparece em:

Campo Descrição
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string DeployedModel
metadata ObjectMeta Consulte a documentação da API Kubernetes para os campos de metadata.
spec DeployedModelSpec
status DeployedModelStatus

DeployedModelList

Contém uma lista de recursos DeployedModel.

Campo Descrição
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string DeployedModelList
metadata ListMeta Consulte a documentação da API Kubernetes para os campos de metadata.
items DeployedModel

DeployedModelSpec

Define o estado esperado dos recursos DeployedModel.

Aparece em:

Campo Descrição
endpointPath string Especifica o nome do recurso do ponto final. O formato é projects/{project}/locations/{location}/endpoints/{endpoint-id}. A etiqueta seguinte é 6.
modelSpec tipo inválido Define a especificação do modelo necessária quando implementa o modelo.
resourcePoolRef ObjectReference Especifica a referência do conjunto de recursos com as especificações de recursos necessárias para este DeployedModel.
sharesResourcePool booleano Especifica se o DeployedModel partilha um conjunto de recursos com outros modelos.

DeployedModelStatus

Define o estado observado do recurso DeployedModel.

Aparece em:

Campo Descrição
ready booleano Indica se o recurso está pronto.
primaryCondition Representa a condição principal de um recurso. Se o recurso estiver pronto, a condição indica que o recurso está pronto. Caso contrário, a condição é o motivo principal pelo qual o recurso não está pronto.
resourceConditions array Representa uma coleção de condições para um recurso e os respetivos sub-recursos. Pode usá-lo para determinar o estado geral de um recurso e dos respetivos sub-recursos.
conditions Matriz de condições Representa as condições de recursos não processados preenchidas a partir de recursos do Kubernetes para fins de depuração.
routes Trajetos Representa as rotas do contentor ou do sistema para a previsão do modelo implementado ou a verificação do estado de funcionamento.
ports Portas Representa as portas HTTP ou gRPC do contentor.
rpcStatus RpcStatus Indica uma representação RPC canónica da condição principal do modelo implementado.
observedGeneration número inteiro Indica a revisão do recurso que foi reconciliada mais recentemente.

Portas

Aparece em:

Campo Descrição
predictorPorts matriz de números inteiros Lista as portas HTTP a expor do preditor. Os pedidos não são encaminhados para portas que não sejam a primeira da lista. Este campo corresponde ao campo ports da API principal v1 de contentores do Kubernetes.
predictorGRPCPorts matriz de números inteiros Lista as portas gRPC a expor a partir do preditor. Se este campo for omitido, os pedidos gRPC para o contentor são desativados. Os pedidos não são encaminhados para portas que não sejam a primeira da lista. Este campo corresponde ao campo ports da API principal v1 de contentores do Kubernetes.

ReplicaStatus

Define as informações da réplica do recurso ResourcePool.

Aparece em:

Campo Descrição
resourceType ResourceType Especifica o tipo de recurso.
resourceName string Indica o nome de recurso exclusivo no espaço de nomes do tipo de recurso. Por exemplo, um Deployment ResourceType tem o nome da implementação do Kubernetes como nome do recurso.
resourceNamespace string Indica o espaço de nomes do recurso. Este campo não é aplicável a recursos com âmbito de cluster.
appType string Indica o tipo de aplicação do recurso, definido por um produto específico. Por exemplo, a previsão suporta predictor e explainer como appType.
availableReplicas número inteiro Indica o número total de réplicas disponíveis. Para o tipo de recurso de implementação do Kubernetes, este campo representa o número total de pods disponíveis, prontos durante, pelo menos, um mínimo de segundos, segmentados por esta implementação.
unavailableReplicas número inteiro Indica o número total de réplicas indisponíveis. Para o tipo de recurso de implementação do Kubernetes, representa o número total de pods indisponíveis segmentados pela implementação.

ResourcePool

Define o esquema para a API ResourcePools.

Aparece em:

Campo Descrição
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string ResourcePool
metadata ObjectMeta Consulte a documentação da API Kubernetes para os campos de metadata.
spec ResourcePoolSpec
status ResourcePoolStatus

ResourcePoolList

Contém uma lista de recursos ResourcePool.

Campo Descrição
apiVersion string prediction.aiplatform.gdc.goog/v1
kind string ResourcePoolList
metadata ListMeta Consulte a documentação da API Kubernetes para os campos de metadata.
items ResourcePool

ResourcePoolSpec

Define o estado esperado dos recursos ResourcePool.

Aparece em:

Campo Descrição
resourcePoolID string Representa o ID gerado pelo sistema do recurso ResourcePool. Este campo só é aplicável ao Google Cloud e ao GDCE. A etiqueta seguinte é 8.
userProvidedID string Representa o ID fornecido pelo utilizador do recurso ResourcePool. Este campo só é aplicável ao Google Cloud e ao GDCE.
dedicatedResources DedicatedResources Contém uma descrição dos recursos dedicados ao conjunto de recursos.
enableContainerLogging booleano Indica se o registo do contentor está ativado para o ResourcePool.
userGsa string Indica a conta de serviço do IAM fornecida pelo utilizador no projeto do utilizador. Se não for especificada, é usada a conta de serviço de publicação predefinida.
customKsaName string Especifica o nome personalizado que o operador cria e a carga de trabalho do utilizador usa apenas para casos de trazer a sua própria conta de serviço (BYOSA). Se estiver vazio, o sistema usa o padrão de nomenclatura predefinido.
rolloutStrategy tipo inválido Especifica se os modelos implementados neste conjunto têm de ser implementados nas réplicas do servidor de modelos gradualmente ou de uma só vez.

ResourcePoolStatus

Define o estado observado dos recursos ResourcePool.

Aparece em:

Campo Descrição
ready booleano Indica se o recurso está pronto.
primaryCondition Representa a condição principal de um recurso. Se o recurso estiver pronto, a condição indica que o recurso está pronto. Caso contrário, a condição é o motivo principal pelo qual o recurso não está pronto.
resourceConditions Representa uma coleção de condições para um recurso e os respetivos sub-recursos. Pode usá-lo para determinar o estado geral de um recurso e dos respetivos sub-recursos.
conditions Matriz de condições Representa as condições de recursos não processados preenchidas a partir de recursos do Kubernetes para fins de depuração.
replicaStatuses ReplicaStatus array
rpcStatus RpcStatus Indica uma representação RPC canónica da condição principal do ResourcePool.
observedGeneration número inteiro Indica que revisão do recurso foi reconciliada mais recentemente.

Trajetos

Aparece em:

Campo Descrição
predictRoute string Representa o caminho de encaminhamento no contentor para enviar pedidos de previsão. O Vertex AI encaminha pedidos através de projects.locations.endpoints.predict para este caminho no endereço IP e na porta do contentor. Em seguida, a Vertex AI devolve a resposta do contentor na resposta da API.
predictSystemRoute string Representa o caminho de encaminhamento do sistema para enviar pedidos de previsão para a entrada do cluster. Este campo é preenchido apenas internamente quando é copiado para o deployedModel durante a implementação.
healthRoute string Representa o caminho de encaminhamento no contentor para enviar verificações de funcionamento. O Vertex AI envia intermitentemente pedidos GET para este caminho no endereço IP e na porta do contentor para verificar se o contentor está em bom estado.
healthSystemRoute string Representa o caminho de encaminhamento do sistema para enviar pedidos de verificação de estado ao ponto de entrada do cluster. Este campo é preenchido apenas internamente quando é copiado para o deployedModel durante a implementação.

RpcStatus

Encapsula um código RPC e uma mensagem.

Aparece em:

Campo Descrição
code Código Representa o código RPC. A etiqueta seguinte é 4.
message string Contém uma descrição da condição visível para o utilizador.
terminalState booleano Indica um valor de true se o recurso tiver atingido um estado terminal e não puder ficar pronto.