prediction.aiplatform.gdc.goog/v1
O pacote v1 contém definições do esquema da API para o grupo de APIs prediction.aiplatform.gdc.goog v1.
Escala automática
Define os parâmetros de escalabilidade automática para uma implementação.
Aparece em:
Campo | Descrição |
---|---|
minReplica número inteiro |
Número mínimo de réplicas. O valor predefinido é 1 . A etiqueta seguinte é 5 . |
maxReplica número inteiro |
Número máximo de réplicas. |
cpuTarget número inteiro |
O limite de utilização da CPU para aumentar a escala de um pod. |
gpuDutyCycleTarget número inteiro |
O limite da utilização do ciclo de atividade da GPU para aumentar um pod. |
DedicatedResources
Define os recursos dedicados a um conjunto de recursos. O próximo ID é 8
.
Aparece em:
Campo | Descrição |
---|---|
machineSpec |
Não é obrigatório. Especifica a configuração de uma única máquina através do valor machineType . Se não for fornecido, é usado um valor predefinido. Para a previsão, o tipo de máquina predefinido para uma implementação é n1-standard-2 (modelos baseados no GKE) ou n2-standard-2-gdc (modelos baseados na CPU). |
autoscaling Ajuste de escala automático |
Especifica os parâmetros de dimensionamento automático para as cargas de trabalho do utilizador, por exemplo, a implementação do preditor para a previsão. |
DeployedModel
Define o esquema para a API DeployedModels
.
Aparece em:
Campo | Descrição |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
DeployedModel |
metadata ObjectMeta |
Consulte a documentação da API Kubernetes para os campos de metadata . |
spec DeployedModelSpec |
|
status DeployedModelStatus |
DeployedModelList
Contém uma lista de recursos DeployedModel
.
Campo | Descrição |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
DeployedModelList |
metadata ListMeta |
Consulte a documentação da API Kubernetes para os campos de metadata . |
items DeployedModel |
DeployedModelSpec
Define o estado esperado dos recursos DeployedModel
.
Aparece em:
Campo | Descrição |
---|---|
endpointPath string |
Especifica o nome do recurso do ponto final. O formato é projects/{project}/locations/{location}/endpoints/{endpoint-id} . A etiqueta seguinte é 6 . |
modelSpec tipo inválido |
Define a especificação do modelo necessária quando implementa o modelo. |
resourcePoolRef ObjectReference |
Especifica a referência do conjunto de recursos com as especificações de recursos necessárias para este DeployedModel . |
sharesResourcePool booleano |
Especifica se o DeployedModel partilha um conjunto de recursos com outros modelos. |
DeployedModelStatus
Define o estado observado do recurso DeployedModel
.
Aparece em:
Campo | Descrição |
---|---|
ready booleano |
Indica se o recurso está pronto. |
primaryCondition |
Representa a condição principal de um recurso. Se o recurso estiver pronto, a condição indica que o recurso está pronto. Caso contrário, a condição é o motivo principal pelo qual o recurso não está pronto. |
resourceConditions array |
Representa uma coleção de condições para um recurso e os respetivos sub-recursos. Pode usá-lo para determinar o estado geral de um recurso e dos respetivos sub-recursos. |
conditions Matriz de condições |
Representa as condições de recursos não processados preenchidas a partir de recursos do Kubernetes para fins de depuração. |
routes Trajetos |
Representa as rotas do contentor ou do sistema para a previsão do modelo implementado ou a verificação do estado de funcionamento. |
ports Portas |
Representa as portas HTTP ou gRPC do contentor. |
rpcStatus RpcStatus |
Indica uma representação RPC canónica da condição principal do modelo implementado. |
observedGeneration número inteiro |
Indica a revisão do recurso que foi reconciliada mais recentemente. |
Portas
Aparece em:
Campo | Descrição |
---|---|
predictorPorts matriz de números inteiros |
Lista as portas HTTP a expor do preditor. Os pedidos não são encaminhados para portas que não sejam a primeira da lista. Este campo corresponde ao campo ports da API principal v1 de contentores do Kubernetes. |
predictorGRPCPorts matriz de números inteiros |
Lista as portas gRPC a expor a partir do preditor. Se este campo for omitido, os pedidos gRPC para o contentor são desativados. Os pedidos não são encaminhados para portas que não sejam a primeira da lista. Este campo corresponde ao campo ports da API principal v1 de contentores do Kubernetes. |
ReplicaStatus
Define as informações da réplica do recurso ResourcePool
.
Aparece em:
Campo | Descrição |
---|---|
resourceType ResourceType |
Especifica o tipo de recurso. |
resourceName string |
Indica o nome de recurso exclusivo no espaço de nomes do tipo de recurso. Por exemplo, um Deployment ResourceType tem o nome da implementação do Kubernetes como nome do recurso. |
resourceNamespace string |
Indica o espaço de nomes do recurso. Este campo não é aplicável a recursos com âmbito de cluster. |
appType string |
Indica o tipo de aplicação do recurso, definido por um produto específico. Por exemplo, a previsão suporta predictor e explainer como appType . |
availableReplicas número inteiro |
Indica o número total de réplicas disponíveis. Para o tipo de recurso de implementação do Kubernetes, este campo representa o número total de pods disponíveis, prontos durante, pelo menos, um mínimo de segundos, segmentados por esta implementação. |
unavailableReplicas número inteiro |
Indica o número total de réplicas indisponíveis. Para o tipo de recurso de implementação do Kubernetes, representa o número total de pods indisponíveis segmentados pela implementação. |
ResourcePool
Define o esquema para a API ResourcePools
.
Aparece em:
Campo | Descrição |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
ResourcePool |
metadata ObjectMeta |
Consulte a documentação da API Kubernetes para os campos de metadata . |
spec ResourcePoolSpec |
|
status ResourcePoolStatus |
ResourcePoolList
Contém uma lista de recursos ResourcePool
.
Campo | Descrição |
---|---|
apiVersion string |
prediction.aiplatform.gdc.goog/v1 |
kind string |
ResourcePoolList |
metadata ListMeta |
Consulte a documentação da API Kubernetes para os campos de metadata . |
items ResourcePool |
ResourcePoolSpec
Define o estado esperado dos recursos ResourcePool
.
Aparece em:
Campo | Descrição |
---|---|
resourcePoolID string |
Representa o ID gerado pelo sistema do recurso ResourcePool . Este campo só é aplicável ao Google Cloud e ao GDCE. A etiqueta seguinte é 8 . |
userProvidedID string |
Representa o ID fornecido pelo utilizador do recurso ResourcePool . Este campo só é aplicável ao Google Cloud e ao GDCE. |
dedicatedResources DedicatedResources |
Contém uma descrição dos recursos dedicados ao conjunto de recursos. |
enableContainerLogging booleano |
Indica se o registo do contentor está ativado para o ResourcePool . |
userGsa string |
Indica a conta de serviço do IAM fornecida pelo utilizador no projeto do utilizador. Se não for especificada, é usada a conta de serviço de publicação predefinida. |
customKsaName string |
Especifica o nome personalizado que o operador cria e a carga de trabalho do utilizador usa apenas para casos de trazer a sua própria conta de serviço (BYOSA). Se estiver vazio, o sistema usa o padrão de nomenclatura predefinido. |
rolloutStrategy tipo inválido |
Especifica se os modelos implementados neste conjunto têm de ser implementados nas réplicas do servidor de modelos gradualmente ou de uma só vez. |
ResourcePoolStatus
Define o estado observado dos recursos ResourcePool
.
Aparece em:
Campo | Descrição |
---|---|
ready booleano |
Indica se o recurso está pronto. |
primaryCondition |
Representa a condição principal de um recurso. Se o recurso estiver pronto, a condição indica que o recurso está pronto. Caso contrário, a condição é o motivo principal pelo qual o recurso não está pronto. |
resourceConditions |
Representa uma coleção de condições para um recurso e os respetivos sub-recursos. Pode usá-lo para determinar o estado geral de um recurso e dos respetivos sub-recursos. |
conditions Matriz de condições |
Representa as condições de recursos não processados preenchidas a partir de recursos do Kubernetes para fins de depuração. |
replicaStatuses ReplicaStatus array |
|
rpcStatus RpcStatus |
Indica uma representação RPC canónica da condição principal do ResourcePool. |
observedGeneration número inteiro |
Indica que revisão do recurso foi reconciliada mais recentemente. |
Trajetos
Aparece em:
Campo | Descrição |
---|---|
predictRoute string |
Representa o caminho de encaminhamento no contentor para enviar pedidos de previsão. O Vertex AI encaminha pedidos através de projects.locations.endpoints.predict para este caminho no endereço IP e na porta do contentor. Em seguida, a Vertex AI devolve a resposta do contentor na resposta da API. |
predictSystemRoute string |
Representa o caminho de encaminhamento do sistema para enviar pedidos de previsão para a entrada do cluster. Este campo é preenchido apenas internamente quando é copiado para o deployedModel durante a implementação. |
healthRoute string |
Representa o caminho de encaminhamento no contentor para enviar verificações de funcionamento. O Vertex AI envia intermitentemente pedidos GET para este caminho no endereço IP e na porta do contentor para verificar se o contentor está em bom estado. |
healthSystemRoute string |
Representa o caminho de encaminhamento do sistema para enviar pedidos de verificação de estado ao ponto de entrada do cluster. Este campo é preenchido apenas internamente quando é copiado para o deployedModel durante a implementação. |
RpcStatus
Encapsula um código RPC e uma mensagem.
Aparece em:
Campo | Descrição |
---|---|
code Código |
Representa o código RPC. A etiqueta seguinte é 4 . |
message string |
Contém uma descrição da condição visível para o utilizador. |
terminalState booleano |
Indica um valor de true se o recurso tiver atingido um estado terminal e não puder ficar pronto. |