KRM API prediction.aiplatform.gdc.goog/v1

prediction.aiplatform.gdc.goog/v1

Il pacchetto v1 contiene definizioni dello schema API per il gruppo di API v1 di prediction.aiplatform.gdc.goog.

Scalabilità automatica

Definisce i parametri di scalabilità automatica per un deployment.

Appare in:

Campo Descrizione
minReplica integer Numero minimo di repliche. Il valore predefinito è 1. Il tag successivo è 5.
maxReplica integer Numero massimo di repliche.
cpuTarget integer La soglia di utilizzo della CPU per lo scale up di un pod.
gpuDutyCycleTarget integer La soglia di utilizzo del ciclo di servizio della GPU per lo scale up di un pod.

DedicatedResources

Definisce le risorse dedicate a un pool di risorse. Il prossimo ID è 8.

Appare in:

Campo Descrizione
machineSpec Non obbligatorio. Specifica la configurazione di una singola macchina utilizzando il valore machineType. Se non viene fornito, viene utilizzato un valore predefinito. Per la previsione, il tipo di macchina predefinito per un deployment è n1-standard-2 (modelli basati su GKE) o n2-standard-2-gdc (modelli basati su CPU).
autoscaling Scalabilità automatica Specifica i parametri di scalabilità automatica per i carichi di lavoro degli utenti, ad esempio il deployment del predittore per la previsione.

DeployedModel

Definisce lo schema per l'API DeployedModels.

Appare in:

Campo Descrizione
apiVersion stringa prediction.aiplatform.gdc.goog/v1
kind stringa DeployedModel
metadata ObjectMeta Per i campi di metadata, consulta la documentazione dell'API Kubernetes.
spec DeployedModelSpec
status DeployedModelStatus

DeployedModelList

Contiene un elenco di risorse DeployedModel.

Campo Descrizione
apiVersion stringa prediction.aiplatform.gdc.goog/v1
kind stringa DeployedModelList
metadata ListMeta Per i campi di metadata, consulta la documentazione dell'API Kubernetes.
items Array DeployedModel

DeployedModelSpec

Definisce lo stato previsto delle risorse DeployedModel.

Appare in:

Campo Descrizione
endpointPath stringa Specifica il nome della risorsa dell'endpoint. Il formato è projects/{project}/locations/{location}/endpoints/{endpoint-id}. Il tag successivo è 6.
modelSpec tipo non valido Definisce la specifica del modello necessaria per il deployment.
resourcePoolRef ObjectReference Specifica il riferimento del pool di risorse con le specifiche delle risorse richieste per questo DeployedModel.
sharesResourcePool boolean Specifica se DeployedModel condivide un pool di risorse con altri modelli.

DeployedModelStatus

Definisce lo stato osservato della risorsa DeployedModel.

Appare in:

Campo Descrizione
ready boolean Indica se la risorsa è in stato pronto.
primaryCondition Rappresenta la condizione principale di una risorsa. Se la risorsa è pronta, la condizione indica che la risorsa è pronta. In caso contrario, la condizione è il motivo principale per cui la risorsa non è pronta.
resourceConditions array Rappresenta una raccolta di condizioni per una risorsa e le relative risorse secondarie. Puoi utilizzarlo per determinare lo stato generale di una risorsa e delle relative risorse secondarie.
conditions Array Condition Rappresenta le condizioni delle risorse non elaborate compilate dalle risorse Kubernetes a scopo di debug.
routes Route Rappresenta le route del container o del sistema per la previsione o il controllo di integrità del modello di cui è stato eseguito il deployment.
ports Porte Rappresenta le porte HTTP o gRPC del container.
rpcStatus RpcStatus Indica una rappresentazione RPC canonica della condizione principale del modello di cui è stato eseguito il deployment.
observedGeneration integer Indica la revisione della risorsa riconciliata più di recente.

Porte

Appare in:

Campo Descrizione
predictorPorts array di numeri interi Elenca le porte HTTP da esporre dal predittore. Le richieste non vengono inoltrate a porte diverse dalla prima elencata. Questo campo corrisponde al campo ports dell'API principale v1 di Kubernetes Containers.
predictorGRPCPorts array di numeri interi Elenca le porte gRPC da esporre dal predittore. Se questo campo viene omesso, le richieste gRPC al contenitore vengono disattivate. Le richieste non vengono inoltrate a porte diverse dalla prima elencata. Questo campo corrisponde al campo ports dell'API principale v1 di Kubernetes Containers.

ReplicaStatus

Definisce le informazioni sulla replica della risorsa ResourcePool.

Appare in:

Campo Descrizione
resourceType ResourceType Specifica il tipo di risorsa.
resourceName stringa Indica il nome univoco della risorsa nello spazio dei nomi del tipo di risorsa. Ad esempio, un Deployment ResourceType ha il nome del deployment Kubernetes come nome della risorsa.
resourceNamespace stringa Indica lo spazio dei nomi della risorsa. Questo campo non è applicabile alle risorse con ambito cluster.
appType stringa Indica il tipo di applicazione della risorsa, definito da un prodotto specifico. Ad esempio, Prediction supporta predictor e explainer come appType.
availableReplicas integer Indica il numero totale di repliche disponibili. Per il tipo di risorsa di deployment Kubernetes, questo campo rappresenta il numero totale di pod disponibili, pronti per almeno un numero minimo di secondi, a cui è destinato questo deployment.
unavailableReplicas integer Indica il numero totale di repliche non disponibili. Per il tipo di risorsa di deployment Kubernetes, rappresenta il numero totale di pod non disponibili a cui è destinato il deployment.

ResourcePool

Definisce lo schema per l'API ResourcePools.

Appare in:

Campo Descrizione
apiVersion stringa prediction.aiplatform.gdc.goog/v1
kind stringa ResourcePool
metadata ObjectMeta Per i campi di metadata, consulta la documentazione dell'API Kubernetes.
spec ResourcePoolSpec
status ResourcePoolStatus

ResourcePoolList

Contiene un elenco di risorse ResourcePool.

Campo Descrizione
apiVersion stringa prediction.aiplatform.gdc.goog/v1
kind stringa ResourcePoolList
metadata ListMeta Per i campi di metadata, consulta la documentazione dell'API Kubernetes.
items Array ResourcePool

ResourcePoolSpec

Definisce lo stato previsto delle risorse ResourcePool.

Appare in:

Campo Descrizione
resourcePoolID stringa Rappresenta l'ID generato dal sistema della risorsa ResourcePool. Questo campo è applicabile solo a Google Cloud e GDCE. Il tag successivo è 8.
userProvidedID stringa Rappresenta l'ID fornito dall'utente della risorsa ResourcePool. Questo campo è applicabile solo a Google Cloud e GDCE.
dedicatedResources DedicatedResources Contiene una descrizione delle risorse dedicate al pool di risorse.
enableContainerLogging boolean Indica se la registrazione dei container è abilitata per ResourcePool.
userGsa stringa Indica il account di servizio IAM fornito dall'utente nel progetto utente. Se non specificato, viene utilizzato il service account di servizio predefinito.
customKsaName stringa Specifica il nome personalizzato creato dall'operatore e utilizzato dal workload utente solo per i casi di Bring your own account di servizio (BYOSA). Se è vuoto, il sistema utilizza il pattern di denominazione predefinito.
rolloutStrategy tipo non valido Specifica se i modelli di cui è stato eseguito il deployment in questo pool devono essere implementati gradualmente o tutti contemporaneamente nelle repliche del server dei modelli.

ResourcePoolStatus

Definisce lo stato osservato delle risorse ResourcePool.

Appare in:

Campo Descrizione
ready boolean Indica se la risorsa è in stato pronto.
primaryCondition Rappresenta la condizione principale di una risorsa. Se la risorsa è pronta, la condizione indica che la risorsa è pronta. In caso contrario, la condizione è il motivo principale per cui la risorsa non è pronta.
resourceConditions Rappresenta una raccolta di condizioni per una risorsa e le relative risorse secondarie. Puoi utilizzarlo per determinare lo stato generale di una risorsa e delle relative risorse secondarie.
conditions Array Condition Rappresenta le condizioni delle risorse non elaborate compilate dalle risorse Kubernetes a scopo di debug.
replicaStatuses Array ReplicaStatus
rpcStatus RpcStatus Indica una rappresentazione RPC canonica della condizione principale di ResourcePool.
observedGeneration integer Indica l'ultima revisione della risorsa riconciliata.

Route

Appare in:

Campo Descrizione
predictRoute stringa Rappresenta il percorso di routing sul container per inviare le richieste di previsione. Vertex AI inoltra le richieste utilizzando projects.locations.endpoints.predict a questo percorso sull'indirizzo IP e sulla porta del container. Vertex AI restituisce quindi la risposta del contenitore nella risposta dell'API.
predictSystemRoute stringa Rappresenta il percorso di routing del sistema per inviare richieste di previsione all'ingresso del cluster. Questo campo viene compilato internamente solo quando viene copiato in deployedModel durante l'implementazione.
healthRoute stringa Rappresenta il percorso di routing sul container per inviare i controlli di integrità. Vertex AI invia a intermittenza richieste GET a questo percorso sull'indirizzo IP e sulla porta del container per verificare che il container sia integro.
healthSystemRoute stringa Rappresenta il percorso di routing del sistema per inviare richieste di controllo di integrità all'ingresso del cluster. Questo campo viene compilato internamente solo quando viene copiato in deployedModel durante l'implementazione.

RpcStatus

Contiene un codice RPC e un messaggio.

Appare in:

Campo Descrizione
code Codice Rappresenta il codice RPC. Il tag successivo è 4.
message stringa Contiene una descrizione della condizione rivolta all'utente.
terminalState boolean Indica un valore di true se la risorsa ha raggiunto uno stato terminale e non può diventare pronta.