prediction.aiplatform.gdc.goog/v1
Il pacchetto v1 contiene definizioni dello schema API per il gruppo di API v1 di prediction.aiplatform.gdc.goog.
Scalabilità automatica
Definisce i parametri di scalabilità automatica per un deployment.
Appare in:
Campo | Descrizione |
---|---|
minReplica integer |
Numero minimo di repliche. Il valore predefinito è 1 . Il tag successivo è 5 . |
maxReplica integer |
Numero massimo di repliche. |
cpuTarget integer |
La soglia di utilizzo della CPU per lo scale up di un pod. |
gpuDutyCycleTarget integer |
La soglia di utilizzo del ciclo di servizio della GPU per lo scale up di un pod. |
DedicatedResources
Definisce le risorse dedicate a un pool di risorse. Il prossimo ID è 8
.
Appare in:
Campo | Descrizione |
---|---|
machineSpec |
Non obbligatorio. Specifica la configurazione di una singola macchina utilizzando il valore machineType . Se non viene fornito, viene utilizzato un valore predefinito. Per la previsione, il tipo di macchina predefinito per un deployment è n1-standard-2 (modelli basati su GKE) o n2-standard-2-gdc (modelli basati su CPU). |
autoscaling Scalabilità automatica |
Specifica i parametri di scalabilità automatica per i carichi di lavoro degli utenti, ad esempio il deployment del predittore per la previsione. |
DeployedModel
Definisce lo schema per l'API DeployedModels
.
Appare in:
Campo | Descrizione |
---|---|
apiVersion stringa |
prediction.aiplatform.gdc.goog/v1 |
kind stringa |
DeployedModel |
metadata ObjectMeta |
Per i campi di metadata , consulta la documentazione dell'API Kubernetes. |
spec DeployedModelSpec |
|
status DeployedModelStatus |
DeployedModelList
Contiene un elenco di risorse DeployedModel
.
Campo | Descrizione |
---|---|
apiVersion stringa |
prediction.aiplatform.gdc.goog/v1 |
kind stringa |
DeployedModelList |
metadata ListMeta |
Per i campi di metadata , consulta la documentazione dell'API Kubernetes. |
items Array DeployedModel |
DeployedModelSpec
Definisce lo stato previsto delle risorse DeployedModel
.
Appare in:
Campo | Descrizione |
---|---|
endpointPath stringa |
Specifica il nome della risorsa dell'endpoint. Il formato è projects/{project}/locations/{location}/endpoints/{endpoint-id} . Il tag successivo è 6 . |
modelSpec tipo non valido |
Definisce la specifica del modello necessaria per il deployment. |
resourcePoolRef ObjectReference |
Specifica il riferimento del pool di risorse con le specifiche delle risorse richieste per questo DeployedModel . |
sharesResourcePool boolean |
Specifica se DeployedModel condivide un pool di risorse con altri modelli. |
DeployedModelStatus
Definisce lo stato osservato della risorsa DeployedModel
.
Appare in:
Campo | Descrizione |
---|---|
ready boolean |
Indica se la risorsa è in stato pronto. |
primaryCondition |
Rappresenta la condizione principale di una risorsa. Se la risorsa è pronta, la condizione indica che la risorsa è pronta. In caso contrario, la condizione è il motivo principale per cui la risorsa non è pronta. |
resourceConditions array |
Rappresenta una raccolta di condizioni per una risorsa e le relative risorse secondarie. Puoi utilizzarlo per determinare lo stato generale di una risorsa e delle relative risorse secondarie. |
conditions Array Condition |
Rappresenta le condizioni delle risorse non elaborate compilate dalle risorse Kubernetes a scopo di debug. |
routes Route |
Rappresenta le route del container o del sistema per la previsione o il controllo di integrità del modello di cui è stato eseguito il deployment. |
ports Porte |
Rappresenta le porte HTTP o gRPC del container. |
rpcStatus RpcStatus |
Indica una rappresentazione RPC canonica della condizione principale del modello di cui è stato eseguito il deployment. |
observedGeneration integer |
Indica la revisione della risorsa riconciliata più di recente. |
Porte
Appare in:
Campo | Descrizione |
---|---|
predictorPorts array di numeri interi |
Elenca le porte HTTP da esporre dal predittore. Le richieste non vengono inoltrate a porte diverse dalla prima elencata. Questo campo corrisponde al campo ports dell'API principale v1 di Kubernetes Containers. |
predictorGRPCPorts array di numeri interi |
Elenca le porte gRPC da esporre dal predittore. Se questo campo viene omesso, le richieste gRPC al contenitore vengono disattivate. Le richieste non vengono inoltrate a porte diverse dalla prima elencata. Questo campo corrisponde al campo ports dell'API principale v1 di Kubernetes Containers. |
ReplicaStatus
Definisce le informazioni sulla replica della risorsa ResourcePool
.
Appare in:
Campo | Descrizione |
---|---|
resourceType ResourceType |
Specifica il tipo di risorsa. |
resourceName stringa |
Indica il nome univoco della risorsa nello spazio dei nomi del tipo di risorsa. Ad esempio, un Deployment ResourceType ha il nome del deployment Kubernetes come nome della risorsa. |
resourceNamespace stringa |
Indica lo spazio dei nomi della risorsa. Questo campo non è applicabile alle risorse con ambito cluster. |
appType stringa |
Indica il tipo di applicazione della risorsa, definito da un prodotto specifico. Ad esempio, Prediction supporta predictor e explainer come appType . |
availableReplicas integer |
Indica il numero totale di repliche disponibili. Per il tipo di risorsa di deployment Kubernetes, questo campo rappresenta il numero totale di pod disponibili, pronti per almeno un numero minimo di secondi, a cui è destinato questo deployment. |
unavailableReplicas integer |
Indica il numero totale di repliche non disponibili. Per il tipo di risorsa di deployment Kubernetes, rappresenta il numero totale di pod non disponibili a cui è destinato il deployment. |
ResourcePool
Definisce lo schema per l'API ResourcePools
.
Appare in:
Campo | Descrizione |
---|---|
apiVersion stringa |
prediction.aiplatform.gdc.goog/v1 |
kind stringa |
ResourcePool |
metadata ObjectMeta |
Per i campi di metadata , consulta la documentazione dell'API Kubernetes. |
spec ResourcePoolSpec |
|
status ResourcePoolStatus |
ResourcePoolList
Contiene un elenco di risorse ResourcePool
.
Campo | Descrizione |
---|---|
apiVersion stringa |
prediction.aiplatform.gdc.goog/v1 |
kind stringa |
ResourcePoolList |
metadata ListMeta |
Per i campi di metadata , consulta la documentazione dell'API Kubernetes. |
items Array ResourcePool |
ResourcePoolSpec
Definisce lo stato previsto delle risorse ResourcePool
.
Appare in:
Campo | Descrizione |
---|---|
resourcePoolID stringa |
Rappresenta l'ID generato dal sistema della risorsa ResourcePool . Questo campo è applicabile solo a Google Cloud e GDCE. Il tag successivo è 8 . |
userProvidedID stringa |
Rappresenta l'ID fornito dall'utente della risorsa ResourcePool . Questo campo è applicabile solo a Google Cloud e GDCE. |
dedicatedResources DedicatedResources |
Contiene una descrizione delle risorse dedicate al pool di risorse. |
enableContainerLogging boolean |
Indica se la registrazione dei container è abilitata per ResourcePool . |
userGsa stringa |
Indica il account di servizio IAM fornito dall'utente nel progetto utente. Se non specificato, viene utilizzato il service account di servizio predefinito. |
customKsaName stringa |
Specifica il nome personalizzato creato dall'operatore e utilizzato dal workload utente solo per i casi di Bring your own account di servizio (BYOSA). Se è vuoto, il sistema utilizza il pattern di denominazione predefinito. |
rolloutStrategy tipo non valido |
Specifica se i modelli di cui è stato eseguito il deployment in questo pool devono essere implementati gradualmente o tutti contemporaneamente nelle repliche del server dei modelli. |
ResourcePoolStatus
Definisce lo stato osservato delle risorse ResourcePool
.
Appare in:
Campo | Descrizione |
---|---|
ready boolean |
Indica se la risorsa è in stato pronto. |
primaryCondition |
Rappresenta la condizione principale di una risorsa. Se la risorsa è pronta, la condizione indica che la risorsa è pronta. In caso contrario, la condizione è il motivo principale per cui la risorsa non è pronta. |
resourceConditions |
Rappresenta una raccolta di condizioni per una risorsa e le relative risorse secondarie. Puoi utilizzarlo per determinare lo stato generale di una risorsa e delle relative risorse secondarie. |
conditions Array Condition |
Rappresenta le condizioni delle risorse non elaborate compilate dalle risorse Kubernetes a scopo di debug. |
replicaStatuses Array ReplicaStatus |
|
rpcStatus RpcStatus |
Indica una rappresentazione RPC canonica della condizione principale di ResourcePool. |
observedGeneration integer |
Indica l'ultima revisione della risorsa riconciliata. |
Route
Appare in:
Campo | Descrizione |
---|---|
predictRoute stringa |
Rappresenta il percorso di routing sul container per inviare le richieste di previsione. Vertex AI inoltra le richieste utilizzando projects.locations.endpoints.predict a questo percorso sull'indirizzo IP e sulla porta del container. Vertex AI restituisce quindi la risposta del contenitore nella risposta dell'API. |
predictSystemRoute stringa |
Rappresenta il percorso di routing del sistema per inviare richieste di previsione all'ingresso del cluster. Questo campo viene compilato internamente solo quando viene copiato in deployedModel durante l'implementazione. |
healthRoute stringa |
Rappresenta il percorso di routing sul container per inviare i controlli di integrità. Vertex AI invia a intermittenza richieste GET a questo percorso sull'indirizzo IP e sulla porta del container per verificare che il container sia integro. |
healthSystemRoute stringa |
Rappresenta il percorso di routing del sistema per inviare richieste di controllo di integrità all'ingresso del cluster. Questo campo viene compilato internamente solo quando viene copiato in deployedModel durante l'implementazione. |
RpcStatus
Contiene un codice RPC e un messaggio.
Appare in:
Campo | Descrizione |
---|---|
code Codice |
Rappresenta il codice RPC. Il tag successivo è 4 . |
message stringa |
Contiene una descrizione della condizione rivolta all'utente. |
terminalState boolean |
Indica un valore di true se la risorsa ha raggiunto uno stato terminale e non può diventare pronta. |